博客

Page 121

12 articles

生产环境中的零样本与少样本：示例何时有用，何时有害
关于何时使用零样本与少样本提示的实证分析——以及为什么大规模静态示例往往适得其反。
llmprompting
4月16日11 min
Agent 集群可观测性：在千并发 Agent 运行中监控而不陷入仪表盘盲区
单个 agent 运行的 span 树在集群规模下会失效。以下是在运行数百个并发 agent 时真正有效的集群级信号、采样策略和行为指纹技术。
insiderobservability
4月15日13 min
Agent 身份与最小权限授权：你的 AI 团队正在忽视的安全隐患
当你的 AI Agent 调用内部 API 时，它呈现的是谁的身份？大多数团队给 Agent 一个宽泛的服务账户令牌就了事了。本文解释为什么这是一个安全隐患，以及生产级 Agent 授权实际上应该是什么样子。
securityai-agents
4月15日11 min
智能体加载状态难题：为 45 秒的 UX 深渊进行设计
用户在 10 秒后就会放弃沉默的 UI，但现代智能体运行时间通常在 30 到 120 秒之间。这个差距是一个设计空间，目前大多数团队仍在使用加载动画来填充 —— 本文将介绍你应该构建的替代方案。
ai-agentsux
4月15日12 min
你的智能体追踪在撒谎：LLM 智能体的基数、采样与 Span 层级结构
分布式追踪最初是为每个请求约 10 个 Span 设计的。而单个智能体运行可能会产生数百个 Span，默认的 OpenTelemetry 配置会系统性地漏记工作负载。本文将介绍能够经受住生产环境智能体工作负载考验的 Span 层级、尾部采样策略以及 Payload 处理方式。
insiderobservability
4月15日13 min
智能体任务复杂度估算：执行前先规划 Token 预算
LLM 智能体在不知道任务有多深之前就开始提交资源。本文介绍复杂度估算层——分层路由、预算追踪器注入、计划模板缓存和基于 DAG 的分解——它们能防止不可逆的早期错误，使智能体成本可预测。
insideragent-architecture
4月15日12 min
当你的 AI Agent 从 Kafka 消费数据时：那些失效的设计假设
在消息队列上运行 AI Agent 会打破队列语义中固有的假设。本文将探讨当消费者具有随机性时，幂等性、顺序性和背压机制如何发生变化。
insiderai-agents
4月15日14 min
AI 辅助故障响应：LLM 如何在不取代 SRE 手册的情况下改变它
值班工作流中的 AI 副驾驶可以浮现关联信号、起草运行手册操作——但它们引入了传统 SRE 没有受过训练去识别的故障模式。这是一份将 LLM 整合进故障响应而不让故障更难处理的实践指南。
sreincident-response
4月15日12 min
AI 能力棘轮：一个聪明功能如何拖垮整个产品
上线一个令人印象深刻的 AI 功能，会永久性地拉高用户对产品中每一个其他功能的预期——包括那些你根本没有动过的功能。本文解析其背后机制、真实案例，以及如何在支持队列被淹没前管理好这笔预期债务。
ai-productproduct-strategy
4月15日11 min
AI 依赖足迹：每个功能都在增加新的基础设施所有者
你上线的每一个 AI 功能都会引入新的基础设施依赖——向量数据库、嵌入模型、评估框架、GPU 推理层。问题不在于依赖本身，而在于没有人真正拥有它们。
ai engineeringinfrastructure
4月15日10 min
AI 功能退役取证：被废弃的功能教给我们的经验，是成功功能无法企及的
你的公司悄悄关停的 AI 功能中，隐藏着你下一次发布时会遇到的失败模式。本文提供了一个取证模板、先行指标目录，以及如何解读被废弃功能留下的证据。
insiderai-engineering
4月15日13 min
AI 事故严重程度分类法：幻觉何时算作 Sev-0？
传统的严重程度分类法在概率性 AI 系统中失效了。这是一个用于分类 AI 事故的多维框架——超越了二进制的“故障/正常”，旨在捕捉故障范围、可逆性以及复合型损害。
insiderai-engineering
4月15日13 min

较新的博文

较旧的博文

Page 121

生产环境中的零样本与少样本：示例何时有用，何时有害

Agent 集群可观测性：在千并发 Agent 运行中监控而不陷入仪表盘盲区

Agent 身份与最小权限授权：你的 AI 团队正在忽视的安全隐患

智能体加载状态难题：为 45 秒的 UX 深渊进行设计

你的智能体追踪在撒谎：LLM 智能体的基数、采样与 Span 层级结构

智能体任务复杂度估算：执行前先规划 Token 预算

当你的 AI Agent 从 Kafka 消费数据时：那些失效的设计假设

AI 辅助故障响应：LLM 如何在不取代 SRE 手册的情况下改变它

AI 能力棘轮：一个聪明功能如何拖垮整个产品

AI 依赖足迹：每个功能都在增加新的基础设施所有者

AI 功能退役取证：被废弃的功能教给我们的经验，是成功功能无法企及的

AI 事故严重程度分类法：幻觉何时算作 Sev-0？

关于 Tian Pan