你为应对故障而构建的降级路径几乎从不运行,因此它在寂静中腐烂,并在其本应应对的事故发生时才首次亮相。
94% 的通过率衡量的是你想象成功的能力,而非 Agent 是否真的有效。本文探讨黄金路径偏见如何渗入 Agent 评估套件,以及如何通过故障模式覆盖、生产案例收集和故障注入来解决这一问题。
当智能体的工具调用超时并重试时,如果没有幂等键,重试可能会导致再次扣费。了解如何让智能体重试变得安全无害,而非充满风险。
一个智能体删除了错误的记录,而事后剖析报告中却找不到原因。AI 智能体的可复现性并非技术栈自带的属性——它是你需要有意识地去捕获、进行版本控制并回放的东西。
只有当你能叫出每一个调用者的名字时,内部 API 才真正属于“内部”。一旦接入 LLM 智能体,那些从未白纸黑字写下的契约就会变成负担 —— 以下是你突然需要为之付出的公共 API 维护准则。
使用 LLM 裁判为模型输出评分,而裁判本身也是一个具有特定行为的模型。当它发生变化的那天,所有的历史分数都会变成“外币”——而大多数团队从未察觉到这一点。
在一个由一个模型评审另一个模型并反馈给下一次评估的闭环中,根本不存在地面真值(ground truth)——错误被“洗白”成了高分。这里介绍了该在何处重新引入人工。
模型弃用通知看起来只是一个单行配置更改,但你花费六个月调优的提示词是针对特定模型的特性而设计的,无法在切换后继续使用。应将模型生命周期终点视为一个带有可重复运行评估集的周期性迁移项目。
初级工程师每周都在积累上下文;而智能体则一无所获。为什么“新员工”这一比喻会分散你的注意力,以及你应该将学习重心放在何处。
智能体产品将危险操作锁定在审批对话框之后并称之为监管,但到了第 40 次提示时,人类会出于条件反射点击批准。为什么提示量才是真正的安全 Bug,以及如何修复它。
Prompt 缓存键是一个正确性边界,而非一个计费开关。如果你只为了提高命中率而设计它,就会引发跨租户上下文泄露和过时的个性化。
将 Prompt Injection 视为内容过滤问题是一场注定失败的军备竞赛。真正的漏洞在于“混淆代理”:即智能体利用借来的权限执行来自不可信渠道的指令。解决方案应当是限制其能力范围。