大多数智能体堆栈按姓名而不是按角色呼叫真人 —— 一旦有人休 PTO,智能体就会和自动回复对打,直到值班同事注意到。
你的网关检查‘是谁’。你的端点检查‘是什么’。但在你的智能体栈中,没有任何环节在检查模型最初是否被允许发起该调用。
共享的工具注册表正悄无声息地将所有能力赋予每个智能体。只有基于单个智能体的白名单,而非工具目录本身,才是真正约束智能体行为的授权单元。
编程 Agent 会重新引入你昨天删除的代码,因为已删除的内容在仓库中没有留痕。这是一份记录 Agent 需要遵守的“否定决策”的实战指南。
随着一个又一个合理需求的加入,一个夜间批处理作业最终演变成了对延迟要求极高的服务。本文将探讨为什么批量推理和在线推理的优化目标截然相反,架构漂移如何导致隐蔽的故障,以及如何有针对性地进行重新架构。
AI 智能体在每一轮对话中都在重新推导相同的事实——流失风险、账户账龄、订阅层级——没有缓存,没有共享定义,也没有时间点正确性。为什么这会让它们变成一个破碎的特征流水线,以及如何修复它。
当你的应用遇到 429 错误时,随后运行的重试代码便悄然成为了你的容量策略。应将速率限制处理视为有意识的负载脱落——包含优先级层级、抖动和调度器——而非无人审核的库默认设置。
运行失败的智能体很便宜;而运行成功的智能体成本可能高出 50 倍。本文将探讨为什么提高你的智能体成功率会压缩利润空间,以及解决这一问题的关键杠杆。
一个 `await agent.run()` 看起来像是一个本地函数,但实际上隐藏了一个远程的、可能部分失效的分布式系统。本文将探讨 Agent 代码所需的超时、重试、幂等性和熔断机制。
AI 智能体在做出决定后会立即行动,完全不考虑凌晨 3 点是否是不合适的发送时间。本文探讨如何将全天候工作与日间工作区分开来,并构建一个能够识别等待时机的定时层。
智能体记忆是一个生产环境数据库,每当你改进其格式时,它都会发生偏移。在旧记忆悄然失效之前,请对记录进行版本控制,编写真实的迁移脚本,并完成回填。
重现一个 LLM bug 时看到它通过了,并不意味着 bug 消失了 —— 而是意味着你抽取到了不同的样本。当你的工具假设一切都是确定性的,该如何调试一个采样器。