当语音、视觉和 LLM 各自打开自己的根 span 时,多模态 Agent 就让 span 树支离破碎。修复办法是:一个轮次 ID、附着的工件,以及一个对接合层负责的所有者。
你的 token bucket 衡量的是用户点击;账单衡量的是模型调用。当一次点击扇出成三十次调用,HTTP 边界上的限流器就变成了一把纸糊的伞。
团队对外宣称的 AI 能力,是成员中最强那一位的水平;而真实的交付速度,是这群人的中位数水平。这道鸿沟是你路线图上定价最不充分的风险。
六个月前你的提示词前缀是 4k tokens,几乎可以摊销到免费。今天它是 11k tokens,你的缓存命中率是 31%,没有人能指出是哪个 PR 干的。
把一个有合并权限的 AI Agent 接入 CI,就在你的体系里创造了一种 SRE 手册从未命名过的新型操作主体。给它的动作分级、把不能无人值守的动作排进队列、为每次变更留下可追溯的归属,并定期演练它的紧急停机开关。
一个无人认领的工具可能永远赖在你的共享 agent 目录里,在 token、选择准确率和安全攻击面上对每一次推理课税。建一套能让你把它干净拔掉的弃用生命周期。
你的 AI 功能与用户之间有一份未公开的契约,它完全编码在系统 prompt 里。一小部分有耐心的用户会逆向破解它,其余的人则只能用到一个更糟糕的产品。与其藏着,不如把契约显式呈现出来。
把 agent 接入日志系统只是给了它访问权,不是理解力。真正的集成工作,是教它你的数据叫什么名字。
流式 UX 继承了一个工具调用并不遵守的可逆性契约。本文剖析为何停止按钮无法撤回已发送的邮件,以及修复这一问题所需的框架变更。
默认的自治策略悄悄把『撤销』变成一种愿望——以及在工具层、评测层和编排层需要落地的纪律,让 Agent 不再先动手后道歉。
新员工入职走的是按工龄递增的权限曲线;而他们配置的 Agent 在第三天就拿到了生产级别的权限。安全评审、工具注册表与计费桶之间那条没有归属的缝隙,正在变成下一轮事故的温床。
两个 AI 功能可以各自通过 A/B 测试,却仍然让产品变差。跨功能的注意力竞争是任何团队级仪表盘都看不到的组合问题。