博客

Page 21

12 articles

多模态追踪：当各种模态必须共享一个 ID
当语音、视觉和 LLM 各自打开自己的根 span 时，多模态 Agent 就让 span 树支离破碎。修复办法是：一个轮次 ID、附着的工件，以及一个对接合层负责的所有者。
insiderobservability
5月22日12 min
一路重试穿过你限流器的 agent
你的 token bucket 衡量的是用户点击;账单衡量的是模型调用。当一次点击扇出成三十次调用,HTTP 边界上的限流器就变成了一把纸糊的伞。
insideragents
5月22日11 min
团队内部的 AI 素养鸿沟，才是你路线图上最大的交付风险
团队对外宣称的 AI 能力，是成员中最强那一位的水平；而真实的交付速度，是这群人的中位数水平。这道鸿沟是你路线图上定价最不充分的风险。
ai-engineeringteam-capability
5月22日12 min
长出胳膊和腿的缓存提示词前缀
六个月前你的提示词前缀是 4k tokens,几乎可以摊销到免费。今天它是 11k tokens,你的缓存命中率是 31%,没有人能指出是哪个 PR 干的。
insiderllm
5月22日11 min
凌晨 3 点拥有合并权限的 CI Agent
把一个有合并权限的 AI Agent 接入 CI,就在你的体系里创造了一种 SRE 手册从未命名过的新型操作主体。给它的动作分级、把不能无人值守的动作排进队列、为每次变更留下可追溯的归属,并定期演练它的紧急停机开关。
ai-engineeringci-cd
5月22日13 min
那个谁也不敢从注册表里删掉的死工具
一个无人认领的工具可能永远赖在你的共享 agent 目录里,在 token、选择准确率和安全攻击面上对每一次推理课税。建一套能让你把它干净拔掉的弃用生命周期。
agent-toolingtool-registry
5月22日12 min
那位通过反复试验摸清你 Prompt 的高级用户
你的 AI 功能与用户之间有一份未公开的契约,它完全编码在系统 prompt 里。一小部分有耐心的用户会逆向破解它,其余的人则只能用到一个更糟糕的产品。与其藏着,不如把契约显式呈现出来。
ai-productux
5月22日10 min
你的 Agent 读不懂的生产日志
把 agent 接入日志系统只是给了它访问权,不是理解力。真正的集成工作,是教它你的数据叫什么名字。
ai-agentsobservability
5月22日10 min
在用户说"是"之前就已提交的流式响应
流式 UX 继承了一个工具调用并不遵守的可逆性契约。本文剖析为何停止按钮无法撤回已发送的邮件,以及修复这一问题所需的框架变更。
insiderai-engineering
5月22日11 min
当 Agent 选择事后道歉而非事前请示
默认的自治策略悄悄把『撤销』变成一种愿望——以及在工具层、评测层和编排层需要落地的纪律,让 Agent 不再先动手后道歉。
ai-agentsautonomy
5月22日11 min
当实习生在入职第一天部署 Agent
新员工入职走的是按工龄递增的权限曲线；而他们配置的 Agent 在第三天就拿到了生产级别的权限。安全评审、工具注册表与计费桶之间那条没有归属的缝隙，正在变成下一轮事故的温床。
ai-agentsiam
5月22日10 min
当两个 AI 功能争夺同一次点击
两个 AI 功能可以各自通过 A/B 测试,却仍然让产品变差。跨功能的注意力竞争是任何团队级仪表盘都看不到的组合问题。
ai-productengineering-leadership
5月22日9 min

较新的博文

较旧的博文

Page 21

多模态追踪：当各种模态必须共享一个 ID

一路重试穿过你限流器的 agent

团队内部的 AI 素养鸿沟，才是你路线图上最大的交付风险

长出胳膊和腿的缓存提示词前缀

凌晨 3 点拥有合并权限的 CI Agent

那个谁也不敢从注册表里删掉的死工具

那位通过反复试验摸清你 Prompt 的高级用户

你的 Agent 读不懂的生产日志

在用户说"是"之前就已提交的流式响应

当 Agent 选择事后道歉而非事前请示

当实习生在入职第一天部署 Agent

当两个 AI 功能争夺同一次点击

关于 Tian Pan