博客

Page 30

12 articles

原本运行良好的工具，直到两个智能体同时调用它
智能体工具通过了单调用者测试，但在第二个智能体出现的那天崩溃了。本文将探讨为什么并发漏洞在结构上对串行评估是不可见的，以及幂等性、锁定和负载测试如何修复这些问题。
insiderai-agents
5月16日11 min
在智能体交接处中断的分布式链路追踪
你的 Span 树在智能体相互调用之前一直非常清晰 —— 但就在 Bug 发生的地方，追踪突然中断了。本文将探讨为什么智能体交接会破坏链路上下文，以及如何确保上下文在交接中得以延续。
observabilityai-agents
5月16日12 min
当两个 Agent 共享一个工具：多 Agent 系统中的并发 Bug
启动第二个 Agent 会让你瞬间变成一名分布式系统工程师。竞态条件、更新丢失和脏读会以静默损坏的形式回归 —— 以及如何设计工具层来阻止它们。
multi-agentconcurrency
5月16日11 min
停止并非一种状态：为什么智能体需要类型化的终端原因协议
智能体仪表板通常会报告完成率，但一个因为放弃而停止的运行在表面上与成功的运行看起来完全一样。类型化的终端原因协议让智能体的结束方式成为一个一等的、可监控的信号。
insiderai-agents
5月16日11 min
你的智能体假设存在的“撤销”按钮
AI 智能体在规划时往往假设每个动作都是可以撤销的，这是在可逆的代码沙盒中养成的习惯。通过在工具中编码可逆性分级，确保“单向门”决策的安全性。
insiderai-agents
5月16日10 min
你的向量索引是一个没有失效策略的缓存
向量索引是你源数据的派生副本，这使得它成为了一个会过时的缓存：修改内容永不自动同步、已删除的文档留下“残影”、被撤销的权限导致泄露。为什么 RAG 的可靠性是一个缓存失效问题，而不是相似度搜索问题。
insiderrag
5月16日11 min
向量索引存在一个没人定义的陈旧度 SLO
每晚进行的重新索引任务是一个没人写下来的新鲜度承诺。本文介绍如何将向量索引延迟转化为可衡量的 SLO，向智能体和用户展示数据账龄，并根据衰减率而非习惯进行重新索引。
insiderrag
5月16日11 min
温池与冷真相：Serverless LLM 推理中隐藏的延迟底线
将 GPU 推理缩容至零会将稳定的资金成本转化为隐藏在 p99 尾部延迟中的尖峰延迟成本。本文将为你介绍盈亏平衡计算方法和缓解工具集。
insiderllm
5月16日10 min
当升级请求无人响应时：人机回环是一个人员配置问题
人机回环（Human-in-the-loop）的前提是有人响应升级请求。在生产环境中，这是一个包含到达率、服务时间和放弃率的队列——而无人响应的升级请求比没有升级请求更糟糕。
insiderai-agents
5月16日11 min
当廉价模型变得更昂贵时
将流量路由到较小的模型虽然降低了每 token 的成本，但可能会增加每个完成任务的成本。本文将分析节省的成本是如何流失的 —— 以及你如何在发布前进行衡量。
llmcost-optimization
5月16日11 min
当 Agent 出错时谁会被呼叫：针对非确定性系统的轮值制度
Agent 的故障难以复现、无法回滚，且在所有的基础设施仪表板上都显示正常。本文将教你如何针对无法单步调试的系统，重写运行手册、警报规则和轮值预期。
insiderai-agents
5月16日10 min
AI 功能的闲置成本该由谁承担
无论是否有流量，预置吞吐量、预留 GPU 以及热启动的向量索引都会产生费用。闲置成本之所以不断增长，是因为它处于产品、基础设施和财务之间的组织缝隙中 —— 本文将探讨如何让这一差距变得透明并明确归属。
finopsai-infrastructure
5月16日12 min

较新的博文

较旧的博文

Page 30

原本运行良好的工具，直到两个智能体同时调用它

在智能体交接处中断的分布式链路追踪

当两个 Agent 共享一个工具：多 Agent 系统中的并发 Bug

停止并非一种状态：为什么智能体需要类型化的终端原因协议

你的智能体假设存在的“撤销”按钮

你的向量索引是一个没有失效策略的缓存

向量索引存在一个没人定义的陈旧度 SLO

温池与冷真相：Serverless LLM 推理中隐藏的延迟底线

当升级请求无人响应时：人机回环是一个人员配置问题

当廉价模型变得更昂贵时

当 Agent 出错时谁会被呼叫：针对非确定性系统的轮值制度

AI 功能的闲置成本该由谁承担

关于 Tian Pan