博客

Page 149

12 articles

AI Agent 的单位经济效益：自主作业何时能真正省钱
你的 API 账单仅占生产环境中运行 AI Agent 真实成本的 10–20%。本文将深入解析隐藏的成本堆栈、完整的单次任务成本公式、实现正向 ROI 的业务量阈值，以及真正能预测自主作业是否省钱的关键指标。
ai-agentscost-optimization
4月9日12 min
当通用型 Agent 击败专家组：统一单 Agent 架构的优势
对于大多数生产环境中的 AI 任务，拥有丰富工具访问权限的单个强大 Agent 的表现优于多 Agent 流水线 —— 相关研究解释了为什么协同开销、错误放大和能力饱和使得专业化在规模化应用中成为一种负担。
agent-architecturemulti-agent
4月9日11 min
代理工程：构建你自己的软件宝可梦大军
一个人用自主 AI 代理替换了一个 15 人的工程团队。这里有经营 AI 原生软件公司背后的宝贵原则、惨痛教训和实用配置。
ai-agentsengineering
4月8日21 min
主体层级问题：多智能体系统中的授权
当智能体 A 创建智能体 B 时，应该应用谁的权限？深入探讨信任如何通过委派链传播，为什么混淆代理攻击在智能体规模下具有毁灭性，以及在生产环境的多智能体部署中防止权限提升的授权模式。
multi-agentsecurity
4月8日13 min
生产环境中的智能体授权：为什么你的 AI 智能体不应该是一个服务账号
给 AI 智能体分配服务账号凭证是发现你的系统漏洞的最快路径——一旦出错，你很快就会知道它们能触达哪些系统。本文探讨了环境授权（ambient authority）、过度授权和冒充令牌如何导致生产事故，以及四种可以正确限制智能体权限的模式。
securityagent-architecture
4月8日13 min
智能体规划模块：隐藏的架构缝隙
在 LLM 智能体中将任务拆解与执行分离，是大多数团队都会忽略的架构决策——直到他们的智能体在面对超过五个步骤的任务时开始崩溃。
insideragent-architecture
4月8日12 min
智能体间通信协议：让多智能体系统具备可调试性的接口契约
深入探讨设计糟糕的智能体间消息契约如何导致生产环境中的多智能体系统出现静默失败，并介绍能够预防这些问题的架构模式、错误信号和版本控制策略。
insidermulti-agent
4月8日13 min
生产环境中的 Agentic Coding：SWE-bench 分数没有告诉你的真相
SWE-bench Verified 的评分已达到 80% —— 然而同样的模型在更难的基准测试中仅获得 23% 的分数，一项受控研究发现 AI 工具反而让经验丰富的开发者效率降低了 19%。本文将探讨编程智能体在何处真正交付价值，以及它们在何处悄然失败。
insiderai-agents
4月8日14 min
LLM 应用的 CI/CD：为什么部署 Prompt 与部署代码完全不同
部署新的 Prompt 版本可能会以仪表盘无法察觉的方式悄然破坏生产环境。本文将介绍如何为 LLM 应用构建完善的 CI/CD 流水线 —— 从 Prompt 版本控制和阴影测试，到金丝雀发布和行为偏移检测。
insiderllm
4月8日12 min
上下文填充反模式：为什么更多的上下文反而会让 LLM 变差
将完整文档、原始工具输出和长聊天历史直接塞进 LLM 上下文窗口是一个可靠性陷阱。本文将介绍如何检测上下文何时在损害你的系统 — 以及如何通过具备预算意识的策展模式来修复它。
insiderllm
4月8日11 min
持续批处理：LLM 服务中提升 GPU 利用率的最关键技术
深入探讨迭代级调度如何取代静态批处理，在生产环境的 LLM 服务中实现 4–8 倍的 GPU 吞吐量提升，以及在高并发场景下出现的失效模式。
insiderllm-inference
4月8日14 min
你的数据库模式是 AI Agent 的心智模型
规范化程度较差的数据库模式会导致 AI Agent 产生 Join 幻觉、误读关系，并引发不必要的工具链式调用。本文将介绍如何设计一个 Agent 能够真正理解并推理的模式层。
insideragent-engineering
4月8日10 min

较新的博文

较旧的博文

Page 149

AI Agent 的单位经济效益：自主作业何时能真正省钱

当通用型 Agent 击败专家组：统一单 Agent 架构的优势

代理工程：构建你自己的软件宝可梦大军

主体层级问题：多智能体系统中的授权

生产环境中的智能体授权：为什么你的 AI 智能体不应该是一个服务账号

智能体规划模块：隐藏的架构缝隙

智能体间通信协议：让多智能体系统具备可调试性的接口契约

生产环境中的 Agentic Coding：SWE-bench 分数没有告诉你的真相

LLM 应用的 CI/CD：为什么部署 Prompt 与部署代码完全不同

上下文填充反模式：为什么更多的上下文反而会让 LLM 变差

持续批处理：LLM 服务中提升 GPU 利用率的最关键技术

你的数据库模式是 AI Agent 的心智模型

关于 Tian Pan