博客

Page 134

12 articles

需求鸿沟：当“正确”是一个分布时，如何为 AI 功能编写规格说明
标准的用户故事和验收标准在面对概率性 AI 输出时会失效。本文介绍了一种两层行为规范格式——将硬性策略约束与可协商的质量阈值区分开来，并解释了为什么预先定义这些内容可以将迭代周期缩短 3–5 倍。
ai-engineeringproduct
4月13日12 min
第二意见经济学：双模型验证何时真正值得
用第二个LLM来验证第一个看起来显而易见。但实际上，几乎没有团队能做好。这里是一个成本收益框架，告诉你何时值得这么做。
llmai-engineering
4月13日12 min
三时钟问题：为什么你的 AI 系统活在三条不同的时间线上
生产环境中的 AI 系统运行在三个不同步的时钟上——墙上时间、模型知识截止时间和 RAG 索引新鲜度——产生标准监控永远无法捕获的静默故障。
insiderai-engineering
4月13日10 min
温备问题：为何你的 AI 覆盖按钮不是安全网
随着 AI 代理吸收了原本由人类处理的任务，名义上负责的人类逐渐失去了在出错时接管的能力。以下是如何设计真正有效的升级路径。
insiderai-agents
4月13日11 min
将你的 LLM 提供商视为不可靠上游：AI 的分布式系统实战手册
LLM API 的故障方式与其他所有上游依赖截然不同——它们返回 200 OK 的同时却产出了幻觉垃圾。本文介绍如何针对生产环境 AI 的独特故障模式调整熔断器、超时、降级和舱壁模式。
insiderllm
4月13日12 min
智能体行为版本控制：为什么 Git 提交无法捕获真正的变化
Git 提交和语义版本控制无法捕获 AI 智能体行为的实际变化。了解行为快照、翻转中心门控和轨迹测试套件如何定义非确定性系统中'版本'的真正含义。
ai-agentsversioning
4月12日10 min
AI委托悖论：你无法评估自己不会做的工作
将编码工作委托给AI的工程师，恰恰失去了验证AI输出所需的技能。研究表明，使用AI工具的开发者实际上慢了19%，却认为自己快了20%——39个百分点的认知差距驱动着代码质量持续下降的危险反馈循环。
insiderai-engineering
4月12日10 min
AI 功能衰退：指标无法捕捉的缓慢腐化
AI 功能的退化并非源于模型变更，而是因为底层世界在悄然变化——用户行为在演进，知识在过时，评估套件在僵化，而仪表板依然一片绿色。以下是如何检测和预防这种在 90 天内席卷大多数 AI 功能的无声质量崩塌。
ai-engineeringmlops
4月12日10 min
AI 技能倒置：当初级工程师在错误的指标上超越资深工程师时
AI 编程助手让初级工程师在仪表板上看起来生产力提高了 6 倍，但同时也掩盖了架构腐化、衡量标准失真以及威胁到整个工程人才培养管道的导师制崩溃。
ai-engineeringdeveloper-productivity
4月12日10 min
AI 团队拓扑问题：为什么组织架构决定了 AI 能否上线
AI 工程师在组织架构中的位置是 ML 项目能否上线的最大预测因素——本文拆解集中式、嵌入式、平台式和联邦式团队模型的失败模式与成熟度演进路径。
ai-engineeringteam-topology
4月12日9 min
CLAUDE.md 作为代码库 API：为什么你的 Agent 指令文件是你写过的最具杠杆效应的文档
一个结构良好的 CLAUDE.md 作为可执行规范塑造着每一次 AI 辅助提交——但自动生成或臃肿的指令文件会主动降低 agent 的性能。了解指令预算约束、厨房水槽综合症和上下文腐化等反模式，以及让你的 agent 指令文件保持承重作用的渐进式披露架构。
insiderai-engineering
4月12日10 min
复合 AI 系统：为什么你的最佳架构需要三个模型，而不是一个
由分类器、生成器和验证器组成的生产 AI 系统，在准确率和成本方面始终优于单一前沿模型——只要协调开销保持在 40% 延迟阈值以下。
compound-aimodel-routing
4月12日12 min

较新的博文

较旧的博文

Page 134

需求鸿沟：当“正确”是一个分布时，如何为 AI 功能编写规格说明

第二意见经济学：双模型验证何时真正值得

三时钟问题：为什么你的 AI 系统活在三条不同的时间线上

温备问题：为何你的 AI 覆盖按钮不是安全网

将你的 LLM 提供商视为不可靠上游：AI 的分布式系统实战手册

智能体行为版本控制：为什么 Git 提交无法捕获真正的变化

AI委托悖论：你无法评估自己不会做的工作

AI 功能衰退：指标无法捕捉的缓慢腐化

AI 技能倒置：当初级工程师在错误的指标上超越资深工程师时

AI 团队拓扑问题：为什么组织架构决定了 AI 能否上线

CLAUDE.md 作为代码库 API：为什么你的 Agent 指令文件是你写过的最具杠杆效应的文档

复合 AI 系统：为什么你的最佳架构需要三个模型，而不是一个

关于 Tian Pan