博客

Page 82

12 articles

上游数据质量是你 AI Agent 的真实瓶颈
生产环境中的大多数 AI Agent 故障并不是模型问题 —— 而是数据问题。本文将介绍如何诊断并修复那些即使进行再多提示词工程（Prompt Engineering）也无法解决的上游数据质量问题。
ai-agentsdata-quality
4月19日11 min
你的供应商模型卡没有告诉你的事
模型卡报告的是平均基准分数。它们遗漏了尾部行为、系统提示交互效果、文化盲点，以及那些悄悄破坏生产系统的静默回归。以下是各团队正在构建的替代方案。
insiderllm
4月19日11 min
规模化 Vibe 编程：当 AI 编写大部分代码库时如何管理技术债务
AI 生成的代码表面上合理，但隐藏着系统性缺陷，在第 12-18 个月会演变成危机级别的技术债务。以下是真正能预防这一问题的工程实践。
ai-engineeringtechnical-debt
4月19日10 min
Vibe Coding 的生产力瓶颈：为何 AI 带来的速度提升在三个月后开始回落
93% 的开发者在使用 AI 编程助手，但生产力的提升却停留在 10% 左右。本文探讨了这种复合失效模式——它如何将早期的速度优势转化为长期的拖累——以及预防这一现象的实践方法。
ai-engineeringproductivity
4月19日9 min
工作流引擎何时优于LLM智能体：确定性编排的决策框架
Gartner预测40%的智能体AI项目将在2027年前被取消。在默认选择自主LLM智能体之前，这里是一个选择确定性编排器的框架。
agent-architectureworkflow-orchestration
4月19日10 min
当处理方案不确定时如何对 AI 功能进行 A/B 测试
当你的处理方案是 LLM 时，标准 A/B 测试就会失效——输出因每次调用而异，模型更新在实验进行中途上线，而「成功」又难以被清晰量化。以下是使实验结果仍然可信的统计调整方法和实验模式。
experimentationllm
4月18日12 min
智能体协议碎片化：为 A2A、MCP 及未来设计
大多数团队在选择智能体协议时，实际上同时做了三个不同的决策。本文从实践角度解析 MCP、A2A 和 OpenAPI 如何解决智能体栈的不同层次问题，以及如何设计接口层以避免高代价的重构。
insiderai-agents
4月18日10 min
级联问题：为什么 Agent 副作用在大规模运行时会呈爆炸式增长
独立通过每一项单元测试的 Agent 在大规模部署时会导致级联副作用。本文将介绍其工程分类以及真正能防止这种情况的模式。
insiderai-engineering
4月18日15 min
智能体规范差距：为什么你的智能体忽略你写的内容
规范失效占生产环境中多智能体系统故障的 42%。本文将探讨为什么你写的内容与智能体理解的内容之间的差距比你想象的更大 —— 以及如何通过结构化规范格式来弥补这一差距。
insiderai-engineering
4月18日14 min
AI 作为 CI/CD 门禁：智能体可以和无法可靠拦截的内容
AI 智能体正越来越多地在 CI/CD 流水线中拦截合并，但它们能提供真实有效信号的场景却很有限。本指南介绍了信任模型、集成架构，以及如何避免构建一个既减慢发布速度又无法捕捉回归错误的“橡皮图章”。
AI EngineeringCI/CD
4月18日11 min
AI 编码智能体在遗留代码库上的实践：哪些有效，哪些会适得其反
AI 编码智能体在遗留代码库上会生成外观可信但语义错误的变更。本文系统梳理了哪些任务类型可以安全迁移、智能体在哪些地方会悄然破坏隐性契约，以及让智能体辅助重构变得可靠的「特征测试优先」模式。
ai-engineeringlegacy-systems
4月18日12 min
AI 编程代理在遗留代码库上的表现：为什么在你最需要它们的地方，它们往往会失败
AI 编程代理在绿地项目基准测试中表现卓越，但在处理遗留系统时，却常以微妙且难以发现的方式引发崩溃。本文将探讨其中的症结所在，并分享如何在成熟代码库中更安全地使用它们。
insiderai
4月18日12 min

较新的博文

较旧的博文

Page 82

上游数据质量是你 AI Agent 的真实瓶颈

你的供应商模型卡没有告诉你的事

规模化 Vibe 编程：当 AI 编写大部分代码库时如何管理技术债务

Vibe Coding 的生产力瓶颈：为何 AI 带来的速度提升在三个月后开始回落

工作流引擎何时优于LLM智能体：确定性编排的决策框架

当处理方案不确定时如何对 AI 功能进行 A/B 测试

智能体协议碎片化：为 A2A、MCP 及未来设计

级联问题：为什么 Agent 副作用在大规模运行时会呈爆炸式增长

智能体规范差距：为什么你的智能体忽略你写的内容

AI 作为 CI/CD 门禁：智能体可以和无法可靠拦截的内容

AI 编码智能体在遗留代码库上的实践：哪些有效，哪些会适得其反

AI 编程代理在遗留代码库上的表现：为什么在你最需要它们的地方，它们往往会失败

关于 Tian Pan