博客

Page 70

12 articles

当处理方案不确定时如何对 AI 功能进行 A/B 测试
当你的处理方案是 LLM 时，标准 A/B 测试就会失效——输出因每次调用而异，模型更新在实验进行中途上线，而「成功」又难以被清晰量化。以下是使实验结果仍然可信的统计调整方法和实验模式。
experimentationllm
4月18日12 min
智能体协议碎片化：为 A2A、MCP 及未来设计
大多数团队在选择智能体协议时，实际上同时做了三个不同的决策。本文从实践角度解析 MCP、A2A 和 OpenAPI 如何解决智能体栈的不同层次问题，以及如何设计接口层以避免高代价的重构。
insiderai-agents
4月18日10 min
级联问题：为什么 Agent 副作用在大规模运行时会呈爆炸式增长
独立通过每一项单元测试的 Agent 在大规模部署时会导致级联副作用。本文将介绍其工程分类以及真正能防止这种情况的模式。
insiderai-engineering
4月18日15 min
智能体规范差距：为什么你的智能体忽略你写的内容
规范失效占生产环境中多智能体系统故障的 42%。本文将探讨为什么你写的内容与智能体理解的内容之间的差距比你想象的更大 —— 以及如何通过结构化规范格式来弥补这一差距。
insiderai-engineering
4月18日14 min
AI 作为 CI/CD 门禁：智能体可以和无法可靠拦截的内容
AI 智能体正越来越多地在 CI/CD 流水线中拦截合并，但它们能提供真实有效信号的场景却很有限。本指南介绍了信任模型、集成架构，以及如何避免构建一个既减慢发布速度又无法捕捉回归错误的“橡皮图章”。
AI EngineeringCI/CD
4月18日11 min
AI 编码智能体在遗留代码库上的实践：哪些有效，哪些会适得其反
AI 编码智能体在遗留代码库上会生成外观可信但语义错误的变更。本文系统梳理了哪些任务类型可以安全迁移、智能体在哪些地方会悄然破坏隐性契约，以及让智能体辅助重构变得可靠的「特征测试优先」模式。
ai-engineeringlegacy-systems
4月18日12 min
AI 编程代理在遗留代码库上的表现：为什么在你最需要它们的地方，它们往往会失败
AI 编程代理在绿地项目基准测试中表现卓越，但在处理遗留系统时，却常以微妙且难以发现的方式引发崩溃。本文将探讨其中的症结所在，并分享如何在成熟代码库中更安全地使用它们。
insiderai
4月18日12 min
生产环境中的 AI 内容溯源：C2PA、审计轨迹与工程师正在忽视的合规截止日期
C2PA 提供加密证明，记录谁在何时签署了 AI 生成内容。但它无法在你的 CDN 中存活，无法单独满足欧盟 AI 法案要求，也无法告诉你内容是否真实。以下是生产级内容溯源的真实面貌。
aiproduction
4月18日14 min
为什么用户会忽略你花了三个月构建的 AI 功能
AI 功能之所以失败，不是因为模型不好，而是因为用户从未发现它们、不信任它们，或者没有养成使用它们的习惯。以下是解决方法。
insiderai engineering
4月18日12 min
当你的 AI 功能过时：生产环境中的知识切断与时间溯源
基于具有固定训练切断点模型构建的产品，会随着世界与训练数据的偏离而失效。本文将介绍如何检测由知识切断引起的故障、管理 RAG 的新鲜度，并在时间漂移演变为隐蔽的生产回归之前进行针对性设计。
insiderai-engineering
4月18日12 min
AI功能维护悬崖：为何你的AI功能老化速度超乎想象
AI功能不只是退化——它们是无声地退化。提示词漂移、模型更新和分布偏移共同侵蚀生产环境中的AI质量，而监控面板全程保持绿色。
llmproduction
4月18日10 min
AI 功能下线指南：如何停用那些用户几乎不用的功能
大多数工程团队都知道如何发布 AI 功能，但几乎没有人有下线它们的计划。本文将为你提供一份指南，告诉你何时该放弃，以及如何在不伤害用户或积累合规债务的情况下完成下线。
aiproduct
4月18日13 min

较新的博文

较旧的博文

Page 70

当处理方案不确定时如何对 AI 功能进行 A/B 测试

智能体协议碎片化：为 A2A、MCP 及未来设计

级联问题：为什么 Agent 副作用在大规模运行时会呈爆炸式增长

智能体规范差距：为什么你的智能体忽略你写的内容

AI 作为 CI/CD 门禁：智能体可以和无法可靠拦截的内容

AI 编码智能体在遗留代码库上的实践：哪些有效，哪些会适得其反

AI 编程代理在遗留代码库上的表现：为什么在你最需要它们的地方，它们往往会失败

生产环境中的 AI 内容溯源：C2PA、审计轨迹与工程师正在忽视的合规截止日期

为什么用户会忽略你花了三个月构建的 AI 功能

当你的 AI 功能过时：生产环境中的知识切断与时间溯源

AI功能维护悬崖：为何你的AI功能老化速度超乎想象

AI 功能下线指南：如何停用那些用户几乎不用的功能

关于 Tian Pan