博客

Page 32

12 articles

拒绝“大声失败”的 Agent：过度补偿的回退机制如何掩盖生产环境的质量回退
生产环境中的 Agent 积累了大量的重试、回退和修复逻辑，这些逻辑会悄悄掩盖质量回退，直到流量评估指标发生偏移，而团队却无法追踪根本原因。
ai-reliabilityobservability
5月13日12 min
没人做的 AI 无障碍审计
流式 AI 界面通常无法适配屏幕阅读器和键盘用户。本文将介绍无障碍审计的流程、为什么它在 2026 年至关重要，以及只需半天即可交付的修复方案。
accessibilityai-engineering
5月13日12 min
没人写的 AI 功能下线指南
大多数 AI 功能下线仅停留在端点层面，却遗留了提示词（prompt）、评测员（judge）、回归集和故障记忆。这是一份按资产分类的指南，教你如何下线 AI 功能，避免在两个季度后出现孤立配置、幽灵评测运行以及丢失的组织知识。
ai-engineeringdeprecation
5月13日14 min
自研还是购买 AI 网关：锁定你未来 18 个月的关键决策
大多数团队在第一周凭直觉决定是对 AI 网关进行自研还是购买，然后在第九个月感到后悔。这是一个针对在 18 个月后依然至关重要的决策框架。
ai-gatewayllm-infrastructure
5月13日12 min
AI 网关：那个没人点名的单点故障 (SPOF)
位于 LLM 供应商前端的这一层薄抽象，已成为你发布的每一项 AI 功能的承重控制平面。本文探讨了为什么它的爆炸半径现在已经超过了任何供应商的中断风险，以及随之而来的 SRE 规范。
ai-gatewayllm-infrastructure
5月13日12 min
AI 赔偿缺口：当模型出错且没有人的合同能为你提供保障时
企业级 AI 产品处于一个三环责任链中，每一层都假设别人读过那些细则条款。本文将探讨赔偿缺口是如何形成的，为什么版权盾（Copyright Shield）并不涵盖幻觉问题，以及在第一起索赔发生前，应该通过何种约束机制来弥合这一缺口。
ai-contractsindemnification
5月13日12 min
“AI 让我这么做的”辩护：当代码审查悄然停止提出异议
Agent 编写的 PR 落地后的缺陷率高出 1.7 倍，而审查者往往会向模型那自信的措辞妥协。本文探讨了如何在事故率曲线飙升之前，通过结构性修复让高级工程师坚守合并路径。
code-reviewai-engineering
5月13日12 min
AI 功能的自带密钥 (BYOK)：没人预估过成本的销售驱动型架构重构
BYOK 看起来只是一个身份验证开关，但它同时改变了你的信任、成本和运营边界。以下是大多数团队低估了的架构工作。
insiderbyok
5月13日11 min
组合性税收：为什么增加工具会让你的规划器性能下降
你添加的每一个工具都会使规划器的准确率曲线向下弯曲。解决方案是引入一个退役指标 —— 频率 × 成功率 × 下游提升 —— 并设立单一的目录所有者。
insideragents
5月13日11 min
无故障停机情况下的面向客户 AI 质量退化复盘指南
状态页显示正常，错误率为零，但客户依然不满意。这是一份关于在没有发生系统崩溃时编写 AI 质量退化复盘报告的实战指南——涵盖了根因术语、严重程度分级以及闭环后续跟进的节奏。
insiderai-engineering
5月13日13 min
你的销售团队正在悄悄运行的演示账户评估集
销售演示账户是一个对业务至关重要但无人管理的评估集 —— 它们往往是模型迁移悄无声息地毁掉价值六位数潜在客户演示的原因。本文将介绍如何将它们转变为一等公民级别的发布门禁模式。
ai-engineeringevals
5月13日12 min
当市场部阅读你的评估案例时：跨职能可见性问题
你的评估集会被销售、市场、法务和客户成功部门查阅 —— 并且他们每个人从中提取的产物都与你的初衷不同。在客户从采购幻灯片中认出自己的投诉之前，请构建好“工程版”与“可共享版”的评估集隔离。
ai-engineeringevals
5月13日12 min

较新的博文

较旧的博文

Page 32

拒绝“大声失败”的 Agent：过度补偿的回退机制如何掩盖生产环境的质量回退

没人做的 AI 无障碍审计

没人写的 AI 功能下线指南

自研还是购买 AI 网关：锁定你未来 18 个月的关键决策

AI 网关：那个没人点名的单点故障 (SPOF)

AI 赔偿缺口：当模型出错且没有人的合同能为你提供保障时

“AI 让我这么做的”辩护：当代码审查悄然停止提出异议

AI 功能的自带密钥 (BYOK)：没人预估过成本的销售驱动型架构重构

组合性税收：为什么增加工具会让你的规划器性能下降

无故障停机情况下的面向客户 AI 质量退化复盘指南

你的销售团队正在悄悄运行的演示账户评估集

当市场部阅读你的评估案例时：跨职能可见性问题

关于 Tian Pan