AI 审计追踪是产品功能，而非合规勾选项

2026年4月20日 · 阅读需 10 分钟

Software Engineer

麦肯锡 2025 年的调查发现，75% 的业务负责人正以某种形式使用生成式 AI —— 但近一半的人已经遭遇过严重的负面后果。这种差距并非模型质量问题，而是信任问题。而缩小这一差距的最快路径不是更多的评估（evals）、更好的提示词（prompts）或新的前沿模型，而是向用户准确展示智能体（agent）做了什么。

大多数工程团队将审计追踪视为事后才考虑的事情 —— 就像你为了 GDPR 合规或 SOC 2 认证而临时接入的东西，然后将其锁在只有运维人员（ops）查看的内部仪表盘中。这是错误的做法。当用户能看到智能体调用了哪个工具、检索了哪些数据，以及哪条推理分支生成了答案时，会发生三件事：采用率上升，支持工单减少，并且模型错误能比任何后端警报提早数天显现。

信任差距与模型质量无关

当用户向 AI 智能体提交问题并得到错误答案时，他们很少知道 为什么 出错。是检索步骤出了问题？是模型对工具结果产生了幻觉？还是规划器选错了子智能体？从用户的角度来看，这是一个失败的黑盒。他们的理性反应是停止使用 —— 或者将每一个模棱两可的输出都上报给人工处理。

算法透明度的研究证实了这种动态。用户根据可用信息来校准信任。当信息为零时，信任默认会走向两个极端：盲目过度依赖（自动化偏见）或全面排斥。这两种结果都会损害产品指标。透明度 —— 特别是展示智能体的工作过程，而不仅仅是它的结论 —— 给用户提供了他们所需的信号来进行适当的校准。

这里有一个值得提及的细微差别。生硬的透明度可能会适得其反。在聊天界面中直接丢出一堆 JSON 日志或技术追踪树会让非技术用户感到不知所措，并传达出“这个系统很复杂且可能已损坏”的信号。设计上的挑战在于，如何在 合适的时机 向 合适的受众 展示 合适深度 的推理过程。下文将详细展开。

展示什么，以及何时展示

用户从可见性中获益的阶段有三个：智能体行动前、执行期间和完成后。

在智能体行动前，展示意图预览。对于任何具有重大副作用的操作 —— 发送邮件、更新记录、预约日历 —— 请展示智能体即将执行的操作、简短的理由以及编辑或取消的选项。这一单一模式消除了很大一类用户投诉：“智能体做了我没要求的事。” 事实证明，这些投诉大多不是因为智能体出错了，而是因为用户感到失去了控制。

在执行期间，轻量级的步骤指示器比沉默更有效。用户不需要看到每一个 token；他们需要看到进度正在推进，以及大致在进行什么样的工作。“正在搜索内部知识库... 找到 4 份相关文档... 正在生成回复...” 就足够了。它将延迟感从“出故障了”重新定义为“正在工作”。

完成后，详细的追踪变得很有价值 —— 但仅在用户请求时展示。默认视图应该是答案。一个可折叠的“我是如何得到这个结果的”披露项，展开后显示工具调用、检索来源、置信度信号和执行时间，这能为好奇或怀疑的用户提供所需信息，同时不会让其他人的界面变得凌乱。高级用户和支持工程师将常驻在该展开视图中；大多数用户只会看一眼，并因知道它的存在而更加信任系统。

支持工单中的信号

这是一个反直觉的生产实践发现：向用户公开智能体推理过程的团队，不仅能看到支持工单量下降，还能更早地发现模型错误。这两个结果是相关的。

当用户能看到智能体的推理过程时，他们可以自己识别故障模式。“它检索了错误的文档”是可操作的反馈，而“答案错了”则不是。用户能够精准标记的自我诊断错误，比通过后端异常检测发现的错误（通常基于聚合指标，有 24–48 小时的滞后）复现更快、修复也更快。

来自生产部署的具体数据证明了这一点。具有可见智能体追踪路径的 AI 辅助支持系统，其工单拦截率达到 50%，而黑盒系统仅为 23%。当智能体能够解释其诊断结果时， P1/P2 级别的故障解决时间会缩短 60%，因为环节中的人工可以立即验证或覆盖智能体的推理，而不是从头开始重新调查。首次联系解决率从 45% 提高到 80%。

这种机制并非魔法。透明的追踪路径让智能体的决策表面对所有人（用户、支持人员和产品工程师）都清晰可见。一个原本需要三天才能从聚合错误率中定位的 Bug，会被一名看到追踪路径并注意到查询步骤返回了过期结果的用户，在第一天就精准地报告出来。

如何构建追踪层 (Trace Layer)

对于工程团队来说，好消息是：逐步追踪的基础设施大部分已经内置在主要的 Agent 框架中了。目前的差距在于如何将其连接到面向用户的界面。

加载中…

References:

Let's stay in touch and Follow me for more thoughts and updates

Twitter LinkedIn Telegram Discord 小红书

AI 审计追踪是产品功能，而非合规勾选项

信任差距与模型质量无关

展示什么，以及何时展示

支持工单中的信号

如何构建追踪层 (Trace Layer)

Recommended Reading

关于 Tian Pan

信任差距与模型质量无关​

展示什么，以及何时展示​

支持工单中的信号​

如何构建追踪层 (Trace Layer)​

Recommended Reading

关于 Tian Pan

信任差距与模型质量无关

展示什么，以及何时展示

支持工单中的信号

如何构建追踪层 (Trace Layer)