AI 功能的沉默退出者：如何检测用户的无声不信任

2026年5月7日 · 阅读需 11 分钟

Software Engineer

麦当劳得来速 AI 的失败，并非因为用户抱怨。它失败，是因为用户停止使用得来速。三年来，这套系统一直记录着"健康"的接受率，而病毒式传播的视频却显示顾客在苦苦哀求它从订单中删除 260 块鸡块。当合作关系终止时，官方给出的理由是技术"尚未成熟"。真正的信号其实一直隐藏在客流量数据里——无人阅读，无人量化，无人汇报。

这就是大多数 AI 功能在生产环境中失败的样子。用户不会关闭你的功能。他们不会提交工单。他们不会留下一星评价。他们悄悄地绕开它，而你的仪表板依然一片绿色。

指标会说谎

标准 AI 功能仪表板追踪采纳率（功能已启用）、交互频率（API 调用、会话数）和显式反馈（点赞/点踩评分）。这些指标在检测无声信任流失方面几乎毫无用处。

原因如下。当用户接受一个 AI 建议并立即将其改得面目全非时，你的日志记录的是一次成功接受。当用户在收到一条他们不信任的 AI 回复后重启会话时，你的日志记录的是两次有效会话。当用户学会在"手动搜索"字段中输入，而不是使用你的 AI 搜索功能——因为 AI 六个月前就不好用了——两条路径的参与度数字都看起来正常。

真正重要的信号隐藏在你的埋点可能根本没有设计来捕获的数据中：AI 输出后的编辑距离、会话重启时机、按任务类型划分的覆盖率，以及那些专门作为你 AI 功能逃生口的路径的采纳率。

想想这个差距：对应用商店行为的研究发现，47.4% 的应用含有 AI 功能，但只有 11.9% 的用户评论明确提及 AI。用户在与他们有意识认知不到的 AI 交互——这意味着他们的不信任在没有被明确命名为反馈的情况下不断积累。产品指标显示参与度。行为模式则讲述了另一个故事。

无声放弃的真实样貌

无声放弃有其独特的指纹。挑战在于，在它变成留存问题之前就能认出它。

立即撤回信号。 当用户接受 AI 输出后立即撤销——在几秒内，不做任何额外修改——这是最清晰的不信任行为指标。这是"接受再撤回"率的数字等价物：点头表示同意，离开后却将一切抛到脑后。接受再撤回率高于基线，是一个领先指标，表明你的功能正在失败，即使接受率看起来很健康。

生成后的编辑距离。 用户在使用 AI 生成的内容之前，对其做了多少修改？这个指标比二元接受/拒绝更细腻，也更诚实。一个将 AI 生成邮件改了 80% 的用户，技术上接受了它，但实际上否定了它。将编辑距离作为分布（而非平均值）来追踪，可以揭示你的 AI 何时从一个加速工具变成了一种起步税。当中位编辑距离高且持续上升时，用户已经认识到 AI 输出每次都需要大量校正。

会话重启模式。 在对话型 AI 产品中，用户在收到回复后五分钟内重启对话线程，通常并不满意。他们要么用不同的表述再次尝试，要么已完全放弃这条线程。在特定任务类别中频繁重启，是这些领域未能达到用户期望的可靠代理指标。

绕行路径采纳。 大多数产品都有 AI 功能的手动替代方案——一个"改为搜索"的链接、一个"自己来写"的切换按钮、一个高级筛选 UI。如果这些路径以前很少被使用，现在却在增长，尤其是在最初采用了 AI 功能的用户中，这就是绕行路径采纳。用户没有流失；他们在用点击模式投票。

按任务类型划分的覆盖频率。 聚合覆盖率（用户点击"我自己来"而非接受 AI 推荐的频率）是一个粗糙的指标。按任务类型细分，可以揭示更有用的东西：通常有几个特定的任务类别，你的模型在这些类别中持续低于用户预期，而用户也已经学会了哪些类别属于此类情况。7% 的总体覆盖率，可能掩盖了某种任务类型高达 35% 的覆盖率——而后者才是真正的问题所在。

单次错误问题

AI 系统中的信任是不对称的。它需要许多次一致的成功才能建立，而一次明显的错误就可能将其大幅重置。

人机交互研究发现，即使只观察到一次错误，也会以相当大的效果量降低信任度、满意度和依赖意愿——如果这些数字出现在功能实验中，会令人震惊。用户在心里持有研究人员所说的"完美自动化图式"（perfect automation schema）——一种隐式期望，认为机器不会犯人类会犯的错误。当你的 AI 确实犯了类人错误（自信但错误，模式正确但上下文错误）时，用户不会逐渐更新自己的先验。他们会快速而彻底地更新它。

对产品团队的启示是：信任损失与错误频率并不成比例。一个准确率 95%、却在新用户面前犯了一次令人印象深刻的错误的模型，可能比一个准确率 80%、但从未犯过突出错误的模型，更彻底地失去那位用户的信任。这种不对称意味着，你的聚合质量指标可以保持高位，而一批用户却因为恰好在错误时机看到了错误的错误，正在悄悄放弃该功能。

信任恢复也比信任建立更慢。用户经历失败后，解释系统局限性可能有所帮助，但要让他们恢复到之前的信任水平，需要在失败发生的那个特定任务类型上持续展现可靠性。

为什么团队看不到这个问题

核心问题不在于团队缺乏数据。而在于他们拥有的数据是为捕捉不同信号而设计的。

加载中…

References:

Let's stay in touch and Follow me for more thoughts and updates

Twitter LinkedIn Telegram Discord 小红书

AI 功能的沉默退出者：如何检测用户的无声不信任

指标会说谎

无声放弃的真实样貌

单次错误问题

为什么团队看不到这个问题

Recommended Reading

关于 Tian Pan

指标会说谎​

无声放弃的真实样貌​

单次错误问题​

为什么团队看不到这个问题​

Recommended Reading

关于 Tian Pan

指标会说谎

无声放弃的真实样貌

单次错误问题

为什么团队看不到这个问题