AI 功能的沉默退出者:如何检测用户的无声不信任
麦当劳得来速 AI 的失败,并非因为用户抱怨。它失败,是因为用户停止使用得来速。三年来,这套系统一直记录着"健康"的接受率,而病毒式传播的视频却显示顾客在苦苦哀求它从订单中删除 260 块鸡块。当合作关系终止时,官方给出的理由是技术"尚未成熟"。真正的信号其实一直隐藏在客流量数据里——无人阅读,无人量化,无人汇报。
这就是大多数 AI 功能在生产环境中失败的样子。用户不会关闭你的功能。他们不会提交工单。他们不会留下一星评价。他们悄悄地绕开它,而你的仪表板依然一片绿色。
指标会说谎
标准 AI 功能仪表板追踪采纳率(功能已启用)、交互频率(API 调用、会话数)和显式反馈(点赞/点踩评分)。这些指标在检测无声信任流失方面几乎毫无用处。
原因如下。当用户接受一个 AI 建议并立即将其改得面目全非时, 你的日志记录的是一次成功接受。当用户在收到一条他们不信任的 AI 回复后重启会话时,你的日志记录的是两次有效会话。当用户学会在"手动搜索"字段中输入,而不是使用你的 AI 搜索功能——因为 AI 六个月前就不好用了——两条路径的参与度数字都看起来正常。
真正重要的信号隐藏在你的埋点可能根本没有设计来捕获的数据中:AI 输出后的编辑距离、会话重启时机、按任务类型划分的覆盖率,以及那些专门作为你 AI 功能逃生口的路径的采纳率。
想想这个差距:对应用商店行为的研究发现,47.4% 的应用含有 AI 功能,但只有 11.9% 的用户评论明确提及 AI。用户在与他们有意识认知不到的 AI 交互——这意味着他们的不信任在没有被明确命名为反馈的情况下不断积累。产品指标显示参与度。行为模式则讲述了另一个故事。
无声放弃的真实样貌
无声放弃有其独特的指纹。挑战在于,在它变成留存问题之前就能认出它。
立即撤回信号。 当用户接受 AI 输出后立即撤销——在几秒内,不做任何额外修改——这是最清晰的不信任行为指标。这是"接受再撤回"率的数字等价物:点头表示同意,离开后却将一切抛到脑后。接受再撤回率高于基线,是一个领先指标,表明你的功能正在失败,即使接受率看起来很健康。
生成后的编辑距离。 用户在使用 AI 生成的内容之前,对其做了多少修改?这个指标比二元接受/拒绝更细腻,也更诚实。一个将 AI 生成邮件改了 80% 的用户, 技术上接受了它,但实际上否定了它。将编辑距离作为分布(而非平均值)来追踪,可以揭示你的 AI 何时从一个加速工具变成了一种起步税。当中位编辑距离高且持续上升时,用户已经认识到 AI 输出每次都需要大量校正。
会话重启模式。 在对话型 AI 产品中,用户在收到回复后五分钟内重启对话线程,通常并不满意。他们要么用不同的表述再次尝试,要么已完全放弃这条线程。在特定任务类别中频繁重启,是这些领域未能达到用户期望的可靠代理指标。
绕行路径采纳。 大多数产品都有 AI 功能的手动替代方案——一个"改为搜索"的链接、一个"自己来写"的切换按钮、一个高级筛选 UI。如果这些路径以前很少被使用,现在却在增长,尤其是在最初采用了 AI 功能的用户中,这就是绕行路径采纳。用户没有流失;他们在用点击模式投票。
按任务类型划分的覆盖频率。 聚合覆盖率(用户点击"我自己来"而非接受 AI 推荐的频率)是一个粗糙的指标。按任务类型细分,可以揭示更有用的东西:通常有几个特定的任务类别,你的模型在这些类别中持续低于用户预期,而用户也已经学会了哪些类别属于此类情况。7% 的总体覆盖率,可能掩盖了某种任务类型高达 35% 的覆盖率——而后者才是真正的问题所在。
单次错误问题
AI 系统中的信任是不对称的。它需要许多次一致的成功才能建立,而一次明显的错误就可能将其大幅重置。
人机交互研究发现,即使只观察到一次错误,也会以 相当大的效果量降低信任度、满意度和依赖意愿——如果这些数字出现在功能实验中,会令人震惊。用户在心里持有研究人员所说的"完美自动化图式"(perfect automation schema)——一种隐式期望,认为机器不会犯人类会犯的错误。当你的 AI 确实犯了类人错误(自信但错误,模式正确但上下文错误)时,用户不会逐渐更新自己的先验。他们会快速而彻底地更新它。
对产品团队的启示是:信任损失与错误频率并不成比例。一个准确率 95%、却在新用户面前犯了一次令人印象深刻的错误的模型,可能比一个准确率 80%、但从未犯过突出错误的模型,更彻底地失去那位用户的信任。这种不对称意味着,你的聚合质量指标可以保持高位,而一批用户却因为恰好在错误时机看到了错误的错误,正在悄悄放弃该功能。
信任恢复也比信任建立更慢。用户经历失败后,解释系统局限性可能有所帮助,但要让他们恢复到之前的信任水平,需要在失败发生的那个特定任务类型上持续展现可靠性。
为什么团队看不到这个问题
核心问题不在于团队缺乏数据。而在于他们拥有的数据是为捕捉不同信号而设计的。
- https://www.nature.com/articles/s41599-024-04044-8
- https://pmc.ncbi.nlm.nih.gov/articles/PMC12561693/
- https://arxiv.org/html/2601.00579v1
- https://arxiv.org/html/2412.17321v1
- https://a16z.com/ai-retention-benchmarks/
- https://dev.to/mosiddi/stop-begging-for-feedback-why-silent-signals-are-the-future-of-ai-learning-40jp
- https://www.nebuly.com/blog/user-intent-and-implicit-feedback-in-conversational-ai-a-complete-guide
- https://www.walkme.com/blog/ai-workflow-fragmentation/
- https://linearb.io/blog/measuring-the-impact-of-copilot-and-cursor-on-engineering-productivity
- https://www.tandfonline.com/doi/full/10.1080/10447318.2023.2301250
- https://link.springer.com/article/10.1007/s00146-025-02422-7
- https://pubsonline.informs.org/doi/10.1287/mnsc.2016.2643
- https://www.langchain.com/articles/ai-observability
- https://pair.withgoogle.com/guidebook/patterns
- https://www.globenowswire.com/news-release/2026/05/06/3288886/0/en/AI-drives-customer-loyalty-but-doubles-abandonment-when-digital-experiences-fail.html
