那个因为你的智能体表现得过于自信而流失的客户
用户向智能体问了一个常规问题。智能体用一种胸有成竹的语调回答了。用户信任了这个答案,采取了行动,结果整个下午都在撤回一封基于错误信息发送给客户的邮件。六周后,续约谈判无疾而终。在流失分析报告中,这一项被归类为“参与度低”。而真正的理由——“我再也不敢相信它了”——从未出现在任何仪表盘上,因为用户根本没有打开那个本该询问该问题的 CSAT 调研。
这是大多数交付 AI 产品的团队系统性忽视的失败模式。不是幻觉——幻觉只是显露出来的冰山一角。深潜于水面之下的是置信度失准(confidence miscalibration):模型实际掌握的信息与它表达时的确信程度之间的差距。而这种差距带来的代价并非体现在调研问卷中,而是在续约谈判定夺的那一刻。
大多数产品团队都有模型准确率指标。很少有团队拥有衡量“模型在出错时听起来如何”的指标。几乎没有团队拥有衡量“如果语气对冲校准得更好,用户是否会做出不同决策”的指标。而最后一个指标,才是预测流失的关键。
对冲话术是产品表面,而非副作用
工程师认为置信度是模型内部生成的东西——概率、logit、softmax 输出。用户看不到这些。用户看到的是句子。“截止日期是 3 月 14 日。”“我相信截止日期是 3 月 14 日。”“截止日期似乎是 3 月 14 日,但你可能需要确认一下。” 底层的陈述相同,但产生的下游行为却截然不同。
对冲话术(hedge phrase)是将置信度转化为可操作信息的“产品表面”。但大多数团队却将其视为次要的——一种由系统提示词(system prompt)撰写者决定的风格选择,通过“感觉”进行校准,从未被测量,也从未进行版本化管理。最近关于语言不确定性的研究表明,中等程度的对冲——即特定的校准对冲,而非盲目自信或习惯性的“我不知道”——能产生最佳的协作效果。擅长对冲的模型能教会用户何时该去验证,何时该采取行动。而不擅长对冲的模型则会让用户陷入要么质疑一切、要么信任一切的境地,这两种模式最终都会走向失败。
之所以这是一个产品问题而非研究问题,是因为对冲是“双语”的。模型有内部概率,而用户有行为阈值。对冲就是翻译官。如果翻译官失职,用户就会越过本不该越过的行为阈值——其后果不由模型承担,而由用户承担。
