AI 功能 PMF 信号:为什么你的指标在欺骗你
当你的 AI 功能上线,各项指标开始亮眼——DAU 飙升、NPS 攀升、点赞反馈涌入——你可能正在目睹真正的产品市场契合度。也可能只是两幕故事的第一幕,而第二幕以一个没人预料到的留存悬崖收场。
问题在于,这些信号对概率性 AI 功能而言在结构上就是失效的。它们是为确定性软件设计的——在那里,"已激活"有明确含义,五星好评能预测未来使用,新鲜感在数天内消退,而不是掩盖一个六个月后才显现的流失浪潮。AI 功能的行为模式截然不同,而标准 PMF 工具包是针对错误输入校准的。
接下来,我将分析传统指标为何会产生误导、哪些行为模式能真正区分真实 PMF 与新鲜感效应,以及如何构建队列分析以便在悬崖到来之前识别出差异。
为什么传统信号对 AI 功能失效
NPS 将新鲜感与满意度 混为一谈。 新 AI 功能上线时,用户充满好奇,主动探索,互动感觉出乎意料地有价值——部分是因为确实如此,部分是因为任何新奇事物在基准调整之前都会被感知为良好。在上线后两到六周收集的 NPS 捕捉到了这种新鲜感溢价,并将其作为产品质量信号嵌入你的仪表板。到第四个月,新鲜感溢价已经消散,你在将当前数据与虚高的历史分数对比时,功能看起来像是在衰退。但它并没有衰退——它从来就没有达到你以为的那个水平。
点赞评分反映的是礼貌性表态,而非真实偏好。 人们给予好评与实际使用之间存在有据可查的差距。用户给纪录片打五星,却在看真人秀。对于 AI 输出,用户会对一个能力尚可、内容完整的回答竖起大拇指,即使他们不够信任到在无人监督的情况下直接使用,即使他们在使用前进行了修改,即使他们再也不会让这个功能做同类任务。二元评分捕捉的是当下情绪,与功能是否在工作流中赢得一席之地毫无关系。
激活率衡量的是用户是否到达,而非是否留下。 高激活率叠加低 D30 留存率,是新鲜感的特征,而非 PMF。用户尝试 AI 功能,是因为它有趣——就像他们看产品演示或点击科技新闻一样。激活事件告诉你的是营销奏效了,或者说好奇心是普遍的,或者说引导流程没有立刻把人赶走。它无法告诉你这个功能是否解决了值得反复解决的问题。
这三个指标的共同问题是:它们将第一印象等同于持久关系。对于传统软件功能——导出为 CSV、多因素认证、已保存的筛选器——这种等同基本无害,因为没有新鲜感溢价会消退。AI 功能的新鲜感溢价幅度大、持续时间短,而这恰恰是团队最积极衡量 PMF 的阶段。
