跳到主要内容

后台智能体与通知预算:为什么主动 AI 在用户注意力面前会遭遇硬上限

· 阅读需 11 分钟
Tian Pan
Software Engineer

第一代 AI 助手表现得很礼貌。你输入,它们回答。第二代则不再等待。它会观察你的日历、扫描你的收件箱、阅读你的代码库活动,并在你提出任何要求之前就抛出“你应该知道这个”之类的打扰。这种宣传极具吸引力,演示也令人着迷。但一旦这些功能上线,留存曲线却并不理想。

发布会幻灯片上没人会放这样一个数字:用户对来自所有渠道的未经请求的 AI 更新有一个每日上限,总和大约只有三到五个。如果一个主动式智能体在一周内发出了第十条通知,那么用户在周五就会将其静音,并在下个月将其卸载。这不仅是一个 UX 打磨问题,更是整个主动式 AI 领域的架构盲区,它值得拥有一个名字:通知预算(notification budget)。

上限是真实存在的,而且比你想象的要低

智能手机用户每天已经在所有应用中接收到 46 到 63 条推送通知。当你后台智能体出现时,用户多年来一直在与他们的注意力预算进行博弈。他们已经静音了那些滥用权力的应用,批量处理了那些表现尚可的应用,并训练自己直接忽略任何非主动订阅的内容。你的智能体进入这个环境时,只是又一个索取者,而不是特邀嘉宾。

认知科学已经充分证明了单次打扰的代价。从一次任务中断中恢复平均需要约 23 分钟。短至 5 秒的干扰就能使复杂认知工作的错误率翻三倍。大约有一半禁用应用推送通知的用户最终会完全流失。虽然这些数据并非针对 AI 智能体测得,但被干扰的认知系统是同一个系统,从“禁用”到“流失”的路径也是同一条路径。从神经科学的角度来看,你的“智能”打扰与愚蠢的打扰并无二致。

产品数据背后隐藏着令人不安的真相。通知疲劳往往滞后于参与度指标数周。本周二不断点击“关闭”的用户就是下个月流失的用户,你的周活用户看板根本无法预见危机,因为“关闭”也是一种点击,而点击看起来像参与度。追求通知数量的智能体,正在优化的指标恰恰会在三周后导致留存率的反转。

“通知发送量”是错误的成功指标

最常见的失败模式往往发生在任何设计决策之前:团队构建了一个统计通知发送量的仪表盘,将 OKR 与之挂钩,并让智能体内部的规划器去最大化这个数值。观察者探测到的每一个信号都成了候选项,每一个候选项都变成了一条通知,曲线一路上扬,直到潜在的用户群体悄无声息地崩塌。

通知发送量是一个虚荣指标。真正能预测长期价值的指标是“产生行动的通知”,最好根据行动的重要性进行加权。一条被用户直接关闭而未打开的通知,比没有通知更糟糕,因为它消耗了预算并产生了负面信任。一条被打开但未产生行动的通知大约处于盈亏平衡点。只有触发了实际行动的通知才是正向贡献,即便是这些通知,也必须扣除它们消耗掉的预算。

改变设计决策的思路很简单:将每一条通知视为从有限账户中的“取款”,而不是对参与度漏斗的“存款”。这会迫使智能体内部的规划器做出目前它尚未做出的选择——考虑到发出这条通知会剥夺未来的机会,这个信号是否比本周所有其他待选信号都更有价值?大多数信号在比较中都会落败。而这正是重点所在。

通知预算架构究竟长什么样?

一个有效的通知预算模型包含五个组件。那些在 2026 年交付留存率为正的主动式智能体的团队,大多具备其中大部分或全部组件。

每个用户固定的每日重置预算。 设定一个数字——以 3 个为稳妥的起点,5 个为上限——并将其作为硬性限制而非软性目标。规划器将预算视为其状态的一部分。如果预算已用完,下一个候选通知必须替换掉今天已发出的通知(这几乎总是不明智的),或者等待。这一单一约束会迫使上游的信号检测逻辑诚实地面对相对重要性。

价值与注意力的评分层。 每个候选通知都会根据预期效用(用户采取行动的概率,按行动价值加权)和注意力成本(考虑到当前语境的干扰程度)进行评分。发送门槛是根据用户过去的“关闭”与“行动”行为针对每个用户学习得出的。如果一个用户关闭了最近三次日历冲突通知,他们实际上隐性地提高了该类别的门槛;智能体应该能察觉到这一点。

加载中…
References:Let's stay in touch and Follow me for more thoughts and updates