后台智能体与通知预算：为什么主动 AI 在用户注意力面前会遭遇硬上限

2026年5月13日 · 阅读需 11 分钟

Software Engineer

第一代 AI 助手表现得很礼貌。你输入，它们回答。第二代则不再等待。它会观察你的日历、扫描你的收件箱、阅读你的代码库活动，并在你提出任何要求之前就抛出“你应该知道这个”之类的打扰。这种宣传极具吸引力，演示也令人着迷。但一旦这些功能上线，留存曲线却并不理想。

发布会幻灯片上没人会放这样一个数字：用户对来自所有渠道的未经请求的 AI 更新有一个每日上限，总和大约只有三到五个。如果一个主动式智能体在一周内发出了第十条通知，那么用户在周五就会将其静音，并在下个月将其卸载。这不仅是一个 UX 打磨问题，更是整个主动式 AI 领域的架构盲区，它值得拥有一个名字：通知预算（notification budget）。

上限是真实存在的，而且比你想象的要低

智能手机用户每天已经在所有应用中接收到 46 到 63 条推送通知。当你后台智能体出现时，用户多年来一直在与他们的注意力预算进行博弈。他们已经静音了那些滥用权力的应用，批量处理了那些表现尚可的应用，并训练自己直接忽略任何非主动订阅的内容。你的智能体进入这个环境时，只是又一个索取者，而不是特邀嘉宾。

认知科学已经充分证明了单次打扰的代价。从一次任务中断中恢复平均需要约 23 分钟。短至 5 秒的干扰就能使复杂认知工作的错误率翻三倍。大约有一半禁用应用推送通知的用户最终会完全流失。虽然这些数据并非针对 AI 智能体测得，但被干扰的认知系统是同一个系统，从“禁用”到“流失”的路径也是同一条路径。从神经科学的角度来看，你的“智能”打扰与愚蠢的打扰并无二致。

产品数据背后隐藏着令人不安的真相。通知疲劳往往滞后于参与度指标数周。本周二不断点击“关闭”的用户就是下个月流失的用户，你的周活用户看板根本无法预见危机，因为“关闭”也是一种点击，而点击看起来像参与度。追求通知数量的智能体，正在优化的指标恰恰会在三周后导致留存率的反转。

“通知发送量”是错误的成功指标

最常见的失败模式往往发生在任何设计决策之前：团队构建了一个统计通知发送量的仪表盘，将 OKR 与之挂钩，并让智能体内部的规划器去最大化这个数值。观察者探测到的每一个信号都成了候选项，每一个候选项都变成了一条通知，曲线一路上扬，直到潜在的用户群体悄无声息地崩塌。

通知发送量是一个虚荣指标。真正能预测长期价值的指标是“产生行动的通知”，最好根据行动的重要性进行加权。一条被用户直接关闭而未打开的通知，比没有通知更糟糕，因为它消耗了预算并产生了负面信任。一条被打开但未产生行动的通知大约处于盈亏平衡点。只有触发了实际行动的通知才是正向贡献，即便是这些通知，也必须扣除它们消耗掉的预算。

改变设计决策的思路很简单：将每一条通知视为从有限账户中的“取款”，而不是对参与度漏斗的“存款”。这会迫使智能体内部的规划器做出目前它尚未做出的选择——考虑到发出这条通知会剥夺未来的机会，这个信号是否比本周所有其他待选信号都更有价值？大多数信号在比较中都会落败。而这正是重点所在。

通知预算架构究竟长什么样？

一个有效的通知预算模型包含五个组件。那些在 2026 年交付留存率为正的主动式智能体的团队，大多具备其中大部分或全部组件。

每个用户固定的每日重置预算。 设定一个数字——以 3 个为稳妥的起点，5 个为上限——并将其作为硬性限制而非软性目标。规划器将预算视为其状态的一部分。如果预算已用完，下一个候选通知必须替换掉今天已发出的通知（这几乎总是不明智的），或者等待。这一单一约束会迫使上游的信号检测逻辑诚实地面对相对重要性。

价值与注意力的评分层。 每个候选通知都会根据预期效用（用户采取行动的概率，按行动价值加权）和注意力成本（考虑到当前语境的干扰程度）进行评分。发送门槛是根据用户过去的“关闭”与“行动”行为针对每个用户学习得出的。如果一个用户关闭了最近三次日历冲突通知，他们实际上隐性地提高了该类别的门槛；智能体应该能察觉到这一点。

加载中…

References:

Let's stay in touch and Follow me for more thoughts and updates

Twitter LinkedIn Telegram Discord 小红书

后台智能体与通知预算：为什么主动 AI 在用户注意力面前会遭遇硬上限

上限是真实存在的，而且比你想象的要低

“通知发送量”是错误的成功指标

通知预算架构究竟长什么样？

Recommended Reading

关于 Tian Pan

上限是真实存在的，而且比你想象的要低​

“通知发送量”是错误的成功指标​

通知预算架构究竟长什么样？​

Recommended Reading

关于 Tian Pan

上限是真实存在的，而且比你想象的要低

“通知发送量”是错误的成功指标

通知预算架构究竟长什么样？