智能体加载状态难题:为 45 秒的 UX 深渊进行设计
你的产品在第 10 秒到第 45 秒之间存在一个“空洞”,在这个时间段内,你设计的任何东西都不再起作用。用户在 10 秒左右就会放弃无响应的 UI —— Jakob Nielsen 在 90 年代就确定了这个阈值,现代的眼动追踪研究显示的偏差也不过一两秒。现代智能体(Agent)的工作通常需要 30 到 120 秒。多步规划、检索、几次工具调用,可能在最终输出前还要经过一轮反思 —— 延迟预算不再只是预算,而是一个巨大的深渊。
大多数团队在第一次发布智能体功能并查看会话录像时都会发现这一点。用户疯狂点击提交按钮。他们将查询粘贴到第二个标签页中。他们关闭窗口并从头开始重试,坚信系统已经崩溃。功能本身没问题,但等待过程出了问题。“加载动画出现”与“答案送达”之间的空白地带是 AI 产品设计中最被忽视的环节,而它正是决定用户认为你的智能体是聪明还是死机的关键。
随手放一个通用的加载动画是一种本能,但这种本能会毁掉你的产品发布。加载动画从未被设计用来承载 30 秒的“重量”。它告诉用户页面是活的,但它没有告 诉用户智能体是在思考、搜索、等待缓慢的 API,还是已经挂起。当所有状态看起来都一样时,用户会假设最坏的情况,因为他们唯一的信号就是自己不断上升的焦虑。
为什么当智能体需要 60 秒时,10 秒规则依然重要
Nielsen 的三个阈值对于对话式 AI 依然非常适用。在 100 毫秒时,系统感觉是瞬间响应的;在 1 秒以内,用户的思维流能保持连贯;超过 10 秒后,用户的注意力就会转移到其他事情上,当响应最终送达时,他们甚至需要重新适应才能开始阅读。
10 秒规则最初是为页面加载制定的,但其背后的认知限制是注意力层面的,而非技术层面的。它并不关心你是在等待数据库查询还是一个执行三个步骤的工具调用智能体。短期记忆容量和持续注意力是人类的常数。在一个只提供加载动画的 UI 中发布一个耗时 30 秒的智能体,无异于要求用户去维持系统拒绝为他们维持的状态。
一个有用的思考方式是:超过 10 秒后的每一秒,都是用户产生怀疑的一秒。我表达错了吗?这东西坏了吗?我该换个工具吗?UI 在 10 秒后的任务主要不是为了娱乐 —— 而是为了吸收怀疑,并用进度的证据取而代之。该原则之下的所有东西都只是实现细节。
