跳到主要内容

AI 产品定价:逃脱算力成本陷阱

· 阅读需 11 分钟
Tian Pan
Software Engineer

有一家公司每位用户每月收费 50 英镑。其 AI 功能消耗了 30 英镑的 API 费用。这意味着在支付任何一笔退款或处理任何一个流失席位之前,剩下的 20 英镑还要覆盖主机、支持和利润。他们打造了用户喜爱的产品,发展到数千名订阅者,却在不知不觉中构建了一个客户越多、亏损越多的商业模式。

这并非关于坏主意的警示故事,而是关于定价架构的警示故事——这套架构从一个下一个用户边际成本几乎为零的世界照搬而来。当你的产品需要调用语言模型时,那个世界已不再完全适用。

传统 SaaS 毛利率为 70–90%。以 AI 为核心的公司报告的数字是 50–60%——差距主要由一行成本解释:推理。当 Token 占据销售成本的 20–40% 时,标准 SaaS 打法就会失效。

为何固定收费在 Token 压力下失效

传统软件的经济学在其简洁性上堪称完美。一旦支付了服务器费用,每增加一个用户几乎不产生任何成本。在那个世界里,定价是关于支付意愿和竞争定位的问题——成本只是一个可以忽略不计的数字。

LLM 驱动的功能不具备这一特性。每次查询都会触发一次真实的 API 调用。每月提问 400 次的用户,服务成本是提问 200 次用户的两倍——这个比例不会随着规模扩大而收窄,而是会持续累积。

设想一个月均 ARPU 为 20 美元的产品。一个每月消耗 20 万个 Token 的轻度用户,按中档模型定价(每百万 Token 1 美元)算,Token 成本为 0.20 美元——在 92% 毛利率下,这是个可以忽略的小数。但重度用户每月消耗 200 万个 Token,使用高端模型(每百万 Token 5 美元)时,成本高达 10 美元——占月收入的一半,而这还未算上任何服务器或支持工单的费用。

危险之处在于,这些用户往往看起来是你最好的客户。他们参与度最高,使用每一个功能,并产生推动增长的口碑。然而,他们悄悄地也是单位经济最差的用户。

OpenAI 在 ChatGPT Pro 上直接领教了这一点。即便每月 200 美元——市场上最高的消费级 AI 订阅价——当每月查询超过 2 万次的用户群体无限制使用时,这个价格依然在亏损。看起来是高端定价的方案,在无限制使用的情况下仍然不够。

四种定价架构及其各自的失败模式

应对 AI 定价挑战的团队往往会集中于四种模式之一,每种模式都有特定的失败方式。

捆绑固定费用——AI 功能包含在现有套餐中,不额外收费。发布最简单,采用最快速。失败模式是无声的:如果使用量激增,毛利率会悄然压缩。你不会在获客指标中看到它,而是会在季度财务审查中发现毛利率比预测低了十个百分点。

分层使用上限——每个套餐包含一定配额(每月 100 万个 Token、50 条聊天消息、2000 次代码补全),重度用户触及上限后需升级。GitHub Copilot 免费版正是如此:2000 次补全和 50 条聊天消息,然后停止服务。这是部署最广泛的方案,因为它从经济上对用户进行了分层——消耗 80% Token 支出的 5% 用户,也恰恰是最愿意为更多配额付费的 5%。失败模式是触及上限时的流失。如果上限设置过于激进,会激怒那些为你最大声鼓与呼的重度用户。

计量超额收费——基础订阅包含 Token 预算,用户在超出阈值后按单位费率付费。例如:每月 1000 美元平台费包含 100 万个 Token,超出后每 10 万个 Token 收费 2 美元。失败模式是意外账单。未监控使用量的用户会收到出乎意料的大额账单,进而流失或提出争议。这种架构需要完善的用量仪表板和主动提醒才能有效运作。

基于结果定价——按已解决工单、已完成文档、已成交订单或其他下游结果收费,而非按 Token 消耗。失败模式是归因复杂性:你需要对"结果"的定义清晰可辩,而客户会找到边界案例。

这些架构没有哪一种是普遍正确的。目前有 56% 的 AI SaaS 公司采用混合模式,将订阅的可预测性与某种使用量信号结合起来。

真正有效的毛利保护模式

目标不是惩罚重度用户——他们是你最好的倡导者。目标是避免用几乎不碰 AI 功能的用户收入来补贴重度用户。

加载中…
References:Let's stay in touch and Follow me for more thoughts and updates