AI 产品定价：逃脱算力成本陷阱

2026年4月16日 · 阅读需 11 分钟

Software Engineer

有一家公司每位用户每月收费 50 英镑。其 AI 功能消耗了 30 英镑的 API 费用。这意味着在支付任何一笔退款或处理任何一个流失席位之前，剩下的 20 英镑还要覆盖主机、支持和利润。他们打造了用户喜爱的产品，发展到数千名订阅者，却在不知不觉中构建了一个客户越多、亏损越多的商业模式。

这并非关于坏主意的警示故事，而是关于定价架构的警示故事——这套架构从一个下一个用户边际成本几乎为零的世界照搬而来。当你的产品需要调用语言模型时，那个世界已不再完全适用。

传统 SaaS 毛利率为 70–90%。以 AI 为核心的公司报告的数字是 50–60%——差距主要由一行成本解释：推理。当 Token 占据销售成本的 20–40% 时，标准 SaaS 打法就会失效。

为何固定收费在 Token 压力下失效

传统软件的经济学在其简洁性上堪称完美。一旦支付了服务器费用，每增加一个用户几乎不产生任何成本。在那个世界里，定价是关于支付意愿和竞争定位的问题——成本只是一个可以忽略不计的数字。

LLM 驱动的功能不具备这一特性。每次查询都会触发一次真实的 API 调用。每月提问 400 次的用户，服务成本是提问 200 次用户的两倍——这个比例不会随着规模扩大而收窄，而是会持续累积。

设想一个月均 ARPU 为 20 美元的产品。一个每月消耗 20 万个 Token 的轻度用户，按中档模型定价（每百万 Token 1 美元）算，Token 成本为 0.20 美元——在 92% 毛利率下，这是个可以忽略的小数。但重度用户每月消耗 200 万个 Token，使用高端模型（每百万 Token 5 美元）时，成本高达 10 美元——占月收入的一半，而这还未算上任何服务器或支持工单的费用。

危险之处在于，这些用户往往看起来是你最好的客户。他们参与度最高，使用每一个功能，并产生推动增长的口碑。然而，他们悄悄地也是单位经济最差的用户。

OpenAI 在 ChatGPT Pro 上直接领教了这一点。即便每月 200 美元——市场上最高的消费级 AI 订阅价——当每月查询超过 2 万次的用户群体无限制使用时，这个价格依然在亏损。看起来是高端定价的方案，在无限制使用的情况下仍然不够。

四种定价架构及其各自的失败模式

应对 AI 定价挑战的团队往往会集中于四种模式之一，每种模式都有特定的失败方式。

捆绑固定费用——AI 功能包含在现有套餐中，不额外收费。发布最简单，采用最快速。失败模式是无声的：如果使用量激增，毛利率会悄然压缩。你不会在获客指标中看到它，而是会在季度财务审查中发现毛利率比预测低了十个百分点。

分层使用上限——每个套餐包含一定配额（每月 100 万个 Token、50 条聊天消息、2000 次代码补全），重度用户触及上限后需升级。GitHub Copilot 免费版正是如此：2000 次补全和 50 条聊天消息，然后停止服务。这是部署最广泛的方案，因为它从经济上对用户进行了分层——消耗 80% Token 支出的 5% 用户，也恰恰是最愿意为更多配额付费的 5%。失败模式是触及上限时的流失。如果上限设置过于激进，会激怒那些为你最大声鼓与呼的重度用户。

计量超额收费——基础订阅包含 Token 预算，用户在超出阈值后按单位费率付费。例如：每月 1000 美元平台费包含 100 万个 Token，超出后每 10 万个 Token 收费 2 美元。失败模式是意外账单。未监控使用量的用户会收到出乎意料的大额账单，进而流失或提出争议。这种架构需要完善的用量仪表板和主动提醒才能有效运作。

基于结果定价——按已解决工单、已完成文档、已成交订单或其他下游结果收费，而非按 Token 消耗。失败模式是归因复杂性：你需要对"结果"的定义清晰可辩，而客户会找到边界案例。

这些架构没有哪一种是普遍正确的。目前有 56% 的 AI SaaS 公司采用混合模式，将订阅的可预测性与某种使用量信号结合起来。

真正有效的毛利保护模式

目标不是惩罚重度用户——他们是你最好的倡导者。目标是避免用几乎不碰 AI 功能的用户收入来补贴重度用户。

加载中…

References:

Let's stay in touch and Follow me for more thoughts and updates

Twitter LinkedIn Telegram Discord 小红书

AI 产品定价：逃脱算力成本陷阱

为何固定收费在 Token 压力下失效

四种定价架构及其各自的失败模式

真正有效的毛利保护模式

Recommended Reading

关于 Tian Pan

为何固定收费在 Token 压力下失效​

四种定价架构及其各自的失败模式​

真正有效的毛利保护模式​

Recommended Reading

关于 Tian Pan

为何固定收费在 Token 压力下失效

四种定价架构及其各自的失败模式

真正有效的毛利保护模式