你的 AI 定价页面是一场对 Token 经济学的杠杆押注

2026年4月28日 · 阅读需 10 分钟

Software Engineer

当团队发布“每个席位 $X 美元的无限 AI”订阅层级时，定价会议上没有人意识到这是一个衍生品头寸。它看起来就像一个普通的 SaaS 定价页面——一个数字、一个层级、一个行动召唤（CTA）。但现在，该页面带来的每一美元收入都暴露在供应商设定的 Token 成本曲线之下，而该供应商的路线图根本不在乎你的毛利率。你写的不是定价页面，而是一份针对 Token 波动性的裸卖空合约，而行权价就是你的供应商在下季度收取的费用。

数学计算很快就显现出结果。少数重度用户发现了工作流，并开始在他们能塞进的最长上下文中运行它。竞争对手的 UX 变化重新训练了中位数用户，让他们发送长出 40% 的查询。你的功能所绑定的前沿模型因为旧版本层级被弃用而迎来了每百万 Token 价格的上调。其中任何一项都是你在单个季度内无法通过定价页面逆转的利润事件——而且它们往往会成群结队地到来。

这并非假设。GitHub Copilot 在 2026 年花了大量精力来消除“每月 10 美元的编辑器内助手”带来的后果，因为同样的产品变成了一个运行多步编码会话的智能体循环，而现在它正将所有方案转向按量计费，因为固定费率模式无法在产品进化后的形态中存续。Cursor 在 2025 年 6 月也经历了自己的阵痛：无限 Pro 层级被转换为“价值 20 美元的用量”，重度用户在用了几次 Claude 后就触及了新上限，公司随后的整个周末都在退款和道歉中度过。这两个团队都开发出了优秀的产品，也都没有被竞争对手超越。他们是被自己的定价页面打败了。

按席位定价页面是为不同的成本曲线设计的

按席位收费的 SaaS 定价之所以奏效，是因为席位的边际成本几乎为零。在同一个基于 Postgres 的 CRUD 应用中，第二个用户运行的查询与第一个用户相同，针对的是相同的数据库，使用的是已经付过费的硬件。单位经济效益能够承受用户之间 10 倍的用量差异，因为没有随用量波动的可变成本需要吸收。

AI 功能从根本上打破了这一假设。在同一个聊天界面上，第二个用户运行的是全新的推理，在全新的上下文窗口中，针对的是一个你并不拥有的供应商设定的每 Token 价格的模型。“第二个席位免费”的直觉在这里悄然反转：从预期来看，第二个席位与第一个席位同样昂贵，而 P90 重度用户的席位通常比 P50 用户贵 10 倍。结果就是过去两年每位 AI 优先的分析师都在写的毛利压缩——AI 原生 SaaS 的毛利落在 50–60% 范围内，而传统 SaaS 则在 80–90%——但这被表现为定价层面的结构性特征，而非成本控制问题。

看起来像是“我们有一些重度用户”，实际上是“我们的单位经济效益是用户分布的函数，而我们无法仅通过定价页面观察到这种分布”。扁平的无限层级隐藏了分布；而分布才是决定你是否赚钱的关键。

隔夜压缩利润的三大冲击

有三件事会改变成本曲线，它们的到来时间与你的定价页面反应速度并不匹配。

供应商价格变动。 当你构建功能的模型重新定价时——无论是由于涨价，还是因为旧的廉价层级下线而被迫转向更昂贵的继任者——每个现有客户的边际成本都会跳升。决策权不在你手中，从宣布到账单到位的间隔是以周计算的。相比之下，你的定价页面对现有客户具有合同效力，且企业级订阅的调整需要销售流程。

用户群的工作负载偏移。 竞争对手发布的 UX 变化可能会重新训练你的用户对 AI 查询的预期。更长的 Prompt、用户习惯从单次对话转向多轮对话链、扩展到工具调用的智能体循环——这些都是对你 Token 消耗的外部冲击。用户并没有变得更有价值，他们只是在同样的价值下变得更贵了。

自身技术栈内的模型组合偏移。 想要更好答案的 PM 将小模型换成了前沿模型。想要更好召回率的工程师将检索到的上下文翻倍。增加工具使用的新功能将一次推理变成了八次。其中的每一个都是合理的策略决策；但集合起来，它们就是损益表中没人负责的 Token 成本增长。

关注其中一项的团队会被另外两项伏击。将“定价页面视为衍生品”的构架使这一切变得清晰：你在做空 Token 成本的波动性，而这里至少有三个独立的波动来源。

在定价页面上线前必须确立的纪律

将 AI 定价页面视为一种金融头寸，改变了在发布前必须准备就绪的内容。特别是以下四个产物，是不可逾越的底线。

财务部门可理解的单客成本模型。 每次推理的成本必须在请求层进行标记——按客户、按功能、按模型、按上下文长度——并汇总到 CFO 和工程负责人可以在同一个屏幕上阅读的仪表板中。CloudZero 提出的“AI 归因”构想非常精准：当模型调用落入没有标记的共享计算池时，销售成本（COGS）在数学上是真实的，但在操作上是不可见的。你无法为你无法归因的东西定价。一个可行的经验法则：如果你的财务团队在结账后 24 小时内无法指出客户 ID 和对应的美元金额，那么定价页面就是盲目运行。

从第一天起就设计的用量上限或公平使用条款。 在现有的“无限”计划中补漏用量上限是 AI 定价中最昂贵的策略——Cursor 在年中的转变导致了退款、公开道歉以及对信任度的沉重打击。上限不一定非要对普通用户可见，但从页面上线的第一天起，它就必须存在于服务条款和限流器中。关于 Token 术语中公平使用上限的行业参考——例如，每个用户每月几百万 Token 并带有明确的超量费率——已经存在；没有什么能强迫你非要把数字放在首位，但机制必须到位。

映射到实际成本客群的定价层级梯度。 扁平的“无限”承诺将三个成本客群（轻度、中值、重度）压缩进同一个 ARPU 中。如果两个层级都是扁平的，那么两层定价页面也不会做得更好。页面应该反映底层的成本结构：基础订阅用于保证可预测性，加上计费组件（积分、Token 或产出）以获取重度用户的增益。基础席位加用量层级的混合模式现在已成为 AI 增强型 SaaS 的主流定价结构，原因就在于此：它是最简单的定价页面，且没有对底层的成本曲线撒谎。

每季度的利润与供应商成本审查。 模型账单不是由应付账款部门核对的销售成本（COGS）细节。它是一个战略性科目，其单位成本随着供应商的季度节奏而变动，发布 AI 功能的团队也应以同样的节奏进行审查。审查中包含两个问题：AI 层级收入中有多大比例支付给了模型供应商？如果中位数客户的 Token 用量增长了 30%，这个比例会是多少？如果第二个问题的答案是“我们会赔钱”，那么定价页面在结构上就是脆弱的，下一次供应商公告就是导火索。

为什么基于成果的定价和混合定价正在普及

市场正在明显地从单一的按席位 AI 定价转向混合模式和基于成果的模式——Zendesk 按解决的工单为 AI Agent 计费，Salesforce 按 Agentforce 对话计费，以及更广泛的积分制趋势。标准的解释是“AI Agent 取代了席位，因此席位作为计费单位已过时”。这固然正确，但只是表象。更深层的原因是波动性论点：席位定价是对基于用量的成本曲线的固定费率风险敞口，而对波动性底层资产的固定费率敞口，往往是首先崩盘的头寸。

基于成果的定价——按解决量、按对话量、按生成的制品计费——具有这样一个特性：收入随你支付给模型的成本同步扩展。每一单位收入都天然地对冲了 Token 成本的波动，因为收入单位本身就是消耗了 Token 的工作单位。混合定价以一种更粗放的方式实现了类似的效果：基础订阅保证了可预测性和操作简便性，而用量层则吸收了波动。两者都优于按席位无限量模式，并非因为新形式更优雅，而是因为它们将一个杠杆做空头寸转变为更接近平衡账簿的状态。

这并不是说每一个 AI 功能都应该按成果定价。它是在说明，无论你交付什么样的定价形式，你都应该能够清晰地描述它吸收了哪些 Token 成本冲击，以及哪些冲击会直接传导至毛利率。“无限量”对这个问题的回答是：“所有的冲击，都由我们承担。”

定价是工程问题，而不仅仅是 GTM 问题

最终让这个问题变得可处理的框架是：AI 定价页面是一个工程产物。它是你的代码发出的用量分布、供应商控制的成本曲线以及提交给董事会的营收线之间的一份合同。在过去 18 个月中，每一个不得不进行紧急重新定价的团队——Copilot、Cursor 以及几个更隐秘的例子——都发现定价页面无法仅从营销端进行修复。它需要工程度量（按客户归因、速率限制器、层级强制执行）、产品手术（引入上限、限制前沿模型、重新设计 Agent 循环以遵循预算）以及财务建模（根据新的供应商价格表重新计算单元经济模型）——所有这些都在已付费客户群的时间压力下同步推进。

像传统 SaaS 那样为 AI 功能定价的团队，是在一个无法对冲的市场中做空波动性。而将定价页面视为一个需要管理的头寸——进行度量、设限、梯度定价并按季度审查——的团队，才是真正在经营业务。无论哪种方式，董事会看到的数字可能是一样的；但只有后一种解读在面对供应商下一次调价邮件时是可持续的。

References:

Let's stay in touch and Follow me for more thoughts and updates

Twitter LinkedIn Telegram Discord 小红书

你的 AI 定价页面是一场对 Token 经济学的杠杆押注

按席位定价页面是为不同的成本曲线设计的

隔夜压缩利润的三大冲击

在定价页面上线前必须确立的纪律

为什么基于成果的定价和混合定价正在普及

定价是工程问题，而不仅仅是 GTM 问题

Recommended Reading

关于 Tian Pan

按席位定价页面是为不同的成本曲线设计的​

隔夜压缩利润的三大冲击​

在定价页面上线前必须确立的纪律​

为什么基于成果的定价和混合定价正在普及​

定价是工程问题，而不仅仅是 GTM 问题​

Recommended Reading

关于 Tian Pan

按席位定价页面是为不同的成本曲线设计的

隔夜压缩利润的三大冲击

在定价页面上线前必须确立的纪律

为什么基于成果的定价和混合定价正在普及

定价是工程问题，而不仅仅是 GTM 问题