提示词债务螺旋：单行补丁如何摧毁生产环境的提示词

2026年4月19日 · 阅读需 10 分钟

Software Engineer

进入生产环境六个月后，你面向客户的 LLM 功能的系统 Prompt 已从最初清爽的 11 行增长到超过 400 个 token，充斥着各种条件指令、对冲表述和异常处理。质量明显比发布时更差，但当时的每一次单独修改似乎都是合理的。没人知道哪些条款相互冲突，也没人知道其中一半是否仍然必要。没人敢动它。

这就是 Prompt 债务螺旋——大多数处于生产阶段的团队已经深陷其中。

Prompt 债务是 LLM 特有技术债务中占比最大的一类，在真实世界 AI 项目中，它占所有已识别技术债务问题的 6% 以上，超过了超参数调优和框架集成问题的总和。数据来自最近对数百个 LLM 代码库的一项经验性研究——但你可能不需要研究也能识别出这种模式。真正的问题是，为什么 Prompt 退化得如此有规律，以及结构性的修复方案是什么样的。

为什么补丁会堆积成债务

触发因素总是生产环境中的边缘情况（edge case）。Agent 在处理客户姓名带撇号的退款请求时出错。摘要生成器在下游系统需要散文时返回了项目符号。分类器幻觉出了一个不存在的类别。

工程师的本能是正确的：识别失败，添加一条解决该问题的指令，部署。问题在于这个循环是无限运行的，而且每次迭代的成本并非固定不变，而是不断增加。

每一个新的条件指令都会与现有的所有条款发生相互作用。系统 Prompt 并不是程序；模型不会按照确定的优先级规则从左到右解析它。它会同时关注整个上下文，在存在冲突指令的情况下，它的行为会变得不可预测，而不是遵循规则。“始终用英语回答”和 500 个 token 之外的“根据用户消息的语言回答”将无法得到清晰的解决——模型会根据周围上下文的细微变化，先应用其中一个，然后应用另一个，最后可能两个都不应用。

关于 LLM 在 Prompt 长度增加时的指令遵循行为的研究揭示了一种被称为指令稀释（instruction dilution）的模式：随着系统 Prompt 的增长，模型开始优先处理文本开头和结尾的条款，而忽视中间的所有内容。一项使用嵌入相关信息的资料集研究发现，对于位于上下文中间位置的内容，准确率下降超过 30%——这还是针对检索而言，而不是更难衡量、更容易被忽视的指令遵循能力。

经验性的失败轨迹是这样的：第一个边缘情况补丁效果显著。第二个补丁有些帮助。第十个补丁的效果可能比什么都不做还要差。

三种结构性失败模式

Prompt 债务在不同地方的表现各异，但失败模式往往呈现出可识别的规律。

相互矛盾的指令。 两个间隔数月添加的条款，各自独立看都很合理，但直接相互冲突。这比编译错误更阴险，因为 Prompt 仍然“有效”——模型只是不可预测地随机选择一条指令，直到你检查失败案例时才会发现。一个客服 Prompt 既写着“始终为不满意的客户提供折扣”，又写着“绝不主动提及折扣”，这就是成熟 Prompt 中常见的冲突类型。

超出适用背景的硬编码假设。 早期的 Prompt 通常包含关于用户群、使用场景范围或模型行为的隐式假设，这些假设在发布时是正确的，但现在已不再适用。这些假设还没错到导致直接失败——它们只是悄悄地降低了质量。例如，一个最初为 B2B 用户编写的 Prompt 被重新用于消费者，并在其上叠加了每一个新的边缘情况补丁。

格式债务。 臭名昭著的 #TODO: 将响应转为 JSON 并就这样发布到了生产环境。在初始实现中推迟的结构化输出要求在稍后被强行加入——此时 Prompt 已经包含了几十条关于内容的条件条款，而这些内容现在还必须生成有效的 JSON。格式要求和内容要求相互作用，使得一旦两者同时存在， Prompt 对后续修改就会变得极其脆弱。

为什么移除债务如此困难

LLM 项目中自认的技术债务中位数会持续 553 天——这是研究文献中所有软件类别中移除率最低的。原因并非懒惰，而是移除 Prompt 债务的成本确实很高，这与移除死代码完全不同。

生产环境 Prompt 中的每一个条款都可能是某些真实输入的“承重墙”。你无法通过 grep 查找调用点。你无法编写一个覆盖完整行为层面的单元测试。移除一个你认为多余的条件指令可能会破坏你尚未测试的功能，而且这种失败可能非常微妙，以至于在手动 QA 中无法察觉。

加载中…

References:

Let's stay in touch and Follow me for more thoughts and updates

Twitter LinkedIn Telegram Discord 小红书

提示词债务螺旋：单行补丁如何摧毁生产环境的提示词

为什么补丁会堆积成债务

三种结构性失败模式

为什么移除债务如此困难

Recommended Reading

关于 Tian Pan

为什么补丁会堆积成债务​

三种结构性失败模式​

为什么移除债务如此困难​

Recommended Reading

关于 Tian Pan

为什么补丁会堆积成债务

三种结构性失败模式

为什么移除债务如此困难