当你的禁止列表变成秘籍:提示词中负面示例的隐性成本
打开一个成熟的生产系统提示词(system prompt)并搜索“not”这个词。在一个已经发布了三个季度并经历过几次事故的功能中,你几乎总能发现一个看起来像“遗憾清单”的章节——“不要提供医疗建议,不要生成匹配这些模式的代码,不要使用这个正则表达式生成内容,不要冒充这些竞争对手,不要使用这些短语。”每一行都可以追溯到一起特定的事故。每一行都是由一位满怀信心地说“这能解决问题”的工程师添加的。而这个列表,每一个季度都像博物馆增加展品一样不断增长。
极少数团队会公开承认的是,这个列表——提示词中最具防御性、经过最仔细审查的部分——对于错误的读者来说,也是整个功能中最有用的产物。一个决意提取系统提示词的用户,现在拥有一份经过策划、组织良好且模型可读的清单,其中包含了团队所担心的所有行为。禁止列表就是一份食谱。而团队亲手编写了这本烹饪书。
