微调 vs. RAG 知识注入:工程师经常搞错的决策框架
· 阅读需 12 分钟
一家金融科技团队花了三个月时间,根据其内部合规文档(数千份监管 PDF、政策更新和程序指南)对模型进行了微调。结果差强人意。模型仍然会对具体的规则编号产生幻觉。它忘记了最近的政策变化。而唯一真正重要的指标(即顾问是否足够信任它的答案从而停止反复核对)几乎没有变化。两周后,另一个团队在同样的文档语料库上构建了一个 RAG 流水线。顾问们在一周内就开始信任它了。
微调团队并没有犯技术错误。他们犯了一个定义性错误:他们试图用一种行为修改工具来解决知识检索问题。
这种困惑无处不在。当团队希望模型“了解更多”时,他们会选择微调;当他们希望“更准确的答案”时,他们会选择 RAG。但实际的区别更为深远,搞错这一点会导致双方在工程时间上浪费数月。
