检索债务:为何你的 RAG 流水线会悄然退化
· 阅读需 11 分钟
你的 RAG 流水线上线六个月后,某些东西悄然改变了。用户没有大声投诉,但对答案的信任度正在下降。反馈评分从 4.2 跌至 3.7,一些支持工单提到了"过时信息"。你的工程师检查日志,没有错误、没有超时、没有明显的回归。检索流水线在你配置的每一个指标上看起来都很健康。
但事实并非如此。它正在腐烂。
检索债务是向量索引中积累的技术性衰退:不再代表当前文档内容的过期嵌入、污染搜索结果的已删除记录产生的墓碑块,以及索引语料库时使用的编码器版本与当前计算查询嵌入的编码器版本之间的语义漂移。与代码腐烂不同,检索债务不会产生堆栈跟踪,它产生的是带有自信引用的微妙错误答案。
60% 的企业 RAG 项目失败,不是因为幻觉或检索逻辑缺陷,而是因为团队无法在规模化场景下维护数据新鲜度。流水线在上线时运作正常,在团队专注于其他功能时悄然退化。
