超越 RAG:混合搜索、智能体检索以及真正重要的数据库设计决策
· 阅读需 10 分钟
大多数团队将 RAG 上线并称之为检索策略。他们将文档分块、嵌入、存储向量,并在查询时运行最近邻搜索。这在演示中效果足够好。然而在生产环境中,用户开始报告系统找不到他们知道存在的文章、遗漏文档中字面意义上的错误代码,或者返回语义相似但事实错误的内容。
问题不在于 RAG。问题在于将检索视为一个一维问题,而它实际上一直都是多维的。
大多数团队将 RAG 上线并称之为检索策略。他们将文档分块、嵌入、存储向量,并在查询时运行最近邻搜索。这在演示中效果足够好。然而在生产环境中,用户开始报告系统找不到他们知道存在的文章、遗漏文档中字面意义上的错误代码,或者返回语义相似但事实错误的内容。
问题不在于 RAG。问题在于将检索视为一个一维问题,而它实际上一直都是多维的。