7.1.1 多阶段检索与重排 7.1.1 多阶段检索与重排:RAG系统中的精度跃迁机制 在检索增强生成(Retrieval-Augmented Generation, RAG)的演进历程中,单次向量相似度检索虽为起点,却远非终点。当我们面对真实世界中复杂、模糊、多义甚至矛盾的用户查询时,仅靠一次“快而糙”的近似最近邻(Approximate Nearest Neighbor, ANN)搜索,往往难以捕获真正语义相关的信息片段。这便引出了一个核心命题:如何在保证效率的同时,实现检索结果的高精度与高相关性?