RAG系统架构设计 检索增强生成结合检索和生成。 核心组件 文档加载 支持多种格式 文本提取清理 分块切分策略 向量化 Embedding模型选择 批量向量计算 向量存储优化 检索器 相似度搜索 混合检索 重排序优化 生成器 LLM模型选择 提示词工程 上下文注入 架构模式 Naive RAG 简单检索后生成 适合小规模数据 Advanced RAG 查询重写 混合检索 递归检索 Modular RAG 模块化设计 灵活组合 可扩展架构 优化技巧 查询重写 混合检索 结果重排 上下文压缩 评估指标 检索质量 召回率准确率 生成质量 相关性流畅性 端到端性能 响应延迟 吞吐量 向量库选择 Chroma简单易用 Pinecone云服务 Weaviate功能丰富 Milvus高性能