Zvec 向量数据库 RAG 全流程教程（目录）

文档摘要

利用 Zvec 实现完整的 RAG 技术 · 灏天文库教程体系化中文教程，主题：利用阿里开源进程内向量数据库 Zvec，从 0 到 1 搭建完整 RAG 系统。写作方向已确认为 RAG 全流程实战：多写端到端案例与 Embedding/LLM 集成，原理为实战服务。阅读顺序第 0 章项目导览 —— 这是什么、能学到什么、怎么学第 1 章环境与跑通 —— 5 分钟跑通第一个检索第 2 章核心概念与架构 —— 搞清 Collection/Document/Schema/索引四件套第 3 章向量与 Embedding —— 稠密 vs 稀疏、度量选择第 4 章 Schema 设计 —— 把知识库建对第 5 章向量索引 —— 用 Recall

利用 Zvec 实现完整的 RAG 技术 · 灏天文库教程

体系化中文教程，主题：利用阿里开源进程内向量数据库 Zvec，从 0 到 1 搭建完整 RAG 系统。
写作方向已确认为 RAG 全流程实战：多写端到端案例与 Embedding/LLM 集成，原理为实战服务。

阅读顺序

第 0 章项目导览 —— 这是什么、能学到什么、怎么学
第 1 章环境与跑通 —— 5 分钟跑通第一个检索
第 2 章核心概念与架构 —— 搞清 Collection/Document/Schema/索引四件套
第 3 章向量与 Embedding —— 稠密 vs 稀疏、度量选择
第 4 章 Schema 设计 —— 把知识库建对
第 5 章向量索引 —— 用 Recall 换速度（HNSW/IVF/DiskANN/量化）
第 6 章检索四式 —— 单向量 / 过滤 / 全文检索 / 通用参数
第 7 章混合检索 —— RAG 召回率的关键一跃（多向量 + Reranker）
第 8 章工程实践 —— optimize 节奏、调参、可观测、选型取舍
第 9 章进阶拓展 —— 端到端 RAG 落地、增量更新、端侧 RAG
附录术语表与速查 —— 术语表 / 过滤表达式速查 / 索引选型表

合规说明

正文严格遵守「灏天文库」合规约束：不出现仓库内真实文件路径、不依赖私有模块名。
代码示例为概念性/通用片段，类名/函数名使用 Zvec 公开 API 真实名称（API 本身允许）。
章节间以「详见第 N 章」交叉引用。

配套可运行示例

本教程的原理讲解配有一组可独立运行的示例程序（位于教程包的「配套示例」模块下），与各章节一一对应，建议边读教程边跑示例。

示例主题	对应章节	一句话说明
五分钟建库检索闭环	第 1 章	Schema → 写入 → 优化 → 检索（占位向量）
Schema 设计与演进	第 4 章	黄金 Schema、字段类型、DDL
稠密 vs 稀疏向量	第 3 章	两类向量检索差异与度量选择
向量索引对比	第 5 章	Flat / HNSW / IVF / 量化的速度与召回
检索四式	第 6 章	单向量 / 过滤 / 向量+过滤 / 全文检索
中文全文检索分词器	第 6 章	标准分词 vs 结巴分词的召回差异
混合检索	第 7 章	多向量 + 重排序融合
重排序策略对比	第 7 章	加权融合 vs 倒数排名融合
端到端 RAG	第 9 章	切块 → 入库 → 检索 → LLM 生成
增量更新	第 9 章	幂等写入 / 条件删除
端侧 RAG	第 9 章	全链路本地化的隐私 RAG

💡 学习心法：前 6 章示例用「占位向量」即可跑通（不依赖任何模型），先把检索链路和返回结构看懂；第 7、9 章再接真实 Embedding（bge-m3）和 LLM。先打通链路，再上模型——调试时能一眼判断问题出在向量质量还是检索本身。各示例的运行入口与依赖说明，见教程包内「配套示例」模块的项目说明文档。