利用 Zvec 实现完整的 RAG 技术 · 灏天文库教程 体系化中文教程,主题:利用阿里开源进程内向量数据库 Zvec,从 0 到 1 搭建完整 RAG 系统。 写作方向已确认为 RAG 全流程实战:多写端到端案例与 Embedding/LLM 集成,原理为实战服务。 阅读顺序 第 0 章 项目导览 —— 这是什么、能学到什么、怎么学 第 1 章 环境与跑通 —— 5 分钟跑通第一个检索 第 2 章 核心概念与架构 —— 搞清 Collection/Document/Schema/索引四件套 第 3 章 向量与 Embedding —— 稠密 vs 稀疏、度量选择 第 4 章 Schema 设计 —— 把知识库建对 第 5 章 向量索引 —— 用 Recall
体系化中文教程,主题:利用阿里开源进程内向量数据库 Zvec,从 0 到 1 搭建完整 RAG 系统。
写作方向已确认为 RAG 全流程实战:多写端到端案例与 Embedding/LLM 集成,原理为实战服务。
本教程的原理讲解配有一组可独立运行的示例程序(位于教程包的「配套示例」模块下),与各章节一一对应,建议边读教程边跑示例。
| 示例主题 | 对应章节 | 一句话说明 |
|---|---|---|
| 五分钟建库检索闭环 | 第 1 章 | Schema → 写入 → 优化 → 检索(占位向量) |
| Schema 设计与演进 | 第 4 章 | 黄金 Schema、字段类型、DDL |
| 稠密 vs 稀疏向量 | 第 3 章 | 两类向量检索差异与度量选择 |
| 向量索引对比 | 第 5 章 | Flat / HNSW / IVF / 量化的速度与召回 |
| 检索四式 | 第 6 章 | 单向量 / 过滤 / 向量+过滤 / 全文检索 |
| 中文全文检索分词器 | 第 6 章 | 标准分词 vs 结巴分词的召回差异 |
| 混合检索 | 第 7 章 | 多向量 + 重排序融合 |
| 重排序策略对比 | 第 7 章 | 加权融合 vs 倒数排名融合 |
| 端到端 RAG | 第 9 章 | 切块 → 入库 → 检索 → LLM 生成 |
| 增量更新 | 第 9 章 | 幂等写入 / 条件删除 |
| 端侧 RAG | 第 9 章 | 全链路本地化的隐私 RAG |
💡 学习心法:前 6 章示例用「占位向量」即可跑通(不依赖任何模型),先把检索链路和返回结构看懂;第 7、9 章再接真实 Embedding(bge-m3)和 LLM。先打通链路,再上模型——调试时能一眼判断问题出在向量质量还是检索本身。各示例的运行入口与依赖说明,见教程包内「配套示例」模块的项目说明文档。