Zvec 向量数据库 RAG 全流程教程(目录)


文档摘要

利用 Zvec 实现完整的 RAG 技术 · 灏天文库教程 体系化中文教程,主题:利用阿里开源进程内向量数据库 Zvec,从 0 到 1 搭建完整 RAG 系统。 写作方向已确认为 RAG 全流程实战:多写端到端案例与 Embedding/LLM 集成,原理为实战服务。 阅读顺序 第 0 章 项目导览 —— 这是什么、能学到什么、怎么学 第 1 章 环境与跑通 —— 5 分钟跑通第一个检索 第 2 章 核心概念与架构 —— 搞清 Collection/Document/Schema/索引四件套 第 3 章 向量与 Embedding —— 稠密 vs 稀疏、度量选择 第 4 章 Schema 设计 —— 把知识库建对 第 5 章 向量索引 —— 用 Recall

利用 Zvec 实现完整的 RAG 技术 · 灏天文库教程

体系化中文教程,主题:利用阿里开源进程内向量数据库 Zvec,从 0 到 1 搭建完整 RAG 系统
写作方向已确认为 RAG 全流程实战:多写端到端案例与 Embedding/LLM 集成,原理为实战服务。

阅读顺序

  1. 第 0 章 项目导览 —— 这是什么、能学到什么、怎么学
  2. 第 1 章 环境与跑通 —— 5 分钟跑通第一个检索
  3. 第 2 章 核心概念与架构 —— 搞清 Collection/Document/Schema/索引四件套
  4. 第 3 章 向量与 Embedding —— 稠密 vs 稀疏、度量选择
  5. 第 4 章 Schema 设计 —— 把知识库建对
  6. 第 5 章 向量索引 —— 用 Recall 换速度(HNSW/IVF/DiskANN/量化)
  7. 第 6 章 检索四式 —— 单向量 / 过滤 / 全文检索 / 通用参数
  8. 第 7 章 混合检索 —— RAG 召回率的关键一跃(多向量 + Reranker)
  9. 第 8 章 工程实践 —— optimize 节奏、调参、可观测、选型取舍
  10. 第 9 章 进阶拓展 —— 端到端 RAG 落地、增量更新、端侧 RAG
  11. 附录 术语表与速查 —— 术语表 / 过滤表达式速查 / 索引选型表

合规说明

  • 正文严格遵守「灏天文库」合规约束:不出现仓库内真实文件路径、不依赖私有模块名。
  • 代码示例为概念性/通用片段,类名/函数名使用 Zvec 公开 API 真实名称(API 本身允许)。
  • 章节间以「详见第 N 章」交叉引用。

配套可运行示例

本教程的原理讲解配有一组可独立运行的示例程序(位于教程包的「配套示例」模块下),与各章节一一对应,建议边读教程边跑示例

示例主题 对应章节 一句话说明
五分钟建库检索闭环 第 1 章 Schema → 写入 → 优化 → 检索(占位向量)
Schema 设计与演进 第 4 章 黄金 Schema、字段类型、DDL
稠密 vs 稀疏向量 第 3 章 两类向量检索差异与度量选择
向量索引对比 第 5 章 Flat / HNSW / IVF / 量化的速度与召回
检索四式 第 6 章 单向量 / 过滤 / 向量+过滤 / 全文检索
中文全文检索分词器 第 6 章 标准分词 vs 结巴分词的召回差异
混合检索 第 7 章 多向量 + 重排序融合
重排序策略对比 第 7 章 加权融合 vs 倒数排名融合
端到端 RAG 第 9 章 切块 → 入库 → 检索 → LLM 生成
增量更新 第 9 章 幂等写入 / 条件删除
端侧 RAG 第 9 章 全链路本地化的隐私 RAG

💡 学习心法:前 6 章示例用「占位向量」即可跑通(不依赖任何模型),先把检索链路和返回结构看懂;第 7、9 章再接真实 Embedding(bge-m3)和 LLM。先打通链路,再上模型——调试时能一眼判断问题出在向量质量还是检索本身。各示例的运行入口与依赖说明,见教程包内「配套示例」模块的项目说明文档。


发布者: 作者: 转发
评论区 (0)
U