6.3.3 向量数据库 (Vector DB):高维索引 (HNSW, IVFFlat) 与 AI 检索 在向量数据库的世界里,索引不是“锦上添花”的可选项——它是生死线。你可能已经部署了嵌入模型,完成了千万级文本的向量化,也构建了端到端的RAG流水线。但当用户输入“如何用PyTorch实现带梯度裁剪的LoRA微调”,而你的系统响应延迟飙至2.3秒、Top-1召回率跌至68%时,问题从来不在LLM,也不在提示工程;它就钉死在那层被轻描淡写称为“向量检索”的薄薄索引层上。 这不是理论推演,而是我在为某头部AI平台重构向量检索栈时亲手拆解过三百二十七次的现场: 的 与 组合在百万级 768 维数据上引发的 QPS 断崖; 的 在内存暴涨 4.7 倍后反而让 的吞吐不升反降;