6.1.1 结合向量数据库(Chroma, Pinecone) 在构建真正可用的RAG系统时,向量数据库绝非一个“插上就能跑”的黑盒组件——它是一条精密咬合的传动轴,一端连着语义理解的神经末梢(Embedding模型),另一端咬住生成模型的推理齿轮(LLM)。Chroma与Pinecone,表面看是两个名字不同的向量存储服务,实则代表了RAG工程中两条根本不同的技术哲学路径:一个是轻量可控、可嵌入、可调试的本地化向量引擎;另一个是为高吞吐、低延迟、多租户场景而生的托管式向量即服务(Vector-as-a-Service)。若把RAG比作一辆自动驾驶汽车,Chroma是那台装在后备箱里、你可以随时打开机盖调校参数的嵌入式域控制器;