6.1.2 利用 Ollama 提取文本 Embedding 在构建现代 RAG(Retrieval-Augmented Generation)系统时,Embedding 的质量与效率,从来不是“配角”,而是整个检索链路的地基与心跳——它决定着向量空间中语义距离是否真实反映人类理解的距离;它左右着召回结果的相关性天花板;它甚至悄悄定义了后续重排序、融合、生成阶段的上限。而当我们把目光投向轻量级、本地化、可调试性强的 RAG 实践路径时,Ollama 便不再只是“跑 Llama 的玩具工具”,而是一套嵌入即服务(Embedding-as-a-Service)的微型运行时内核。