1.1.1 Ollama 的定义:本地 LLM 编排与运行引擎 Ollama 是什么?这个问题在2024年已不再只是“一个能跑 Llama 的命令行工具”这般轻描淡写。它是一套以 Unix 哲学为内核、以容器化思维重构大模型生命周期的本地运行时系统——不是模型仓库,不是推理框架,更不是又一个 Python 包管理器;它是你笔记本上那台“LLM 操作系统”的内核态与用户态的统一体。当我们说“Ollama 是本地 LLM 编排与运行引擎”,这八个字背后,是进程隔离、内存映射、分层缓存、模型图编译、GPU 内存仲裁、上下文流控、以及一套被精心压制到极致的 C 语言 runtime 所共同编织的精密织物。