7.3 容器化与集群部署 在生成式AI基础设施的演进图谱中,Ollama从来不只是一个本地模型运行器——它是一把解构大模型部署范式的钥匙。当我们站在第七章“安全、网络与生产部署”的宏观高点俯瞰,7.3节“容器化与集群部署”便不再是技术选型的罗列清单,而是一道承上启下的结构性分水岭:它承接第六章所确立的模型服务化契约(API抽象、上下文管理、量化推理一致性),又为第八章的可观测性治理、第九章的多租户策略引擎埋下运行时锚点。这里没有“能跑就行”的权宜之计,只有对确定性、可移植性、弹性边界与硬件亲和力四重张力的系统性调和。 一、容器化:从单机玩具到生产契约的范式跃迁 初识Ollama者常陷于一种认知惯性: 是一条命令,一个进程,一次交互。