第二章:模型存储格式与演进:从 GGML 到 GGUF 第二章:模型存储格式与演进:从 GGML 到 GGUF 在人工智能大模型浪潮席卷全球的今天,我们正见证着一场前所未有的计算范式转移。这场转移的核心,并非仅仅发生在拥有数万张 H100 GPU 的超算中心,更悄然发生在千家万户的桌面电脑、甚至口袋里的边缘设备之中。Llama.cpp 项目的诞生,犹如一把燧石,点燃了本地大模型推理的旷野之火。然而,任何宏大的软件工程奇迹,都必须建立在坚实的底座之上。对于 Llama.cpp 而言,这个底座不仅仅是高效的 C++ 代码,更是承载着万亿参数重量的模型存储格式。