1.1 项目起源与哲学 1.1 项目起源与哲学 在人工智能技术浪潮席卷全球的当下,大语言模型(LLM)无疑是最耀眼的明珠。然而,在 2023 年初,当科技巨头们竞相宣布其基于数千块 H100 GPU 训练而成的闭源或半开源模型时,一个深刻的技术鸿沟横亘在普通开发者与这些“数字智慧”之间:高昂的硬件门槛与臃肿的软件依赖。正是在这种算力垄断与代码膨胀的背景下,Llama.cpp 应运而生。它不仅仅是一个推理引擎的代码库,更是一场关于“算力民主化”的技术宣言。本章将深入剖析这一项目的起源脉络、核心哲学以及其背后蕴含的深邃技术思考,揭示它是如何以极简主义的代码重构了 AI 推理的底层逻辑。 1.1.1 破局者:Georgi Gerganov 与 ggml 的技术基因 Llama.