1.2 核心定义与关键术语 1.2 核心定义与关键术语 当我们站在大模型技术浪潮的顶端,俯瞰整个生成式 AI 的生态系统时,不难发现,虽然云端算力如日中天,但边缘计算的潜力正蓄势待发。在第一章的宏观叙述中,我们探讨了 Llama.cpp 作为一个技术现象级项目,如何重塑了大众对大模型运行环境的认知。然而,要真正理解 Llama.cpp 为何能在资源受限的设备上“以小博大”,我们必须剥开其表面的应用光鲜,深入到底层的代码逻辑与工程架构之中。这一节将作为连接宏观愿景与微观实现的桥梁,我们将不再满足于“它是什么”的浅层描述,而是要系统地剖析“它是如何被定义的”以及“支撑其运行的关键术语是什么”。这不仅是一次概念的梳理,更是一场关于计算效率、内存管理与硬件亲和力的深度对话。 1.2.