第六章 大模型训练流程实践 6.1 模型预训练 在上一章,我们逐步拆解了 LLM 的模型结构及训练过程,从零手写实现了 LLaMA 模型结构及 Pretrain、SFT 全流程,更深入地理解了 LLM 的模型原理及训练细节。但是,在实际应用中,手写实现的 LLM 训练存在以下问题: 手写实现 LLM 结构工作量大,难以实时跟进最新模型的结构创新; 从零实现的 LLM 训练无法较好地实现多卡分布式训练,训练效率较低;