- 文集信息
- 目录大纲
- 最新文档
- 知识宇宙
文集详情
文集导读
大语言模型是如何工作的?本文集从零开始讲解 LLM 的底层原理:Transformer 架构(自注意力机制、位置编码、层归一化)、预训练与微调(SFT、RLHF)、解码策略(Greedy、Beam Search、Temperature)、以及模型优化(量化、蒸馏、Flash Attention)。适合想深入理解 AI 内核的开发者和研究者。
目录大纲
最新文档
知识宇宙
正在加载知识图谱...