大模型底层原理：Transformer 与解码

文集信息
目录大纲
最新文档
知识宇宙

文集详情

文集导读

大语言模型是如何工作的？本文集从零开始讲解 LLM 的底层原理：Transformer 架构（自注意力机制、位置编码、层归一化）、预训练与微调（SFT、RLHF）、解码策略（Greedy、Beam Search、Temperature）、以及模型优化（量化、蒸馏、Flash Attention）。适合想深入理解 AI 内核的开发者和研究者。

目录大纲

知识宇宙

正在加载知识图谱...

文集文档索引

大模型底层原理：Transformer 与解码

文集详情

文集导读

目录大纲

最新文档

知识宇宙