文集文档索引

大模型底层原理:Transformer 与解码


  • 文集信息
  • 目录大纲
  • 最新文档
  • 知识宇宙

文集详情

文集导读

大语言模型是如何工作的?本文集从零开始讲解 LLM 的底层原理:Transformer 架构(自注意力机制、位置编码、层归一化)、预训练与微调(SFT、RLHF)、解码策略(Greedy、Beam Search、Temperature)、以及模型优化(量化、蒸馏、Flash Attention)。适合想深入理解 AI 内核的开发者和研究者。

目录大纲

    最新文档

    知识宇宙

    正在加载知识图谱...


    转发