SGLang模型加载过程


文档摘要

SGLang 模型加载过程 Overview SGLang 的模型加载过程由 文件夹中的代码实现。 在 中定义了 函数,负责根据 获取相应的 ,并调用 实际加载模型: 下面以 为例,详细介绍如何从开放权重文件加载模型到 SGLang 中。 DefaultModelLoader loader.loadmodel: 模型初始化 (initializemodel) 调用 ,根据 获取模型架构。 会返回实际的模型类。 调用 ,根据 和 获取 : 在实际初始化模型时, 层(如 等)会在 中调用 。对于没有量化方法的模型, 会被设置为 ,其 方法会创建指定形状和数据类型的权重参数,并设置输入输出维度等元信息,最终将其注册到层中供后续使用。 在 层的 函数中,会调用 进行实际计算。 loader.


发布者: 作者: 转发
评论区 (0)
U