Qwen2.5VLGRPOwithSGLang


文档摘要

Qwen2.5VL GRPO with SGLang 环境配置 创建新的 docker 使用前需要配置好 ,参考这个过程。 进入 docker 后,可以查看被映射的环境变量: 以后每次从 docker 里面 exit 出来,再用这个指令可以重启: 基于源码安装 SGLang 配置 python 环境 先安装 veRL,再安装 SGLang。 如果遇到这个报错: 按照下面的步骤 fix 后安装 SGLang,为了对齐 torch 版本。 额外安装 依赖: 8 卡启动 Qwen2.5VL GRPO 训练脚本,并且使用 SGLang 作为 rollout 引擎 打开你 docker 里面的 文件,去掉 examples/grpotrainer/runqwen25vl-7b.


发布者: 作者: 转发
评论区 (0)
U