始终学习始终混合：面向多模态模型全周期的高效数据混合方法

Always Learning, Always Mixing：OP-Mix 的深度解读——重构语言模型训练的连续性范式 📋 论文基本信息标题：Always Learning, Always Mixing: Efficient and Simple Data Mixing All The Time 作者：Michael Y. Hu, Apurva Gandhi, Kyunghyun Cho, Tal Linzen, Pratyusha Sharma ArXiv ID：arXiv:2605.15220v1（提交于2026年5月18日）领域分类：cs.CL（Computation and Language）、cs.AI（Artificial Intelligence）、cs.LG（Machi...

Always Learning, Always Mixing：OP-Mix 的深度解读——重构语言模型训练的连续性范式 📋 论文基本信息标题：Always Learning, Always Mixing: Efficient and Simple Data Mixing All The Time 作者：Michael Y. Hu, Apurva Gandhi, Kyunghyun Cho, Tal Linzen, Pratyusha Sharma ArXiv ID：arXiv:2605.15220v1（提交于2026年5月18日）领域分类：cs.CL（Computation and Language）、cs.AI（Artificial Intelligence）、cs.LG（Machine Learning）核心主张：数据混合（data mixing）不应被割裂为预训练、持续学习、指令微调等孤立阶段的工程技巧，而应建模为一个贯穿整个训练生命周期的在线策略优化问题；为此提出OP-Mix（On-Policy Mix）——首个统一、高效、无需代理模型（proxy-free）、完全在策...