3.1.3 预训练策略：互联网规模数据与机器人数据的混合训练

文档摘要

3.1.3 预训练策略：互联网规模数据与机器人数据的混合训练当机器人在互联网里“呛水”：混合预训练中数据分布偏移的动态重加权实战手记你有没有试过，把一台刚出厂的双臂机器人丢进ImageNet、LAION、Common Crawl的洪流里，再配上几万条真实机械臂抓取视频帧——结果模型在仿真环境里准确率飙到92%，一上真机却连拧开矿泉水瓶盖都频频打滑？不是它学不会，是它根本没“听懂”你在说什么。这不是泛泛而谈的“领域迁移失败”，而是一个被多数论文轻轻带过的刺：互联网规模数据与机器人数据在语义粒度、动作时序、物理约束、标注噪声四个维度上存在不可忽略的结构性错位。它不爆发于最终评估，而潜伏在预训练第17轮loss曲线的细微抖动里；