3.1.3 预训练策略:互联网规模数据与机器人数据的混合训练


文档摘要

3.1.3 预训练策略:互联网规模数据与机器人数据的混合训练 当机器人在互联网里“呛水”:混合预训练中数据分布偏移的动态重加权实战手记 你有没有试过,把一台刚出厂的双臂机器人丢进ImageNet、LAION、Common Crawl的洪流里,再配上几万条真实机械臂抓取视频帧——结果模型在仿真环境里准确率飙到92%,一上真机却连拧开矿泉水瓶盖都频频打滑?不是它学不会,是它根本没“听懂”你在说什么。 这不是泛泛而谈的“领域迁移失败”,而是一个被多数论文轻轻带过的刺:互联网规模数据与机器人数据在语义粒度、动作时序、物理约束、标注噪声四个维度上存在不可忽略的结构性错位。它不爆发于最终评估,而潜伏在预训练第17轮loss曲线的细微抖动里;


发布者: 作者: 转发
评论区 (0)
U