8.1 硬件加速仿真:GPU 上的 MuJoCo (MuJoCo XLA) 在物理仿真领域,长久以来存在着一道隐秘却坚硬的“时延之墙”:当研究人员试图将一个包含数百自由度、多接触点、非线性约束与实时反馈的仿生机器人模型推入高保真仿真环境时,CPU 上的 MuJoCo 往往在 100–500 Hz 的仿真步频前便开始喘息——不是因为模型不够精巧,而是因为经典数值求解器的计算范式,正日益撞上冯·诺依曼架构的内存墙与指令吞吐天花板。这道墙不声不响,却真实阻隔了从“可仿真”到“可交互”、从“离线训练”到“在线闭环”的跃迁。