8.1 硬件加速仿真：GPU 上的 MuJoCo (MuJoCo XLA)

文档摘要

8.1 硬件加速仿真：GPU 上的 MuJoCo (MuJoCo XLA) 在物理仿真领域，长久以来存在着一道隐秘却坚硬的“时延之墙”：当研究人员试图将一个包含数百自由度、多接触点、非线性约束与实时反馈的仿生机器人模型推入高保真仿真环境时，CPU 上的 MuJoCo 往往在 100–500 Hz 的仿真步频前便开始喘息——不是因为模型不够精巧，而是因为经典数值求解器的计算范式，正日益撞上冯·诺依曼架构的内存墙与指令吞吐天花板。这道墙不声不响，却真实阻隔了从“可仿真”到“可交互”、从“离线训练”到“在线闭环”的跃迁。