8.3.2 仿真与现实 (Sim-to-Real) 的差距分析与弥补 (Domain Randomization) 在机器人控制、自动驾驶、工业分拣等真实物理系统中,我们常常面临一个令人沮丧的悖论:一个在仿真环境中表现惊艳的强化学习策略,一旦部署到真实机械臂上,可能连最基础的抓取动作都会失败——它会把物体推飞、撞歪夹爪、甚至因关节力矩突变而触发急停。这不是算法不够强,也不是网络不够深,而是仿真与现实之间横亘着一道幽微却致命的“域鸿沟”(Domain Gap)。它不显山露水,却悄然吞噬着90%以上的仿真训练成果。而Domain Randomization(域随机化),正是我们向这道鸿沟投出的第一支精准标枪。