3.2.2 因果推理与物理常识在决策中的作用 当物理常识失效时,你的强化学习策略正在“撞墙”——一个被忽略的因果干预项如何让机械臂在0.3秒内规避重力坍塌 凌晨两点十七分,产线上的Delta并联机械臂第17次在抓取320g陶瓷基板时发生末端抖动,继而触发急停。日志里没有报错,PID参数纹丝不动,仿真环境里它优雅如初。工程师小陈盯着监控画面里那帧慢动作:夹爪刚闭合,臂杆就以一种教科书级的“非预期弯曲”向左偏转了4.2°——不是电机响应延迟,不是编码器漂移,而是系统在决策时,把重力当作了一个可忽略的常量,而非一个随姿态角θ实时变化的、具有明确因果方向的矢量力。 这不是故障,是认知断层。