9.3 伦理与治理 第九章:高级课题、伦理与未来趋势 9.3 伦理与治理 ——不是在模型训练完之后贴上“伦理补丁”,而是在梯度下降的每一步,都嵌入可验证的价值约束 我们常把多智能体系统(MAS)比作一座城市:每个智能体是行人、司机、红绿灯、甚至交管中心;它们不靠中央指令,而是通过局部观测、策略交互与环境反馈自发形成交通流。但当一辆自动驾驶网约车为避让闯入斑马线的儿童而急转,撞上路边修车工的工具箱,导致其手指被飞溅的扳手削断——责任该由谁承担?是那个调用了 输出动作概率的策略网络?是部署该模型的车队运营方?还是批准其上线的城市交通委员会?