6.3.2 噪声与演化鲁棒性

文档摘要

6.3.2 噪声与演化鲁棒性在多智能体系统中，当博弈结构本身随时间演化、策略空间持续扩展、个体学习能力受限且观测充满不确定性时，“均衡”不再是一个静态的解集，而是一段在噪声洪流中顽强存续的动态轨迹。这正是6.3.2 噪声与演化鲁棒性所直面的核心困境——它不问“是否存在马尔可夫完美均衡（MPE）”，而追问：“当观测被高斯噪声淹没、当对手策略以$10^{-3}$量级随机漂移、当环境状态转移概率每轮扰动$\delta \sim \mathcal{N}(0, 0.02^2)$时，一个宣称收敛的MPE算法，其策略输出是否仍在支撑集内稳定？其价值函数估计误差是否仍被控制在$\varepsilon = 0.05$以内？