第 8 章 DQN算法进阶 $\qquad$ 本章将介绍一些基于 $\text{DQN}$ 改进的一些算法。这些算法改进的角度各有不同,例如, $\text{Double DQN}$ 以及 $\text{Dueling DQN}$ 等算法主要从网络模型层面改进,而 $\text{PER DQN}$ 则从经验回放的角度来改进。尽管这些算法看起来各有不同,但是本质上都是通过提高预测的精度和控制过程中的探索度来改善 $\text{DQN}$ 算法的性能。并且这些算法用到的技巧也都是比较通用的,读者可以根据自己的需求进行灵活的组合。 8.