默认的算法参数配置在 中,具体请分别参考各算法说明。 Q-learning 注意: 设置 可以得到固定的 。 参数说明: 适当调整 以保证 在训练过程中不会过早衰减。 由于传统强化学习算法面对的环境都比较简单,因此 一般设置为 ,且 可以设置得比较大如 ,不用太担心过拟合的情况。 DQN