Q-learning

文档摘要

默认的算法参数配置在中，具体请分别参考各算法说明。 Q-learning 注意：设置可以得到固定的。参数说明：适当调整以保证在训练过程中不会过早衰减。由于传统强化学习算法面对的环境都比较简单，因此一般设置为，且可以设置得比较大如，不用太担心过拟合的情况。 DQN