第7章DQN算法


文档摘要

第 7 章 DQN 算法 $\qquad$ 本章开始进入深度强化学习的部分,我们首先从 $\text{DQN}$ 算法开始讲起。$\text{DQN}$ 算法,英文全称 $\text{Deep Q-Network}$ , 顾名思义,它的主要贡献就是在 $\text{Q-learning}$ 算法的基础上引入了深度神经网络来近似动作价值函数 $Q(\boldsymbol{s},\boldsymbol{a})$,从而能够处理高维的状态空间。$\text{DQN}$ 算法主要由 $\text{DeepMind}$ 公司于 $\text{2013}$ 年 ① 和 $\text{2015}$ 年 ② 分别提出的两篇论文来实现,其中后者是比较成熟的版本,也是本章讲解的重点。


发布者: 作者: 转发
评论区 (0)
U