经典强化学习论文解读 该部分是蘑菇书的扩展内容,整理&总结&解读强化学习领域的经典论文。主要有DQN类、策略梯度类、模仿学习类、分布式强化学习、多任务强化学习、探索策略、分层强化学习以及其他技巧等方向的论文。后续会配有视频解读(与WhalePaper合作),会陆续上线Datawhale B站公众号。 每周更新5篇左右的论文,欢迎关注。 如果在线阅读Markdown文件有问题(例如公式编译错误、图片显示较慢等),请下载到本地阅读,或观看PDF文件夹中的同名文件。