CartPoleSkating


文档摘要

CartPole Skating 我们在上一课中一直在解决的问题可能看起来像一个玩具问题,并不真正适用于现实生活场景。事实并非如此,因为许多现实世界的问题也有这种情况——包括下国际象棋或围棋。它们很相似,因为我们也有一个具有给定规则和离散状态的板。 https://white-water-09ec41f0f.azurestaticapps.net/ 课前测验 介绍 在本课中,我们将把 Q-Learning 的相同原理应用到具有连续状态的问题,比如由一个或多个实数给出的状态。我们将处理以下问题: 问题:如果彼得想要逃离狼群,他需要能够移动得更快。我们将看到彼得如何使用 Q-Learning 学习滑冰,特别是保持平衡。 大逃亡! 彼得和他的朋友们发挥创意来逃离狼!


发布者: 作者: 转发
评论区 (0)
U