6.4 深度强化学习 (Deep Reinforcement Learning) 基础 6.4 深度强化学习 (Deep Reinforcement Learning) 基础 强化学习 (Reinforcement Learning, RL) 是一种让智能体 (Agent) 在与环境 (Environment) 交互的过程中学习最优策略,以最大化累积奖励的学习方法。深度强化学习 (Deep Reinforcement Learning, DRL) 则将深度学习的强大表征能力引入强化学习,使得智能体能够处理高维、复杂的环境,从而解决传统强化学习方法难以应对的问题。 6.4.1 强化学习基础回顾 在深入DRL之前,我们先回顾一下强化学习的基本概念: 智能体 (Agent): 做出决策的实体。