1.3 强化学习任务类型:回合式、连续式、探索与利用困境 1.3 强化学习任务类型:回合式、连续式、探索与利用困境 亲爱的读者,欢迎来到强化学习的奇妙世界!在之前的章节中,我们已经对强化学习有了一个初步的认识。现在,我们将深入探讨强化学习任务的不同类型,这就像是给不同性格的“智能体”分配不同的“工作”。理解这些任务类型,对于我们设计和训练高效的智能体至关重要。同时,我们还会揭开强化学习中最迷人也最令人头疼的“探索与利用困境”的面纱。准备好了吗?让我们一起踏上这场知识的旅程! 1.3.1 回合式任务:有始有终的旅程 想象一下,你正在玩一盘国际象棋。每一步棋都是一个决策,最终会有一个明确的结局——赢、输或平局。这就是一个典型的“回合式任务”。 什么是回合式任务?