5.1 为什么需要函数近似

文档摘要

5.1 为什么需要函数近似 5.1 为什么需要函数近似在强化学习中，我们训练智能体（Agent）与环境交互，学习一个策略，使其在长期内获得最大的累积奖励。在状态空间较小的情况下，我们可以使用表格型方法，例如Q-learning或SARSA，直接为每个状态（或状态-动作对）存储其价值（或Q值）。然而，当状态空间变得非常大甚至连续时，表格型方法将不再适用。本节将详细探讨为什么需要函数近似，以及表格型方法在大规模状态空间中遇到的问题。会员。《5.1 为什么需要函数近似》收录于灏天文库文集《强化学习入门：探索智能体的决策之路》，提供技术教程、实践指南与问题解决方案，支持在线阅读、全文检索与知识沉淀，助力开发者系统化学习。文档编号21862。

该文档为会员专享，请先登录或注册后再查看

登录注册