5.3 神经网络作为函数近似器（深度强化学习初步）

文档摘要

5.3 神经网络作为函数近似器（深度强化学习初步） 5.3 神经网络作为函数近似器（深度强化学习初步） 5.3.1 引言：为什么需要神经网络？在强化学习中，智能体的目标是学习一个策略，使其在给定的环境中获得最大的累积奖励。在状态空间较小的情况下，我们可以使用表格型方法（例如 Q-table）来存储每个状态-动作对的价值，并使用诸如 Q-learning 或 SARSA 等算法来更新这些价值。会员。《5.3 神经网络作为函数近似器（深度强化学习初步）》收录于灏天文库文集《强化学习入门：探索智能体的决策之路》，提供技术教程、实践指南与问题解决方案，支持在线阅读、全文检索与知识沉淀，助力开发者系统化学习。文档编号21864。

该文档为会员专享，请先登录或注册后再查看

登录注册