3.2 常见函数逼近器：线性模型、支持向量机、神经网络

文档摘要

3.2 常见函数逼近器：线性模型、支持向量机、神经网络强化学习与智能体训练：从 Q-Learning 到深度强化学习强化学习中的函数逼近：让智能体学会“举一反三”的艺术在强化学习的广阔天地中，我们经常会遇到一个棘手的问题：当状态空间（或动作空间）变得异常庞大，甚至无限时，我们如何才能有效地存储和更新智能体的策略或价值函数呢？传统的表格型方法（比如经典的Q-Table）在这种情况下就显得力不从心了，它们就像一个内存有限的“小脑瓜”，无法记住所有的可能性。这时候，函数逼近（Function Approximation）就如同一位“智者”闪亮登场了！