3.2 常见函数逼近器:线性模型、支持向量机、神经网络


文档摘要

3.2 常见函数逼近器:线性模型、支持向量机、神经网络 强化学习与智能体训练:从 Q-Learning 到深度强化学习 强化学习中的函数逼近:让智能体学会“举一反三”的艺术 在强化学习的广阔天地中,我们经常会遇到一个棘手的问题:当状态空间(或动作空间)变得异常庞大,甚至无限时,我们如何才能有效地存储和更新智能体的策略或价值函数呢?传统的表格型方法(比如经典的Q-Table)在这种情况下就显得力不从心了,它们就像一个内存有限的“小脑瓜”,无法记住所有的可能性。 这时候,函数逼近(Function Approximation)就如同一位“智者”闪亮登场了!


发布者: 作者: 转发
评论区 (0)
U