神经网络的优化器(一)概述


文档摘要

每天3分钟,彻底弄懂神经网络的优化器optimizer(一)概述 optimizer负责在训练过程中更新模型的参数, 目的是通过调整参数来最小化损失函数,即模型预测和实际数据之间的差异. alt text 从1951年Herbert Robbins和Sutton Monro在其题为“随机近似方法”的文章中提出SGD,到2017年出现的AdamW成为最主流的选择,优化器的发展经历了70多年的时间。本系列从时间的角度出发,对神经网络的优化器进行梳理,希望能够帮助大家更好地理解优化器的发展历程。


发布者: 作者: 转发
评论区 (0)
U