神经网络的优化器(六)AdaGrad


文档摘要

每天3分钟,彻底弄懂神经网络的优化器(六)AdaGrad AdaGrad算法的提出 AdaGrad(Adaptive Gradient Algorithm)是由 John Duchi, Elad Hazan, 和 Yoram Singer 提出的。这个算法在2011年的论文《Adaptive Subgradient Methods for Online Learning and Stochastic Optimization》1 中被详细描述,并发表在了《Journal of Machine Learning Research》上。AdaGrad算法的主要特点是为每个参数独立地调整学习率,使得不频繁更新的参数可以获得更大的学习率,而频繁更新的参数则获得较小的学习率。


发布者: 作者: 转发
评论区 (0)
U