4.3 训练与优化基础 (反向传播、梯度下降、优化器) 4.3 训练与优化基础 深度学习模型的训练是一个迭代的过程,目标是找到一组参数,使得模型在训练数据上的损失函数最小化。这个过程的核心在于反向传播算法和梯度下降优化方法,以及各种优化器的应用。 4.3.1 反向传播 (Backpropagation) 反向传播是深度学习模型训练的核心算法,它用于计算损失函数关于模型参数的梯度。这个梯度指示了参数应该如何调整,才能减小损失函数。 基本原理: 反向传播基于链式法则,将损失函数对最终输出的梯度,逐层反向传递到模型的每一层,从而计算出每一层参数的梯度。 前向传播 (Forward Pass): 输入数据通过模型,逐层计算输出,直到得到最终的预测结果。