4.3 正则化(Regularization) 4.3 正则化(Regularization) 在构建和训练深度卷积神经网络(CNN)用于图像识别任务时,一个核心挑战是如何确保模型不仅在训练数据上表现良好,还能泛化到未见过的新数据上。当模型在训练集上表现出色,但在测试集上性能显著下降时,就发生了过拟合(Overfitting)。过拟合意味着模型学习到了训练数据中的噪声和特定模式,而不是数据背后真正的、具有普遍性的规律。正则化是解决过拟合问题的一系列重要技术。 4.3.1 过拟合问题 CNN模型,特别是那些拥有大量参数的深层网络,具有很强的学习能力。如果训练数据量相对较小,或者模型复杂度过高,模型很容易“记住”训练样本的细节,而非抽象出普适的特征。