正则化方法概述 参数范数正则化 正则化方法概述 数据集 训练集(Trainingset):用于模型拟合的数据样本 验证集(Validation set):是模型训练过程中单独留出的样本集,它可以用于调整模型的超参数和用于对模型的能力进行初步评估,例如SVM中参数c和核函数的选择,或者选择网络结构 测试集(Testset):用来评估模最终模型的泛化能力,但不能作为调参、选择特征等算法相关的选择的依据 过拟合 过拟合是指模型能很好地拟合训练样本,而无法很好地拟合测试样本的现象,从而导致泛化性能下降;为防止“过拟合”,可以选择减少参数、降低模型复杂度、正则化等。 欠拟合 欠拟合是指模型还没有很好地训练出数据的一般规律,模型拟合程度不高的现象;