5.3 避免过拟合与欠拟合 5.3 避免过拟合与欠拟合 在文本分类和情感分析任务中,模型训练的核心目标是使其具备良好的泛化能力,即在未见过的新文本数据上也能做出准确的预测。然而,训练过程中常常会遇到两个主要的挑战:过拟合(Overfitting)和欠拟合(Underfitting)。理解并有效应对这两个问题,是构建高性能、鲁棒性强的文本分类/情感分析模型的关键。 本章节将深入探讨过拟合与欠拟合的现象、原因及其在文本数据上的具体表现,并详细介绍一系列实用的检测和缓解策略。 5.3.1 理解过拟合与欠拟合 欠拟合 (Underfitting) 定义: 欠拟合是指模型在训练集上表现不佳,无法捕捉数据中的基本模式。这意味着模型对于训练数据本身的复杂性学习不足。