2.3 集成学习 2.3 集成学习 集成学习(Ensemble Learning)是一种通过组合多个模型(通常称为“基学习器”或“弱学习器”)来解决同一问题的方法。其核心思想是“三个臭皮匠顶个诸葛亮”,即多个模型的集体智慧往往优于单一模型的性能。集成学习旨在通过结合多个模型的预测结果,来提高整体模型的准确性、稳定性和泛化能力。 核心原理 集成学习之所以有效,主要依赖于以下两个方面: 多样性(Diversity):构成集成的各个基学习器应该在某种程度上是不同的。这种差异性可以体现在数据样本、特征子集、模型类型或模型参数等方面。如果所有基学习器都犯相同的错误,那么它们的组合将无法纠正这些错误。多样性使得不同的基学习器能够从不同的角度学习数据的模式,从而在集成时互相补充,减少整体误差。