2.3 集成学习

文档摘要

2.3 集成学习 2.3 集成学习集成学习（Ensemble Learning）是一种通过组合多个模型（通常称为“基学习器”或“弱学习器”）来解决同一问题的方法。其核心思想是“三个臭皮匠顶个诸葛亮”，即多个模型的集体智慧往往优于单一模型的性能。集成学习旨在通过结合多个模型的预测结果，来提高整体模型的准确性、稳定性和泛化能力。核心原理集成学习之所以有效，主要依赖于以下两个方面：多样性（Diversity）：构成集成的各个基学习器应该在某种程度上是不同的。这种差异性可以体现在数据样本、特征子集、模型类型或模型参数等方面。如果所有基学习器都犯相同的错误，那么它们的组合将无法纠正这些错误。多样性使得不同的基学习器能够从不同的角度学习数据的模式，从而在集成时互相补充，减少整体误差。