其他常用模型 R语言中的常用统计分析与建模模型详解 1. 决策树 (Decision Tree) 决策树是一种非参数的监督学习方法,用于分类和回归任务。它通过构建树状结构,根据特征对数据进行分割,最终预测目标变量。 原理: 决策树的核心思想是递归分割。算法选择一个最优特征,根据该特征将数据分成若干个子集。然后在每个子集上重复这个过程,直到满足停止条件(例如,子集中的样本属于同一类别,或达到最大树深度)。 常用的分割标准包括: 分类树 (Classification Tree): 信息增益 (Information Gain): 基于信息熵的减少量。 基尼指数 (Gini Index): 衡量样本集合纯度的指标。