文档摘要
随机森林面试题 简单介绍随机森林 一种基于树模型的Bagging的优化版本,一棵树的生成肯定还是不如多棵树,因此就有了随机森林,解决决策树泛化能力弱的特点。 多次随机取样,多次随机取属性,选取最优分割点,构建多个(CART)分类器,投票表决 算法流程: 输入为样本集$D=\{(x,y1),(x2,y2) \dots (xm,ym)\}$,弱分类器迭代次数$T$。 输出为最终的强分类器$f(x)$ 对于$t=1,2 \dots T$ 对训练集进行第$t$次随机采样,共采集$m$次,得到包含$m$个样本的采样集Dt