第11章 特征选择与稀疏学习


文档摘要

11.1 $$ \operatorname{Gain}(A)=\operatorname{Ent}(D)-\sum{v=1}^{V} \frac{\left|D^{v}\right|}{|D|} \operatorname{Ent}\left(D^{v}\right) $$ [解析]:此为信息增益的定义式,对数据集$D$和属性子集$A$,假设根据$A$的取值将$D$分为了$V$个子集$\{D^1,D^2,\dots,D^V\}$,那么信息增益的定义为划分之前数据集$D$的信息熵和划分之后每个子数据集$D^v$的信息熵的差。熵用来衡量一个系统的混乱程度,因此划分前和划分后熵的差越大,表示划分越有效,划分带来的”信息增益“越大。 11.


发布者: 作者: 转发
评论区 (0)
U