CV基础知识 为什么需要做特征归一化、标准化? 使不同量纲的特征处于同一数值量级,减少方差大的特征的影响,使模型更准确。 加快学习算法的收敛速度。 参考资料: 归一化 (Normalization)、标准化 (Standardization)和中心化/零均值化 (Zero-centered),《百面机器学习》 常用常用的归一化和标准化的方法有哪些? 线性归一化(min-max标准化) x’ = (x-min(x)) / (max(x)-min(x)),其中max是样本数据的最大值,min是样本数据的最小值 适用于数值比较集中的情况,可使用经验值常量来来代替max,min 标准差归一化(z-score 0均值标准化) x’=(x-μ) / σ,其中μ为所有样本的均值,σ为所有样本的标准差