第10章主成分分析与降维


文档摘要

第10章 主成分分析与降维 直接处理高维数据(如图像)会带来一些困难:难以分析、解释困难、几乎不可能可视化,而且(从实际角度来看)数据向量的存储成本可能很高。然而,高维数据往往具有我们可以利用的特性。例如,高维数据通常是冗余的,即许多维度是多余的,可以通过其他维度的组合来解释。此外,高维数据中的维度往往相互关联,从而使数据具有固有的低维结构。降维利用这种结构和相关性,使我们能够使用更紧凑的数据表示方式,理想情况下不会丢失信息。我们可以将降维视为一种压缩技术,类似于jpeg或mp3,这些是图像和音乐的压缩算法。 在本章中,我们将讨论主成分分析(PCA),这是一种线性降维算法。


发布者: 作者: 转发
评论区 (0)
U