10.8 拓展阅读 我们从两个角度推导了PCA:(a)最大化投影空间中的方差;(b)最小化平均重构误差。然而,PCA也可以从不同角度进行解释。让我们回顾一下我们所做的:我们采用了高维数据$x\in\mathbb{R}^D$,并使用矩阵$B^\top$来找到一个低维表示$z\in\mathbb{R}^M$。矩阵$B$的列是数据协方差矩阵$S$与最大特征值相关联的特征向量。一旦我们有了低维表示$z$,我们就可以通过$x\approx\tilde{x}=Bz=BB^\top x\in\mathbb{R}^D$得到其高维版本(在原始数据空间中),其中$BB^\top$是一个投影矩阵。 我们还可以将PCA视为如图10.16所示的线性自编码器。