10.6 实践中PCA的关键步骤 接下来,我们将通过一个连续的例子来逐步介绍PCA的各个步骤,这些步骤总结在图10.11中。我们有一个二维数据集(图10.11(a)),我们想要使用PCA将其投影到一个一维子空间上。 1723957718330 图10.11PCA.(a)原始数据集的步骤;(b)定中;(c)除以标准差;(d)特征分解;(e)投影;(f)映射回原始数据空间。 均值归零:我们首先通过计算数据集的均值$\mu$,并从每个数据点中减去这个均值来中心化数据。这确保了数据集的平均值为0(图10.11(b))。均值归零虽然不是严格必要的,但它降低了数值问题的风险。 标准化:对于每个维度$d=1,\ldots,D$,我们将数据点除以数据集的标准差$\sigmad$。