3.3 降维与聚类分析 3.3 降维与聚类分析:在高维细胞宇宙中绘制可解释的拓扑星图 当我们站在单细胞转录组数据的洪流之畔,眼前并非一片静水,而是一片由数万个基因、数十万细胞共同构成的湍急星云——每个细胞是星云中一颗微光闪烁的恒星,其表达谱是它在多维空间中的坐标;每条基因是一条隐秘的引力线,既塑造局部结构,又参与全局构型。原始矩阵 $\mathbf{X} \in \mathbb{R}^{n \times p}$($n$ 为细胞数,$p \sim 10^4$–$10^5$ 为基因数)看似规整,实则深陷“维度诅咒”(curse of dimensionality)的泥沼:欧氏距离退化、稀疏性加剧、噪声主导信噪比、统计功效坍缩。