6.3.2.1 高维数据降维


文档摘要

6.3.2.1 高维数据降维 6.3.2.1 高维数据降维:当 t-SNE 的“引力坍缩”吞噬你的聚类结构——一次生产环境中的降维灾难与可复现的修复方案 你有没有在凌晨两点盯着一张扁平、糊成一团的 t-SNE 散点图发呆? 图上本该清晰分离的三类客户群体,像被同一台劣质搅拌机搅过——边界模糊、簇内撕裂、甚至出现诡异的“孤岛点”;而下游模型在嵌入空间上训练时,AUC 不升反降,特征重要性排序彻底失序。 你反复检查数据预处理流程:标准化做了,缺失值填充了,异常值剔除了;你调大 perplexity,从 30 拉到 100,又缩回 5;你试过 PCA 初始化,换过不同随机种子,甚至重装了 ……结果只换来一句冷静的警告: 这不是参数没调好——这是你在用一把钝刀解剖高维流形。


发布者: 作者: 转发
评论区 (0)
U