3.2.2 元数据驱动存储:无索引、全列统计 3.2.2 元数据驱动存储:无索引、全列统计——一场静默的存储范式革命 你有没有想过,当数据库在凌晨三点因一个 查询而 CPU 暴涨到 98%,而这张表明明只有 12 个字段、2.3 亿行、每天新增 800 万条——问题真的出在“数据太多”上吗?还是出在我们固执地用索引去驯服数据,却忘了数据本身早已在沉默中完成了自我描述? 这不是一个假设性问题。它真实发生在某头部实时风控平台的 OLAP 分析链路中:工程师花了三周优化 B+ 树索引、调整分区键、引入物化视图,最终发现——真正拖垮查询的是元数据缺失导致的全表扫描盲区:系统无法预判 列的基数分布是否陡峭,无法判断 列的时间戳是否高度倾斜,更无法知晓 列的取值是否仅限于 三个枚举值。