8.2.2.1 列族配置 8.2.2.1 列族配置:当 default 列族开始“假装自己很忙”——一次因 配置失当引发的写放大雪崩与修复实录 凌晨两点十七分,监控告警第三次弹窗——不是 CPU,不是内存,甚至不是磁盘 IO 等待队列,而是 RocksDB 的 在 90 秒内从 120 万飙升至 470 万,伴随 每秒突增 3.8 亿微秒(即每秒近 380 秒的写阻塞),写入吞吐断崖式下跌 83%。服务端日志里反复滚动着同一行警告: 这不是第一次。过去三个月,团队已在三个不同集群复现过类似症状:高峰写入时延迟毛刺、LSM 树层级异常膨胀、Compaction 吞吐持续低于预期……所有线索都指向一个被我们长期忽略的“默认正确”假设——default 列族的配置,天然适配所有场景。 它不配。