8.2.1.1 过期清理策略 8.2.1.1 过期清理策略:别让TTL变成“定时炸弹”——一个被低估的 RocksDB 后台压缩陷阱与精准干预方案 你有没有遇到过这样的场景? Flink 作业跑得好好的,状态大小稳定在 2GB 左右,Checkpoint 成功率 99.8%,监控曲线平滑如镜。可某天凌晨三点,TaskManager 突然 OOM,日志里只有一行刺眼的 ;重启后,状态恢复缓慢,第一个 Checkpoint 耗时从 8 秒飙到 47 秒;再过两小时,作业开始持续背压, 断崖式下跌……而你翻遍所有配置, 设的是 , 也开了,甚至加了 ——一切看起来都“按文档来”,却像踩进了一个无声的流沙坑。 这不是玄学。