8.2.1.2 状态大小控制 8.2.1.2 状态大小控制:当 Flink 的 在凌晨三点悄然膨胀,而你的报警沉默如深海——一个被低估的 配置陷阱与它的救赎 凌晨 3:17,你收到一条 Slack 消息,来自值班系统自动推送的告警: 你揉了揉眼睛,点开 Flink Web UI。 作业的 算子状态大小曲线正以近乎垂直的姿态向上刺穿监控阈值线;Checkpoint 耗时从平均 8 秒飙升至 47 秒;下游 Kafka sink 的 lag 开始以每分钟 12 万条的速度累积。你本能地去查 —— 那段你三个月前抄自官网文档、贴在 初始化块里的“标准配置”: 它看起来无懈可击:7 天 TTL,写时更新,RocksDB 压缩过滤清理……可为什么状态还在疯长?