2.1.2.1 任务执行容器 你有没有在凌晨三点收到过这样一条告警? 紧接着,Flink Web UI 上一排 TaskManager 状态从 变成 ,作业开始频繁重启、Checkpoint 失败、反压箭头疯狂闪烁——而你的下游 Kafka 消费者正以每秒 30 万条的速度积压着 JSON 字符串。 这不是灾难片的开场,而是某金融风控实时特征计算链路在一次“小版本升级”后的真实切片。