2.2.1.1 StreamGraph 构建 2.2.1.1 StreamGraph 构建:当 的并行度“失联”时,我们究竟在调度什么?——一个被忽略的 与 协同失效现场实录 凌晨两点十七分,Flink 作业监控面板上那条红色的 状态条仍未熄灭。 Kubernetes 集群里,TaskManager 的 CPU 使用率稳定在 3%,内存水位线却悄然爬升至 92%; Checkpoint 持续失败,日志里反复滚动着一行轻描淡写的警告: 它不报错,不崩溃,不抛异常——它只是沉默地、固执地拒绝启动。 这不是资源不足。集群空闲 Slot 数量充足。 这不是代码逻辑错误。本地单测、MiniCluster 测试全部通过。 这不是配置遗漏。 , , ……所有显性参数都对得上。