5.2.1.2 连续查询模型 5.2.1.2 连续查询模型:当 Flink 的 在 Kafka 水位线停滞时,如何用“动态水位线锚点 + 延迟补偿窗口”救活整条实时链路? 凌晨两点十七分,监控告警第三次弹窗——某核心风控连续查询作业的端到端延迟(E2E Latency)突破 48 秒,P99 跳变至 127 秒,下游实时决策服务开始批量降级。运维同学甩来一张截图:Flink Web UI 上, 的 值已静止在 长达 11 分钟,而 Kafka 分区最新消息时间戳已是 。更刺眼的是, 的 仍在 12.4k rec/s,但 归零。 这不是数据洪峰,不是 GC 卡顿,不是反压堆积——它是一场悄无声息的“水位线死亡”。 而我们手里的连续查询模型,正站在悬崖边缘。