6.2.1 ZooKeeper 基于存储 在分布式流处理系统的高可用(HA)架构中,ZooKeeper 不再是那个被轻描淡写带过的“协调服务配角”——它早已成为 Flink 作业生命周期的元数据心脏与领导权神经中枢。当我们翻开 这一页,真正要叩问的,不是“ZooKeeper 能不能用”,而是:当 JobManager 突然坠机、网络分区撕裂集群、ZK 会话超时如潮水般涌来时,Flink 如何在毫秒级完成元数据重建与领导权移交?其背后那套精巧的、混合了强一致性语义与容错重试策略的存储协议,究竟是怎样一针一线缝合起来的? 这不是配置文件里几行 就能搪塞过去的问题。