4.2.1.1 Scheduler 多实例部署


文档摘要

4.2.1.1 Scheduler 多实例部署 4.2.1.1 Scheduler 多实例部署:当 Leader 选举卡在 etcd 的 上,我们不是加节点,而是砍掉那个“假心跳” 凌晨两点十七分,告警钉钉弹窗炸开——生产环境的 Airflow 集群调度延迟突破 18 分钟,DAG 运行积压达 237 个。运维同事甩来一张截图:三台 Scheduler 实例全部存活, 显示进程正常, 返回 ,但日志里却反复刷着同一行: 这不是高可用——这是“高幻觉”。 我们曾天真地以为:只要部署三个 Scheduler 实例、配好 、打开 ,系统就会自动选出 Leader,其余 Standby,故障时秒级切换。现实却像一记闷棍:三台机器互相谦让,谁也不愿当 Leader;


发布者: 作者: 转发
评论区 (0)
U