5.2.3 高可用保障: 5.2.3 高可用保障:当主库在凌晨三点崩塌,MHA却卡在“Waiting for master to die…”——一次半同步超时与XtraBackup元数据错位的真实攻防战 凌晨3:17,告警钉钉群炸开一条红色消息: 紧接着是第二条: 不是“正在切换”,不是“已切换成功”,而是——NO。 一个冷冰冰的否定词,悬在生产环境的心跳线上,像一把没落下的铡刀。 这不是理论推演,也不是压测剧本。这是某电商核心订单库在大促前夜的真实切片。而我要讲的,不是MHA怎么装、XtraBackup怎么配,而是当所有文档里写着“MHA 28秒完成切换”“XtraBackup热备零锁表”时,你真正按下回车那一刻,系统如何用一连串精妙的时序陷阱,把“高可用”三个字撕成两半。