2.1.2.4 Metadata Database:状态存储 2.1.2.4 Metadata Database:状态存储——当“元数据”开始撒谎:一次因时钟漂移引发的分布式状态雪崩与精准修复实践 凌晨三点十七分,告警钉钉群炸开第三条红色高优消息: 紧接着是第四条: 五分钟后,整个数据编排平台的 DAG 执行链开始卡顿。不是失败,不是超时,而是——悬停。任务状态在 和 之间反复横跳,像被无形之手掐住咽喉的呼吸。运维同事抓着耳机冲进会议室时,我正把咖啡泼在一张刚画完的时序图上——那张图里,三个节点的时间戳像三列歪斜的士兵,步调错乱,却都坚称自己站在“现在”。 这不是故障,这是元数据的集体失语。 一、我们到底在存储什么?