3.1.1 云数据库家族: 3.1.1 云数据库家族:一次主从延迟突增的“秒级归因”实战——从TDSQL-C自动扩缩容抖动,到TMem缓存穿透雪崩,再到CDB三副本脑裂边界的精准捕获 凌晨2:17,告警钉钉群炸开一条红色消息: 【P0】订单履约服务响应P99飙升至8.4s,DB CPU持续>92%,主库QPS跌穿300,从库复制延迟突破127秒——已触发熔断。 这不是演习。这是某头部电商平台大促前压测中真实发生的一幕。而真正令人脊背发凉的,不是故障本身,而是——它发生在所有监控指标“看起来都正常”的时候: TDSQL-C控制台显示“弹性伸缩成功”,节点数从2→4; CDB for MySQL监控面板上,“复制延迟(SecondsBehindMaster)”曲线平滑如镜,始终稳定在0.3±0.