1.2.1 起源期(2013–2016):CVM+CLB+云硬盘的初步分层解耦 当CLB的健康检查“假装”成功:一次云硬盘挂载失败引发的CVM雪崩式失联真相 2015年深秋,华北某金融云平台凌晨三点十七分。监控大屏上,一组承载核心账务查询服务的CVM集群(共12台)在90秒内陆续从CLB后端列表中消失——不是主动下线,不是主动注销,而是CLB的健康检查探针持续返回200,却在30秒后悄然将实例标记为“不可用”。运维团队紧急登录控制台,发现所有CVM仍在运行、CPU负载正常、SSH可连,但业务请求全部超时。更诡异的是: 在每台机器本地执行都秒回 ;而CLB的健康检查日志里,却赫然写着 。 这不是DDoS,不是网络分区,也不是代码Bug。