6.2.2 服务降级:全局开关(Apollo配置中心下发)一键关闭非核心功能模块 6.2.2 服务降级:全局开关(Apollo配置中心下发)一键关闭非核心功能模块 ——一个被凌晨三点的告警逼出来的“熔断式降级”实践 凌晨3:17,手机震了第三下。 不是微信消息,是PagerDuty的红色弹窗:“ P99延迟突破8.2s,错误率17.3%,触发SLO熔断阈值”。 我抓起笔记本打开Kibana,还没点开trace,心里已经浮出那个熟悉的链路:下单 → 库存预占 → 营销券校验 → 支付路由 → 订单落库。 果然,火焰图里最刺眼的那条红柱,卡在 ——它正同步调用外部券平台的HTTP接口,而对方SLA早已崩成锯齿状。更糟的是,这个校验逻辑被嵌在事务里,连带拖垮整个下单主流程。 这不是第一次。