6.2.2.2 资源争用避免 6.2.2.2 资源争用避免:一个被低估的“锁粒度陷阱”——从 Redis 分布式锁误用引发的雪崩级超时说起 凌晨两点十七分,告警钉钉群炸了。 不是 CPU 突增,不是磁盘写满,也不是 GC 飙升。 是 的 接口 P99 延迟从 320ms 暴涨至 8.7 秒,且持续 14 分钟;下游库存服务 调用量断崖式下跌 92%;订单创建成功率跌穿 63%;而监控面板上,Redis 实例的 指标在 上反复打出刺眼的红色峰值——最高达 4.3 秒。 这不是压测事故。这是周一早高峰前的真实生产现场。 我们花了 37 分钟定位根因:一段看似“教科书级”的分布式锁实现,在高并发、长事务、网络抖动三重叠加下,把资源争用从“可控摩擦”演变成了“系统级卡死”。