4.2.2.1 数据页缓存 4.2.2.1 数据页缓存:当LRU撞上热点倾斜——一次线上P99延迟飙升的根因还原与精准穿透式缓存隔离实践 凌晨两点十七分,告警钉钉弹窗炸开第三屏:“订单服务读取订单详情接口 P99 延迟突破 1200ms,持续 8 分钟,DB CPU 稳定在 92%”。这不是压测,不是发布窗口,是周一早高峰前夜的真实战场。运维甩来一张慢查询日志截图: ,执行耗时 843ms,执行计划显示全表扫描——可这张表明明有主键索引,且 就是主键。更诡异的是,同一 SQL,在测试环境毫秒级返回;在预发环境偶发抖动;在线上,却像被钉在了磁盘 IO 的刑架上。 我们花了 37 分钟定位到真相:不是 SQL 写错了,不是索引失效了,也不是数据库参数崩了。