9.3.2 内存带宽与缓存策略 内存带宽与缓存策略,不是教科书里静止的拓扑图,也不是性能报告中一闪而过的“L3 miss rate 12.7%”——它是现代CPU在每纳秒内与数据搏斗的真实战场。当你写完一段看似优雅的矩阵乘法,却发现实际吞吐只有理论峰值的18%;当你把算法复杂度从 $O(n^3)$ 优化到 $O(n^{2.807})$,但实测耗时反而增加23%;当你在NUMA节点间迁移线程后,延迟突增400ns……这些都不是抽象的“性能问题”,而是内存子系统在你代码的每一行背后,悄然扣动的扳机。 我们常误以为“缓存是透明的”,仿佛它只是CPU自动管理的一层玻璃罩。可真相是:缓存不透明,它有脾气、有偏见、有记忆,甚至会报复性地惩罚那些不懂它作息规律的访存模式。