5.1.1 CPU 核心数与内存带宽的影响


文档摘要

5.1.1 CPU 核心数与内存带宽的影响 在高性能计算、实时推理、低延迟交易系统乃至现代微服务架构中,我们常常听到一句看似朴素却暗藏玄机的话:“这台机器 CPU 核心数够了,但跑起来还是卡。”——问题真的出在“核心数”上吗?抑或,我们早已把内存子系统当成了沉默的背景板,任其在数据洪流中悄然成为瓶颈?今天,我们不谈“理论峰值带宽”,不列厂商白皮书里的 TDP 数值,也不复述 Amdahl 定律的教科书推导。我们要做的是:亲手拆开一个真实负载,用 perf 抓取 L3 miss 率,用 likwid-pin 绑定线程观察 NUMA 跳转,用 分配持久化内存页,最终让一段向量归约(vector reduction)的吞吐量从 12.4 GB/s 提升到 38.


发布者: 作者: 转发
评论区 (0)
U