2.2.1 共享内存系统 (Shared Memory) 2.2.1 共享内存系统(Shared Memory):当 NUMA 节点“假装自己是 UMA”时,你的 正在 silently 慢 3.7 倍 “我们压测发现,同样的服务在 2×64 核 AMD EPYC 9654(128C/256T)上,吞吐量比在 2×32 核 Intel Xeon Platinum 8480+(64C/128T)低 32%,但 CPU 利用率却更低——像一台喘不过气的跑车,油门踩到底,轮子却陷在沙里。” ——某头部云厂商 SRE 在凌晨三点发给我的 Slack 截图,附带一张 的火焰图:92% 的内存加载延迟扎堆在 路径,且集中在 Node 1 的远端内存访问(remote DRAM access)。