2.1.2 众核架构 (Many-core):GPU, Intel Xeon Phi 遗产 2.1.2 众核架构(Many-core):GPU,Intel Xeon Phi 遗产 ——当“千核并行”撞上内存墙:一个 CUDA Unified Memory 页错误的深夜救火实录 凌晨两点十七分,监控告警第三次弹出:某金融风控实时推理服务的 GPU 利用率骤降至 3%,而 CPU 负载飙升至 98%,NVML 显示 持续卡在 99.7%。日志里一行被刷屏的警告像幽灵般反复闪现: 这不是第一次了。也不是测试环境——这是生产集群中承载每日 4700 万笔交易反欺诈模型推理的 X100+ A100 节点之一。