8.2.3 异构计算驱动 (GPU/NPU) 在异构计算的洪流中,GPU与NPU早已不再是“加速器”的配角,而成了现代AI系统架构的神经中枢与代谢引擎——它们不再被动执行CPU下发的指令流,而是主动参与计算图调度、内存拓扑感知、算子粒度重分片,甚至反向塑造模型结构本身。当你在PyTorch里调用 时,你启动的不仅是一块显卡,而是一套横跨硬件微架构、驱动层调度器、运行时编译器、张量内存管理器与算法适配层的精密协同系统。本节不谈概念,不列优势,不堆参数;