2.3.1 异构计算分配算法:基于 EP 能力的子图划分 在异构图计算系统中,当模型规模突破单卡显存极限、推理延迟逼近毫秒级红线、训练吞吐遭遇跨设备通信瓶颈时——你真正需要的,从来不是“把图切开”,而是让每一块子图,在它最该待的那块硬件上,以最适配的方式呼吸、计算、同步。这正是“基于 EP(Execution Provider)能力的子图划分”所要解决的根本性命题:它不是图论意义上的静态分割,而是一场融合硬件拓扑感知、算子语义理解、内存带宽建模与运行时反馈闭环的动态协同决策。 我们不谈抽象的“异构计算范式”,只聚焦于你今晚就要调试的 + + + 混合部署场景;不讲教科书里的 Kernighan-Lin 或 METIS 算法泛泛而谈,而是带你亲手写一个可插拔、可 profile、可热更新的 ;