2.2.2 第二级:扩展优化 (Extended Optimizations) 在深度学习编译器与推理引擎的演进史中,图优化从来不是一场优雅的数学推演,而是一场在硅基世界里反复试错、权衡、妥协与突破的工程实践。当我们站在第二级——“扩展优化”(Extended Optimizations)的门槛前,真正的挑战才刚刚开始。第一级基础优化(如常量折叠、死代码消除)像是给模型做了一次全身CT扫描,清晰勾勒出结构轮廓;而第二级,则是外科医生执刀:切开表层,深入神经元连接的毛细血管,缝合冗余计算的裂口,重布数据流动的经络,甚至重构整个计算器官的解剖学排布。它不满足于“正确”,而执着于“极致”——极致的吞吐、极致的延迟、极致的能效比。