6.3.2 Linalg Dialect:线性代数算子融合 在现代编译器栈中,MLIR 已不再仅仅是一个“中间表示”——它是一套可组合、可验证、可扩展的编译基础设施。而在这套基础设施之上,Linalg Dialect 就像一座精密运转的齿轮箱:它不直接驱动硬件,却决定了线性代数计算能否以最优方式咬合进整个流水线;它不显山露水,却悄然支撑着从 PyTorch JIT 到 Triton 内核生成、从 XLA AOT 编译到 NVIDIA cuBLASXt 自动调优的底层融合逻辑。