3.1 卷积算法家族(GEMM、Winograd、FFT、Implicit GEMM等) 3.1 卷积算法家族(GEMM、Winograd、FFT、Implicit GEMM等) 在深度学习加速引擎的底层架构中,卷积操作无疑是计算密集型任务的核心。cuDNN(CUDA Deep Neural Network library)作为NVIDIA为GPU平台量身打造的高性能原语库,其对卷积算子的实现并非单一路径,而是构建了一个丰富而灵活的“卷积算法家族”。