5.1 动态形状(Dynamic Shapes)处理 第五章:高级特性与动态形状 5.1 动态形状(Dynamic Shapes)处理:从静态契约到弹性推理的范式跃迁 当我们在TensorRT中构建一个推理引擎时,最常被忽略却最具战略意义的抉择,并非选用何种精度策略(FP16/INT8),亦非如何调度CUDA流——而是我们是否愿意、以及是否有能力,向模型输入的“形状”让渡一部分确定性。 这听起来近乎悖论:深度学习框架以张量为基石,而张量之“形”,本应是计算图得以静态编译、内存得以预分配、内核得以特化优化的前提。