4.3.1 校准(Calibration)原理 校准,是训练后量化(PTQ)这座精密钟表里最微妙的游丝——它不参与模型权重的更新,却决定了整个量化系统的精度基线;它不改变网络结构,却在毫厘之间左右着推理误差的走向。工程师们常把校准比作“给模型做一次体检”,但这个比喻太温和了。真正的校准,是一场对激活分布的深度测绘、一场在浮点与整数语义鸿沟上架设桥梁的精密工程、一次在无梯度条件下用统计直觉替代反向传播的逆向求解。 你或许已经部署过TensorRT或ONNX Runtime的PTQ流程,敲下 那一行代码时,系统安静地跑完几十个batch,然后悄然输出一个 ——但那几秒背后,究竟发生了什么?为什么同一个模型,用不同校准策略,INT8推理精度可能相差5个百分点?