4.4.1 INT4 量化的探索与局限 INT4量化,不是一场对精度的温柔妥协,而是一次在比特悬崖边缘的精密走钢丝——每少一位,模型参数就蒸发掉一半的表达潜力;每多一个离群值(outlier),推理结果就可能滑向不可信的深渊。当业界高呼“INT4是大模型端侧落地的最后一块拼图”时,真正坐进实验室、打开PyTorch源码、调试 后端、反复修改 并盯着 输出直方图发呆的工程师们,心里都清楚:这句话的后半句,往往被悄然省略了——“……前提是,你已驯服了动态范围、校准噪声、权重-激活协同失配,以及硬件指令流水线里那0.3个周期的隐式截断误差。” 我们不谈愿景,只拆解螺丝。本节聚焦4.4.