9.2.1.1 纯度控制与批次重复性 纯度控制不是实验室的道德洁癖,而是工业级AI模型量产的生命线——一个被忽略的HPLC级色谱图,如何在PyTorch DataLoader里长出“分子指纹” 你有没有遇到过这样的场景? 凌晨两点,模型在A批次数据上AUC飙到0.92,团队刚在Slack里发完庆祝表情包; 第二天上午,B批次新数据一进来,指标断崖式跌至0.71——不是过拟合,不是学习率崩了,也不是label翻转。 日志干干净净,梯度平稳,loss曲线光滑得像用CAD画出来的。 你反复比对两批数据的shape、dtype、nan比例、归一化参数……全都一致。 直到你把 里那行看似无害的 注释掉,再跑一次——指标回升到0.91。