9.2.1 实验设计原则 在实验室里,最令人沮丧的时刻是什么?不是模型跑崩了,不是数据加载失败,不是GPU显存溢出——而是当你把一份精心调参、反复验证过的算法,原封不动地搬到隔壁组的设备上,结果AUC掉点12%,F1波动±0.18,甚至同一台机器上午跑的结果和下午跑的都不一致。你盯着日志里那行平淡无奇的 ,忽然意识到:我们花了90%的精力优化模型,却只用5%的力气设计实验;我们给损失函数加了三重正则,却没给随机种子做一次跨设备校验;我们为梯度裁剪设定了毫秒级阈值,却任由批次顺序在shuffle中自由舞蹈。 这不是工程失误,这是实验设计的系统性失焦。 “9.2.1 实验设计原则”不是方法论章节里的装饰性段落,它是整个AI研发链条的元基础设施——看不见,但一旦坍塌,所有上层建筑都会震颤开裂。