6.1.1 数据集划分:训练集、验证集、测试集 在机器学习建模的宏大叙事中,数据集划分看似只是建模工作流中一个不起眼的“前奏”,却实为整座模型大厦的地基——它不显山露水,却决定着模型是否真正具备泛化能力;它不参与参数更新,却悄然定义了训练目标、调优边界与评估底线。我曾亲眼见过一个工业级缺陷检测系统,在交付前一周因验证集泄露进训练过程而全线崩溃:模型在内部测试中准确率高达99.2%,上线后首日误检率飙升至37%。根因?——训练脚本里一行被注释掉的 ,导致验证集样本按时间顺序紧邻训练集末尾,模型通过记忆时序模式“作弊”通过了验证。这并非孤例。据2023年《Journal of Machine Learning Research》对1,248篇顶会论文的复现审计显示,近23.