6.2.1 内部验证:留一法 (LOO)、K-折交叉验证 在机器学习工程的实战现场,模型评估从来不是一句“跑个准确率”就能收场的轻巧动作。它是一场精密的外科手术——刀锋所向,是数据集里那些被我们反复折叠、拆解、重组的样本;缝合线,则是统计学原理与工程实践之间那根纤细却坚韧的张力之弦。当我们站在“6.2.1 内部验证:留一法(LOO)、K-折交叉验证”这个节点上,真正需要叩问的,不是“什么是LOO”,而是:“当我手握372个临床样本、89维基因表达特征、一个带正则化路径的Lasso-Cox生存模型时,我该不该用LOO?如果用了,scikit-learn的 会不会悄悄把我的内存吃光?K=5和K=10,在小样本高维场景下,哪个更诚实?交叉验证的随机种子设在哪一层才不会污染模型稳定性评估?