6.2.2 外部验证指标:R²、RMSE、MAE、MCC (马修斯相关系数) 在模型开发的漫长征途上,训练阶段常如一场精心编排的独舞——数据在眼前翩跹,损失函数稳步下降,准确率节节攀升。可当聚光灯移开,模型步入真实世界那不可控、不均匀、不完美的舞台时,它是否还能稳住节奏?这正是外部验证(External Validation)所叩问的核心:模型不是在训练集上“学会表演”,而是在未知数据中“真正生存”。 而衡量这场生存能力的标尺,绝非一句模糊的“效果不错”,而是由R²、RMSE、MAE、MCC这四把精密刻度各异的“校准卡尺”共同构成的评估矩阵。它们不是并列的备选项,而是针对不同任务类型、不同误差敏感性、不同类别分布鲁棒性所设计的互补性诊断工具。