8.2.2 真实场景数据集构建 8.2.2 真实场景数据集构建:如何用“影子流量回放”解决线上-线下评估偏差 你有没有遇到过这样的窘境?模型在离线A/B测试中表现优异,准确率高达95%,但一上线就“翻车”,用户投诉激增,点击率暴跌?更令人困惑的是,当你回过头去检查训练和验证数据时,一切看起来都“干净、规范、合理”。问题出在哪里? 答案往往藏在一个被忽视的细节里:数据分布漂移(Data Distribution Shift)。离线数据集再精心构造,也难以完全复现线上真实用户行为的复杂性——延迟、网络抖动、设备差异、上下文切换、突发热点事件……这些“噪声”不是干扰,而是真实世界的一部分。忽略它们,就等于在沙盘上练兵,却指望打赢一场真实的战争。