8.3.3 版本控制中的模型与资源管理 在机器学习工程化落地的深水区,我们常陷入一种看似矛盾的困境:模型迭代速度越来越快,但生产环境中的模型却像被钉在时间琥珀里的标本——更新一次要走审批、重训、验证、灰度、回滚五道关卡;数据科学家在 Jupyter 里跑通了 $ \text{val\loss} \downarrow 0.02 $,而 MLOps 工程师盯着 CI/CD 流水线里那个卡在 的红色失败节点,眉头拧成了川字。 这背后,是版本控制体系在 ML 场景下的结构性失配。Git 原生设计为文本优先、行级差异、轻量分支——它擅长管理 文件里一行 的修改,却对一个 2.7 GB 的 文件束手无策;