2.2.1.2 冗余节点消除 (Identity/Dropout Removal)


文档摘要

2.2.1.2 冗余节点消除 (Identity/Dropout Removal) 冗余节点消除:当模型在推理时“假装自己在训练”——一个被Dropout反向污染的ONNX导出事故实录 凌晨两点十七分,监控告警第三次亮起。线上推理服务的P99延迟从87ms骤升至312ms,GPU显存占用率曲线像被一把钝刀斜劈而下,陡然抬高1.2GB。SRE同事甩来一张火焰图截图,热点扎堆在 和 两个算子上——可这是推理服务,我们早该把所有训练专用模块剪干净了。 这不是性能调优,这是伤口清创。 一、你以为删掉 就安全了?不,PyTorch的“幽灵Dropout”还在呼吸 我们习惯性地认为:只要在推理前调用 ,再把 套牢,模型就自动切换到“纯净推理模式”。


发布者: 作者: 转发
评论区 (0)
U