6.2.1.2 非线性 sigma 模型


文档摘要

6.2.1.2 非线性 sigma 模型 6.2.1.2 非线性 sigma 模型:当梯度爆炸撞上靶流形约束——一个在 PyTorch 中稳定训练 S²-值场的实战手记 你有没有试过,在实现一个球面约束下的场论模型时,明明物理直觉清晰、拉格朗日量写得一丝不苟,可 optimizer 一跑, 像坐上火箭, 突然飙到 , 里全是 ?更诡异的是,检查每一步:前向传播输出的向量模长始终是 1.0000001(浮点误差可接受),但反向传播后,参数梯度却像被雷劈过一样支离破碎?这不是你的代码有 bug——这是非线性 sigma 模型(Nonlinear Sigma Model, NLSM)在对你低语:“你忘了,约束不是装饰,是律令;而微分几何的梯度,从不认 Euclidean 坐标系那一套。


发布者: 作者: 转发
评论区 (0)
U