您好,当我正在训练第二步的扩散模型的时候,会出现梯度消失或梯度爆炸的情况,导致损失函数变成nan,这种情况应该怎么处理? [2026-01-02-17-27_.log](https://github.com/user-attachments/files/24413986/2026-01-02-17-27_.log)