用于扩散Transformer的内部引导
分析
本文介绍了一种新的引导策略,即内部引导 (IG),用于扩散模型以提高图像生成质量。它解决了现有引导方法(如无分类器引导 (CFG))以及依赖于模型退化版本的方法的局限性。所提出的 IG 方法在训练期间使用辅助监督,并在采样期间外推中间层输出。结果表明,在训练效率和生成质量方面都有显着提高,在 ImageNet 256x256 上实现了最先进的 FID 分数,尤其是在与 CFG 结合使用时。IG 的简单性和有效性使其成为对该领域的宝贵贡献。
要点
引用
“LightningDiT-XL/1+IG 实现了 FID=1.34,这在所有这些方法中取得了很大优势。结合 CFG,LightningDiT-XL/1+IG 实现了当前最先进的 FID 1.19。”