拡散Transformerの高速化と忠実度最適化

Research Paper#Image Generation, Diffusion Models, AI Acceleration🔬 Research|分析: 2026年1月3日 16:10
公開: 2025年12月29日 07:36
1分で読める
ArXiv

分析

この論文は、画像と動画生成におけるDiffusion Transformer (DiT) の遅い推論速度の問題に対処しています。既存の高速化手法の性能を向上させるために、CEM (Cumulative Error Minimization) と呼ばれる新しい忠実度最適化プラグインを導入しています。CEMは、ノイズ除去プロセス中の累積誤差を最小限に抑えることを目指し、生成忠実度の向上につながります。この手法はモデルに依存せず、容易に統合でき、さまざまなモデルとタスクにわたって強力な汎化性を示します。結果は、生成品質の大幅な改善を示し、場合によっては元のモデルを上回っています。
引用・出典
原文を見る
"CEM significantly improves generation fidelity of existing acceleration models, and outperforms the original generation performance on FLUX.1-dev, PixArt-$α$, StableDiffusion1.5 and Hunyuan."
A
ArXiv2025年12月29日 07:36
* 著作権法第32条に基づく適法な引用です。