DPAR:効率的な自己回帰型画像生成のための動的パッチ化

Research Paper#Image Generation, Autoregressive Models, Deep Learning🔬 Research|分析: 2026年1月3日 16:37
公開: 2025年12月26日 05:03
1分で読める
ArXiv

分析

この論文は、自己回帰型画像生成の効率を向上させる新しいアプローチであるDPARを紹介しています。固定長トークン化の計算量とメモリの制限に対処するため、画像トークンを可変サイズのパッチに動的に集約します。中核的な革新は、次のトークン予測エントロピーを使用してトークンのマージをガイドすることにあり、これにより、トークン数の削減、FLOPsの削減、収束の高速化、およびベースラインモデルと比較してFIDスコアの改善が実現します。これは、自己回帰モデルをより高い解像度にスケーリングし、生成された画像の品質を向上させる可能性を提供する点で重要です。
引用・出典
原文を見る
"DPAR reduces token count by 1.81x and 2.06x on Imagenet 256 and 384 generation resolution respectively, leading to a reduction of up to 40% FLOPs in training costs. Further, our method exhibits faster convergence and improves FID by up to 27.1% relative to baseline models."
A
ArXiv2025年12月26日 05:03
* 著作権法第32条に基づく適法な引用です。