EasyOmnimatte:事前学習済みインペインティング拡散モデルを用いたエンドツーエンドのビデオレイヤー分解

公開:2025年12月26日 04:57
1分で読める
ArXiv

分析

本論文は、事前学習済みのビデオインペインティング拡散モデルを利用した、新しいエンドツーエンドのビデオオムニマット手法であるEasyOmnimatteを紹介しています。既存の手法の限界を克服し、前景と関連効果の両方を効率的に捉えます。重要な革新は、LoRAを拡散モデルの特定のブロックに選択的に適用して効果関連の手がかりを捉えるデュアルエキスパート戦略にあり、既存のアプローチと比較して品質と効率が向上しています。

参照

論文の核心的な発見は、「デュアルエキスパート戦略」の有効性であり、Effect Expertが粗い前景構造と効果を捉え、Quality Expertがアルファマットを洗練させることで、最先端のパフォーマンスを実現しています。