Paper#video generation🔬 Research分析: 2026年1月3日 16:35

MoFu:スケール認識ビデオ生成

公開:2025年12月26日 09:29
1分で読める
ArXiv

分析

この論文は、マルチ被写体ビデオ生成における重要な問題点、すなわちスケールの一貫性と順列感度に対処しています。提案されたMoFuフレームワークは、Scale-Aware Modulation (SMO)とFourier Fusion戦略により、被写体の忠実度と視覚的品質を向上させる新しいアプローチを提供します。評価のための専用ベンチマークの導入も重要です。

参照

MoFuは、自然なスケール、被写体の忠実度、および全体的な視覚的品質を維持する点で、既存の方法を大幅に上回っています。