DreamOmni3:スクリブルベースの編集と生成

公開:2025年12月27日 09:07
1分で読める
ArXiv

分析

この論文は、スクリブル、テキストプロンプト、および画像を利用した画像編集と生成のためのモデル、DreamOmni3を紹介しています。テキストのみのプロンプトの制限を、ユーザーが描いたスケッチを組み込むことで、編集をより正確に制御できるようにしています。この論文の重要性は、データ作成とフレームワーク設計への新しいアプローチ、特に複数の入力を扱うジョイント入力スキームにあります。提案されたベンチマークとモデルとコードの公開は、この分野の研究を進める上でも重要です。

参照

DreamOmni3は、元の画像とスクリブルされたソース画像を両方ともモデルに入力するジョイント入力スキームを提案し、異なる色を使用して領域を区別し、処理を簡素化します。