SenseNovaの「NEO-unify」がVAEを廃止、画期的なネイティブ画像生成を実現
分析
SenseTimeのSenseNovaは、独立したVAAやエンコーダーに依存せず、ピクセル上で直接画像を生成する画期的な20億パラメータの統合モデル「NEO-unify」を発表しました。31.56 PSNRという印象的な画像再構成スコアを達成しており、Stable Diffusionのような従来の手法を悩ませていたフラストレーションの多いアーティファクトを排除しています。生成AIコミュニティにとって最もエキサイティングなニュースは、この非常に効率的で本質的な理解力を持つモデルのオープンソースリリースが準備中であることです。これはクリエイティブツールの大きな飛躍を示しています。
重要ポイント
引用・出典
原文を見る"Stable DiffusionやFLUXで私たちが慣れ親しんだ通常のCLIP + VAE + Diffusionのセットアップの代わりに、彼らはNEO-unifyと呼ばれるネイティブ統合モデルを構築しました。"