Widget2Code:マルチモーダルLLMによるビジュアルウィジェットからUIコードへの変換

Research#llm🔬 Research|分析: 2025年12月25日 03:34
公開: 2025年12月24日 05:00
1分で読める
ArXiv Vision

分析

本論文では、マルチモーダル大規模言語モデル(MLLM)を使用して、ビジュアルウィジェットからUIコードを生成する新しいアプローチであるWidget2Codeを紹介しています。WebやモバイルUIと比較して、コンパクトでコンテキストフリーなウィジェットの性質によってもたらされる課題を強調し、未開拓のウィジェットからコードへの変換の領域に取り組んでいます。この論文では、画像のみのウィジェットベンチマークを提示し、汎用MLLMのパフォーマンスを評価し、信頼性が高く視覚的に一貫性のあるコードを生成する上での制限を明らかにしています。これらの制限を克服するために、著者は、ウィジェットの設計原則とフレームワークに依存しないドメイン固有言語(WidgetDSL)を組み込んだ、知覚的理解と構造化されたコード生成を組み合わせたベースラインを提案しています。エンドツーエンドのインフラストラクチャであるWidgetFactoryの導入により、アプローチの実用性がさらに向上します。
引用・出典
原文を見る
"widgets are compact, context-free micro-interfaces that summarize key information through dense layouts and iconography under strict spatial constraints."
A
ArXiv Vision2025年12月24日 05:00
* 著作権法第32条に基づく適法な引用です。