Widget2Code：マルチモーダルLLMによるビジュアルウィジェットからUIコードへの変換

Research #llm 🔬 Research|分析: 2025年12月25日 03:34•

公開: 2025年12月24日 05:00

•

1分で読める

分析

本論文では、マルチモーダル大規模言語モデル（MLLM）を使用して、ビジュアルウィジェットからUIコードを生成する新しいアプローチであるWidget2Codeを紹介しています。WebやモバイルUIと比較して、コンパクトでコンテキストフリーなウィジェットの性質によってもたらされる課題を強調し、未開拓のウィジェットからコードへの変換の領域に取り組んでいます。この論文では、画像のみのウィジェットベンチマークを提示し、汎用MLLMのパフォーマンスを評価し、信頼性が高く視覚的に一貫性のあるコードを生成する上での制限を明らかにしています。これらの制限を克服するために、著者は、ウィジェットの設計原則とフレームワークに依存しないドメイン固有言語（WidgetDSL）を組み込んだ、知覚的理解と構造化されたコード生成を組み合わせたベースラインを提案しています。エンドツーエンドのインフラストラクチャであるWidgetFactoryの導入により、アプローチの実用性がさらに向上します。

重要ポイント

引用・出典

原文を見る

"widgets are compact, context-free micro-interfaces that summarize key information through dense layouts and iconography under strict spatial constraints."

ArXiv Vision2025年12月24日 05:00

* 著作権法第32条に基づく適法な引用です。

古い記事

HyGE-Occ: Hybrid View-Transformation with 3D Gaussian and Edge Priors for 3D Panoptic Occupancy Prediction

新しい記事

Unified Brain Surface and Volume Registration

Widget2Code：マルチモーダルLLMによるビジュアルウィジェットからUIコードへの変換

分析

重要ポイント

関連分析

人間によるAI検出

深層学習の実装に焦点を当てた書籍

Geminiのパーソナライズ

📬 AIニュースを受信

カテゴリで探す

トレンドトピック

📬 AIニュースを受信

カテゴリで探す

トレンドトピック