DrawingBench: マウス操作描画タスクを通じた大規模言語モデルの空間推論とUI操作能力評価

Research #LLM 🔬 Research|分析: 2026年1月10日 13:44•

公開: 2025年12月1日 01:18

•

1分で読める

分析

本研究は、大規模言語モデルの空間推論とUI操作能力を評価することに焦点を当てた新しいベンチマーク、DrawingBenchを紹介しています。マウス操作描画タスクの使用は、これらの能力を評価するためのユニークで挑戦的な方法を提供します。

引用・出典

"DrawingBench evaluates spatial reasoning and UI interaction capabilities through mouse-based drawing tasks."

ArXiv2025年12月1日 01:18

* 著作権法第32条に基づく適法な引用です。

MindFuse: Enhancing GenAI Explainability for Marketing Strategy

TinyML & Reinforcement Learning: Optimizing Greenhouse Lighting for Energy Efficiency