DrawingBench: マウス操作描画タスクを通じた大規模言語モデルの空間推論とUI操作能力評価

Research#LLM🔬 Research|分析: 2026年1月10日 13:44
公開: 2025年12月1日 01:18
1分で読める
ArXiv

分析

本研究は、大規模言語モデルの空間推論とUI操作能力を評価することに焦点を当てた新しいベンチマーク、DrawingBenchを紹介しています。マウス操作描画タスクの使用は、これらの能力を評価するためのユニークで挑戦的な方法を提供します。
引用・出典
原文を見る
"DrawingBench evaluates spatial reasoning and UI interaction capabilities through mouse-based drawing tasks."
A
ArXiv2025年12月1日 01:18
* 著作権法第32条に基づく適法な引用です。