Research#llm🔬 Research分析: 2026年1月4日 09:38

GamiBench:折り紙タスクによるMLLMの空間推論と2D-3D計画能力の評価

公開:2025年12月22日 01:07
1分で読める
ArXiv

分析

この記事では、折り紙の折り畳みタスクを使用して、マルチモーダル大規模言語モデル(MLLM)の空間推論と2D-3D計画能力を評価するために設計されたベンチマーク、GamiBenchを紹介しています。折り紙に焦点を当てることで、これらの能力を評価するための具体的で挑戦的な領域が提供されます。ArXivをソースとして使用していることから、これは研究論文であることが示唆されます。

参照