Research#llm🔬 Research分析: 2026年1月4日 09:38

GamiBench:使用折纸折叠任务评估MLLMs的空间推理和2D到3D规划能力

发布:2025年12月22日 01:07
1分で読める
ArXiv

分析

本文介绍了GamiBench,这是一个基准测试,旨在通过折纸折叠任务评估多模态大型语言模型(MLLM)的空间推理和2D到3D规划能力。 专注于折纸为评估这些能力提供了一个具体且具有挑战性的领域。 使用ArXiv作为来源表明这是一篇研究论文。

引用