GamiBench:使用折纸折叠任务评估MLLMs的空间推理和2D到3D规划能力
分析
本文介绍了GamiBench,这是一个基准测试,旨在通过折纸折叠任务评估多模态大型语言模型(MLLM)的空间推理和2D到3D规划能力。 专注于折纸为评估这些能力提供了一个具体且具有挑战性的领域。 使用ArXiv作为来源表明这是一篇研究论文。
引用
“”
本文介绍了GamiBench,这是一个基准测试,旨在通过折纸折叠任务评估多模态大型语言模型(MLLM)的空间推理和2D到3D规划能力。 专注于折纸为评估这些能力提供了一个具体且具有挑战性的领域。 使用ArXiv作为来源表明这是一篇研究论文。
“”