Research #llm 🔬 Research分析: 2026年1月4日 09:38

GamiBench：使用折纸折叠任务评估MLLMs的空间推理和2D到3D规划能力

发布:2025年12月22日 01:07

•

1分で読める

分析

本文介绍了GamiBench，这是一个基准测试，旨在通过折纸折叠任务评估多模态大型语言模型（MLLM）的空间推理和2D到3D规划能力。专注于折纸为评估这些能力提供了一个具体且具有挑战性的领域。使用ArXiv作为来源表明这是一篇研究论文。

引用

“”

Deep Learning to Break Semantic Image CAPTCHAs [pdf]

Chatbox: Cross-platform desktop client for ChatGPT, Claude and other LLMs