LLM 通过构建块和规划增强空间推理

发布:2025年12月31日 00:36
1分で読める
ArXiv

分析

本文解决了LLM中空间推理的挑战,这是导航和规划等应用的关键能力。作者提出了一种新颖的两阶段方法,将空间推理分解为基本构建块及其组合。这种方法利用监督微调和强化学习,在基于拼图的环境中展示了优于基线模型的性能。合成的 ASCII 艺术数据集和环境的使用也值得注意。

引用

两阶段方法将空间推理分解为原子构建块及其组合。