VL-LN 基准:基于主动对话的长程目标导向导航

发布:2025年12月26日 19:00
1分で読める
ArXiv

分析

本文通过引入一个更现实的设置来解决现有具身导航任务的局限性,在该设置中,智能体必须使用主动对话来解决指令中的歧义。 提出的 VL-LN 基准测试为训练和评估支持对话的导航模型提供了宝贵的资源,超越了简单的指令跟随和对象搜索。 关注长程任务并包含用于智能体查询的神谕是重大进步。

引用

本文介绍了交互式实例对象导航 (IION) 和视觉语言-语言导航 (VL-LN) 基准。