基于视觉推理的地面到空中定位

发布:2025年12月30日 18:36
1分で読める
ArXiv

分析

本文介绍了ViReLoc,这是一个仅使用视觉表征进行地面到空中定位的新框架。它通过直接从视觉数据中学习空间依赖性和几何关系,解决了基于文本的推理在空间任务中的局限性。使用强化学习和对比学习进行跨视图对齐是关键。这项工作的意义在于它在不依赖GPS数据的情况下实现安全导航解决方案的潜力。

引用

ViReLoc在两个给定的地面图像之间规划路线。