RGBT-Ground:复杂现实世界场景中鲁棒视觉定位的新基准

Research Paper#Computer Vision, Visual Grounding, Benchmark🔬 Research|分析: 2026年1月3日 09:20
发布: 2025年12月31日 02:01
1分で読める
ArXiv

分析

本文介绍了一个新的基准 RGBT-Ground,专门用于解决现有视觉定位基准在复杂现实世界场景中的局限性。 重点关注 RGB 和热红外 (TIR) 图像对,以及详细的注释,可以更全面地评估模型在各种具有挑战性的条件下的鲁棒性,例如不同的光照和天气。 统一框架的开发和 RGBT-VGNet 基线进一步促进了该领域的研究。
引用 / 来源
查看原文
"RGBT-Ground, the first large-scale visual grounding benchmark built for complex real-world scenarios."
A
ArXiv2025年12月31日 02:01
* 根据版权法第32条进行合法引用。