RGBT-Ground:复杂现实世界场景中鲁棒视觉定位的新基准
Research Paper#Computer Vision, Visual Grounding, Benchmark🔬 Research|分析: 2026年1月3日 09:20•
发布: 2025年12月31日 02:01
•1分で読める
•ArXiv分析
本文介绍了一个新的基准 RGBT-Ground,专门用于解决现有视觉定位基准在复杂现实世界场景中的局限性。 重点关注 RGB 和热红外 (TIR) 图像对,以及详细的注释,可以更全面地评估模型在各种具有挑战性的条件下的鲁棒性,例如不同的光照和天气。 统一框架的开发和 RGBT-VGNet 基线进一步促进了该领域的研究。