用于跨视角地理定位的可学习查询聚合
Paper#Computer Vision, Geo-localisation, Deep Learning🔬 Research|分析: 2026年1月3日 18:24•
发布: 2025年12月30日 01:51
•1分で読める
•ArXiv分析
本文解决了跨视角地理定位这一具有挑战性的问题,这对于自动导航和机器人技术等应用至关重要。核心贡献在于使用混合专家(MoE)路由机制在交叉注意力框架内的新型聚合模块。这允许自适应处理异构输入域,即使存在显着的视角差异,也能改善查询图像与大型数据库的匹配。DINOv2 和多尺度通道重新分配模块的使用进一步增强了系统的性能。本文对效率(更少的训练参数)的关注也是一个显着的优势。