用于跨视角地理定位的可学习查询聚合

发布:2025年12月30日 01:51
1分で読める
ArXiv

分析

本文解决了跨视角地理定位这一具有挑战性的问题,这对于自动导航和机器人技术等应用至关重要。核心贡献在于使用混合专家(MoE)路由机制在交叉注意力框架内的新型聚合模块。这允许自适应处理异构输入域,即使存在显着的视角差异,也能改善查询图像与大型数据库的匹配。DINOv2 和多尺度通道重新分配模块的使用进一步增强了系统的性能。本文对效率(更少的训练参数)的关注也是一个显着的优势。

引用

本文提出了一个改进的聚合模块,该模块将混合专家(MoE)路由集成到特征聚合过程中。