KV-Tracker: 基于Transformer的实时姿态跟踪

Research Paper#Computer Vision, Pose Estimation, Transformers🔬 Research|分析: 2026年1月3日 16:24
发布: 2025年12月27日 13:02
1分で読める
ArXiv

分析

本文解决了多视图3D几何网络在实时应用中的计算瓶颈问题。它介绍了KV-Tracker,这是一种新方法,利用Transformer架构内的键值(KV)缓存,在单目RGB视频的6自由度姿态跟踪和在线重建中实现显著加速。缓存策略的与模型无关的特性是一个关键优势,允许在不重新训练的情况下应用于现有的多视图网络。本文侧重于实时性能,以及在没有深度测量或对象先验的情况下处理对象跟踪和重建等具有挑战性的任务的能力,是重要的贡献。
引用 / 来源
查看原文
"The caching strategy is model-agnostic and can be applied to other off-the-shelf multi-view networks without retraining."
A
ArXiv2025年12月27日 13:02
* 根据版权法第32条进行合法引用。