KV-Tracker: Transformerを用いたリアルタイム姿勢追跡

公開:2025年12月27日 13:02
1分で読める
ArXiv

分析

本論文は、リアルタイムアプリケーションにおけるマルチビュー3Dジオメトリネットワークの計算上のボトルネックに対処しています。 KV-Trackerと呼ばれる、Transformerアーキテクチャ内でキーバリュー(KV)キャッシングを利用して、単眼RGBビデオからの6自由度姿勢追跡とオンライン再構成において大幅な高速化を実現する新しい方法を提案しています。キャッシング戦略のモデルに依存しない性質は大きな利点であり、再訓練なしで既存のマルチビューネットワークに適用できます。リアルタイムパフォーマンスに焦点を当て、深度測定やオブジェクト事前知識なしでオブジェクト追跡や再構成などの困難なタスクを処理できる能力は、重要な貢献です。

参照

キャッシング戦略はモデルに依存せず、再訓練なしで他の既製のマルチビューネットワークに適用できます。