RAPTOR: 用于无人机的实时高分辨率视频预测

发布:2025年12月25日 15:12
1分で読める
ArXiv

分析

这篇论文解决了自主无人机中对实时、高分辨率视频预测的关键需求,在这一领域,延迟至关重要。作者介绍了 RAPTOR,这是一种旨在克服现有方法在速度和分辨率方面局限性的新架构。核心创新是高效视频注意力 (EVA),它允许高效的时空建模,从而在边缘硬件上实现实时性能。这篇论文的重要性在于它有可能通过使无人机能够预测未来事件来提高无人机在复杂环境中的安全性和性能。

引用

RAPTOR 是第一个在 Jetson AGX Orin 上以 512^2 视频超过 30 FPS 的预测器,在 UAVid、KTH 和自定义高分辨率数据集的 PSNR、SSIM 和 LPIPS 上设定了新的技术水平。 关键的是,RAPTOR 在真实的无人机导航任务中将任务成功率提高了 18%。