ViRectify:マルチモーダル大規模言語モデルを用いた動画推論修正のための新たなベンチマーク
公開:2025年12月1日 09:05
•1分で読める
•ArXiv
分析
このArXiv論文では、マルチモーダル大規模言語モデルの動画推論能力を評価し改善するための新しいベンチマーク、ViRectifyが紹介されています。修正に焦点を当てていることは、AIの動画コンテンツの理解と操作における開発にとって重要な分野を浮き彫りにしています。
参照
“論文ではViRectifyをベンチマークとして提示しています。”