IVCR-200K:インタラクティブビデオコーパス検索のための大規模マルチターン対話ベンチマーク
分析
この記事では、マルチターン対話に基づいてビデオセグメントを検索するシステムを評価するために設計された新しいベンチマークデータセットであるIVCR-200Kを紹介しています。焦点は、研究が盛んになっているインタラクティブビデオ検索です。データセットの規模(20万件の対話)は、新しいモデルのための堅牢なテストグラウンドを提供するという大きな努力を示唆しています。マルチターン対話の使用は、現実的なユーザーインタラクションをシミュレートするために不可欠です。