DarkEQA:低照度環境における視覚言語モデルの評価
分析
この論文は、エージェントのための視覚言語モデル(VLM)の評価における重要なギャップに対処しています。既存のベンチマークは、24時間365日の実運用に不可欠な低照度条件下でのVLMの性能を無視することが多いです。DarkEQAは、これらの困難な環境におけるVLMの堅牢性を評価するための新しいベンチマークを提供し、知覚プリミティブに焦点を当て、物理的に現実的な低照度劣化のシミュレーションを使用しています。これにより、VLMの限界と潜在的な改善点をより正確に理解できます。