FinMMDocR:金融マルチモーダル推論のための新しいベンチマーク

公開:2025年12月31日 15:00
1分で読める
ArXiv

分析

この論文は、複雑な金融推論タスクにおけるマルチモーダル大規模言語モデル(MLLM)を評価するために設計された新しいベンチマーク、FinMMDocRを紹介しています。このベンチマークの主な貢献は、シナリオ認識、文書理解(広範な文書の幅と深さ)、および多段階計算に焦点を当てていることであり、既存のベンチマークよりも挑戦的で現実的です。最高のパフォーマンスを発揮するMLLMの低い精度(58.0%)は、タスクの難しさと将来の研究の可能性を浮き彫りにしています。

参照

最高のパフォーマンスを発揮するMLLMは、58.0%の精度しか達成していません。