FinMMDocR:金融マルチモーダル推論のための新しいベンチマーク

Research Paper#Multimodal Large Language Models, Financial Reasoning, Benchmarking🔬 Research|分析: 2026年1月3日 06:22
公開: 2025年12月31日 15:00
1分で読める
ArXiv

分析

この論文は、複雑な金融推論タスクにおけるマルチモーダル大規模言語モデル(MLLM)を評価するために設計された新しいベンチマーク、FinMMDocRを紹介しています。このベンチマークの主な貢献は、シナリオ認識、文書理解(広範な文書の幅と深さ)、および多段階計算に焦点を当てていることであり、既存のベンチマークよりも挑戦的で現実的です。最高のパフォーマンスを発揮するMLLMの低い精度(58.0%)は、タスクの難しさと将来の研究の可能性を浮き彫りにしています。
引用・出典
原文を見る
"The best-performing MLLM achieves only 58.0% accuracy."
A
ArXiv2025年12月31日 15:00
* 著作権法第32条に基づく適法な引用です。