垂直書き日本語テキストにおけるMLLMの課題:新たな研究がパフォーマンスの差を明らかにResearch#MLLMs🔬 Research|分析: 2026年1月26日 11:43•公開: 2025年11月19日 03:04•1分で読める•ArXiv分析この研究は、日本語の文書処理におけるマルチモーダル大規模言語モデル (MLLM) の重要な課題を浮き彫りにしています。それは、垂直書きのテキストにおけるモデルのパフォーマンス不足です。この研究は、MLLMがこの一般的な日本語の書き方を理解するための、特別なトレーニングデータの必要性を示しています。重要ポイント•MLLMは、横書きのテキストと比較して、縦書きの日本語テキストで精度が低下することを示しています。•ファインチューニングと評価の両方に、合成日本語OCRデータセットが作成されました。•合成データセットによるトレーニングは、縦書きのパフォーマンスを向上させます。引用・出典原文を見る"Using these datasets, we demonstrate that the existing MLLMs perform worse on vertically written Japanese text than on horizontally written Japanese text."AArXiv2025年11月19日 03:04* 著作権法第32条に基づく適法な引用です。古い記事On Decision-Making Agents and Higher-Order Causal Processes新しい記事Evaluating Multimodal Large Language Models on Vertically Written Japanese Text関連分析Research人間によるAI検出2026年1月4日 05:47Research深層学習の実装に焦点を当てた書籍2026年1月4日 05:49ResearchGeminiのパーソナライズ2026年1月4日 05:49原文: ArXiv