多模态大语言模型在竖排日文文本上表现不佳:新研究揭示性能差距

Research#MLLMs🔬 Research|分析: 2026年1月26日 11:43
发布: 2025年11月19日 03:04
1分で読める
ArXiv

分析

这项研究突出了多模态大语言模型 (MLLM) 在处理日语文档时面临的一个关键挑战:模型在竖排文本上的表现不佳。该研究表明,需要专门的训练数据来提高 MLLM 理解这种常见日语书写形式的能力。
引用 / 来源
查看原文
"Using these datasets, we demonstrate that the existing MLLMs perform worse on vertically written Japanese text than on horizontally written Japanese text."
A
ArXiv2025年11月19日 03:04
* 根据版权法第32条进行合法引用。