多模态大语言模型在竖排日文文本上表现不佳:新研究揭示性能差距Research#MLLMs🔬 Research|分析: 2026年1月26日 11:43•发布: 2025年11月19日 03:04•1分で読める•ArXiv分析这项研究突出了多模态大语言模型 (MLLM) 在处理日语文档时面临的一个关键挑战:模型在竖排文本上的表现不佳。该研究表明,需要专门的训练数据来提高 MLLM 理解这种常见日语书写形式的能力。要点•与横排文本相比,MLLM 在竖排日文文本上的准确度有所下降。•为微调和评估创建了一个合成的日语 OCR 数据集。•使用合成数据集进行训练可提高竖排文本的性能。引用 / 来源查看原文"Using these datasets, we demonstrate that the existing MLLMs perform worse on vertically written Japanese text than on horizontally written Japanese text."AArXiv2025年11月19日 03:04* 根据版权法第32条进行合法引用。较旧On Decision-Making Agents and Higher-Order Causal Processes较新Evaluating Multimodal Large Language Models on Vertically Written Japanese Text相关分析Research人类AI检测2026年1月4日 05:47Research侧重于实现的深度学习书籍2026年1月4日 05:49Research个性化 Gemini2026年1月4日 05:49来源: ArXiv