AlignAR:基于LLM的阿拉伯语-英语平行语料库句子对齐

Paper#llm🔬 Research|分析: 2026年1月4日 00:00
发布: 2025年12月26日 03:10
1分で読める
ArXiv

分析

本文解决了高质量阿拉伯语-英语平行语料库的稀缺问题,这对于机器翻译和翻译教育至关重要。它介绍了AlignAR,一种生成式句子对齐方法,以及一个专注于复杂法律和文学文本的新数据集。主要贡献在于展示了基于LLM的方法相对于传统方法的优越性能,尤其是在旨在挑战对齐算法的“Hard”子集上。数据集和代码的开源也是一个重要贡献。
引用 / 来源
查看原文
"LLM-based approaches demonstrated superior robustness, achieving an overall F1-score of 85.5%, a 9% improvement over previous methods."
A
ArXiv2025年12月26日 03:10
* 根据版权法第32条进行合法引用。