AlignAR:アラビア語-英語並列コーパスのためのLLMベースの文アライメント

Paper#llm🔬 Research|分析: 2026年1月4日 00:00
公開: 2025年12月26日 03:10
1分で読める
ArXiv

分析

この論文は、機械翻訳と翻訳教育に不可欠な高品質のアラビア語-英語並列コーパスの不足に対処しています。AlignARという生成的な文アライメント手法と、複雑な法律および文学テキストに焦点を当てた新しいデータセットを紹介しています。主な貢献は、従来のメソッドと比較して、LLMベースのアプローチが優れたパフォーマンスを発揮することを示したことです。特に、アライメントアルゴリズムに挑戦するように設計された「Hard」サブセットにおいて顕著です。データセットとコードのオープンソース化も重要な貢献です。
引用・出典
原文を見る
"LLM-based approaches demonstrated superior robustness, achieving an overall F1-score of 85.5%, a 9% improvement over previous methods."
A
ArXiv2025年12月26日 03:10
* 著作権法第32条に基づく適法な引用です。