AlignAR:基于LLM的阿拉伯语-英语平行语料库句子对齐Paper#llm🔬 Research|分析: 2026年1月4日 00:00•发布: 2025年12月26日 03:10•1分で読める•ArXiv分析本文解决了高质量阿拉伯语-英语平行语料库的稀缺问题,这对于机器翻译和翻译教育至关重要。它介绍了AlignAR,一种生成式句子对齐方法,以及一个专注于复杂法律和文学文本的新数据集。主要贡献在于展示了基于LLM的方法相对于传统方法的优越性能,尤其是在旨在挑战对齐算法的“Hard”子集上。数据集和代码的开源也是一个重要贡献。要点•解决了高质量阿拉伯语-英语平行语料库的缺乏问题。•介绍了AlignAR,一种生成式句子对齐方法。•提出了一个包含复杂法律和文学文本的新数据集。•展示了基于LLM的对齐方法的优越性能。•强调了传统对齐方法在具有挑战性的数据集上的局限性。•开源了数据集和代码。引用 / 来源查看原文"LLM-based approaches demonstrated superior robustness, achieving an overall F1-score of 85.5%, a 9% improvement over previous methods."AArXiv2025年12月26日 03:10* 根据版权法第32条进行合法引用。较旧A Statistical Side-Channel Risk Model for Timing Variability in Lattice-Based Post-Quantum Cryptography较新Evaluation of Turbulence Models and Boundary Conditions for Hybrid Ventilation in Reduced-scale Classroom Model相关分析Paper基于选择策略的协调人形机器人操作2026年1月3日 06:10Paper从未对齐图像即时进行3D场景编辑2026年1月3日 06:10Paper用于未来预测的LLM预测2026年1月3日 06:10来源: ArXiv