research#llm🔬 Research分析: 2026年1月30日 05:02

UrduBench:通过创新翻译,开创乌尔都语推理评估

发布:2026年1月30日 05:00
1分で読める
ArXiv NLP

分析

这项研究介绍了 UrduBench,这是评估乌尔都语大型语言模型(LLM)推理能力的重要一步。 具有人机交互验证的上下文集成翻译框架,为创建低资源语言的标准化推理基准测试提供了有希望的解决方案。

引用 / 来源
查看原文
"在本文中,我们提出了一个上下文集成翻译框架,通过人工介入验证,利用多个翻译系统来开发乌尔都语推理基准,同时保持上下文和结构的完整性。"
A
ArXiv NLP2026年1月30日 05:00
* 根据版权法第32条进行合法引用。