TabiBERT:用于土耳其语NLP的现代BERT

Paper#NLP, Language Modeling, Turkish Language🔬 Research|分析: 2026年1月3日 16:15
发布: 2025年12月28日 20:18
1分で読める
ArXiv

分析

本文介绍了 TabiBERT,一个基于 ModernBERT 架构的土耳其语新型大型语言模型。它解决了缺乏从头开始训练的现代土耳其语编码器的问题。本文的重要性在于它通过提供高性能、高效且长上下文的模型,为土耳其语 NLP 做出贡献。 TabiBench 的引入,一个统一的基准测试框架,通过为未来的研究提供一个标准化的评估平台,进一步增强了本文的影响。
引用 / 来源
查看原文
"TabiBERT attains 77.58 on TabiBench, outperforming BERTurk by 1.62 points and establishing state-of-the-art on five of eight categories."
A
ArXiv2025年12月28日 20:18
* 根据版权法第32条进行合法引用。