TabiBERT:トルコ語NLPのためのモダンBERT

Paper#NLP, Language Modeling, Turkish Language🔬 Research|分析: 2026年1月3日 16:15
公開: 2025年12月28日 20:18
1分で読める
ArXiv

分析

この論文は、ModernBERTアーキテクチャに基づいた、トルコ語用の新しい大規模言語モデルであるTabiBERTを紹介しています。モダンで、ゼロからトレーニングされたトルコ語エンコーダーの不足に対処しています。この論文の重要性は、高性能で効率的、かつ長いコンテキストモデルを提供することにより、トルコ語NLPに貢献している点にあります。統一されたベンチマークフレームワークであるTabiBenchの導入は、将来の研究のための標準化された評価プラットフォームを提供することにより、この論文の影響をさらに高めています。
引用・出典
原文を見る
"TabiBERT attains 77.58 on TabiBench, outperforming BERTurk by 1.62 points and establishing state-of-the-art on five of eight categories."
A
ArXiv2025年12月28日 20:18
* 著作権法第32条に基づく適法な引用です。