TrGLUEとSentiTurcaの紹介:トルコ語NLPのベンチマーク
Research Paper#Natural Language Processing, Benchmarking, Turkish Language, LLMs🔬 Research|分析: 2026年1月3日 16:32•
公開: 2025年12月26日 18:02
•1分で読める
•ArXiv分析
この論文は、トルコ語の自然言語理解(NLU)と感情分析のための包括的なベンチマークの欠如に対処しています。GLUEスタイルのベンチマークであるTrGLUEと、感情分析ベンチマークであるSentiTurcaを紹介し、NLP分野における大きなギャップを埋めています。これらのベンチマークの作成と提供されたコードは、TransformerやLLMを含むトルコ語NLPモデルの研究と評価を促進します。半自動データ作成パイプラインも注目に値し、データセット生成のためのスケーラブルで再現可能な方法を提供しています。
重要ポイント
引用・出典
原文を見る"TrGLUE comprises Turkish-native corpora curated to mirror the domains and task formulations of GLUE-style evaluations, with labels obtained through a semi-automated pipeline that combines strong LLM-based annotation, cross-model agreement checks, and subsequent human validation."