低リソース言語における希望発話検出のための多言語フレームワーク
Paper#NLP, Hope Speech Detection, Multilingual, Low-Resource Languages, Transformers🔬 Research|分析: 2026年1月3日 16:22•
公開: 2025年12月27日 21:23
•1分で読める
•ArXiv分析
この論文は、NLPにおける希望発話の過小評価、特にウルドゥー語のような低リソース言語における問題を扱っています。事前学習済みのTransformerモデル(XLM-RoBERTa、mBERT、EuroBERT、UrduBERT)を活用して、希望発話検出のための多言語フレームワークを作成しています。ウルドゥー語に焦点を当て、PolyHope-M 2025ベンチマークで高いパフォーマンスを示し、他の言語でも競争力のある結果を達成していることから、既存の多言語モデルをリソース制約のある環境に適用し、肯定的なオンラインコミュニケーションを促進する可能性を示しています。
重要ポイント
引用・出典
原文を見る"Evaluations on the PolyHope-M 2025 benchmark demonstrate strong performance, achieving F1-scores of 95.2% for Urdu binary classification and 65.2% for Urdu multi-class classification, with similarly competitive results in Spanish, German, and English."