LLMベースASRにおけるコンテキストバイアス

分析

この論文は、大規模言語モデル(LLM)ベースの自動音声認識(ASR)における、特に固有名詞やホットワードに対するコンテキストバイアスの課題に取り組んでいます。ホットワード検索とLLM-ASR適応を統合した2段階のフレームワークを提案しています。その重要性は、特に大規模語彙と特定のキーワード(ホットワード)を認識する必要があるシナリオにおいて、ASRのパフォーマンスを向上させることにあります。強化学習(GRPO)を用いたファインチューニングも注目に値します。
引用・出典
原文を見る
"The framework achieves substantial keyword error rate (KER) reductions while maintaining sentence accuracy on general ASR benchmarks."
A
ArXiv2025年12月26日 02:10
* 著作権法第32条に基づく適法な引用です。