基于LLM的ASR的上下文偏置

分析

本文解决了基于大型语言模型(LLM)的自动语音识别(ASR)中上下文偏置的挑战,特别是针对命名实体和热词。它提出了一个两阶段的框架,集成了热词检索和LLM-ASR适配。其意义在于提高ASR性能,特别是在具有大型词汇表和需要识别特定关键词(热词)的场景中。使用强化学习(GRPO)进行微调也值得关注。
引用 / 来源
查看原文
"The framework achieves substantial keyword error rate (KER) reductions while maintaining sentence accuracy on general ASR benchmarks."
A
ArXiv2025年12月26日 02:10
* 根据版权法第32条进行合法引用。