基于LLM的ASR的上下文偏置

发布: 2025年12月26日 02:10

•

1分で読める

分析

本文解决了基于大型语言模型（LLM）的自动语音识别（ASR）中上下文偏置的挑战，特别是针对命名实体和热词。它提出了一个两阶段的框架，集成了热词检索和LLM-ASR适配。其意义在于提高ASR性能，特别是在具有大型词汇表和需要识别特定关键词（热词）的场景中。使用强化学习（GRPO）进行微调也值得关注。

引用 / 来源

"The framework achieves substantial keyword error rate (KER) reductions while maintaining sentence accuracy on general ASR benchmarks."

ArXiv2025年12月26日 02:10

* 根据版权法第32条进行合法引用。

Tilt Matching for Scalable Sampling and Fine-Tuning

AgenticTCAD: A LLM-based Multi-Agent Framework for Automated TCAD Code Generation and Device Optimization