针对构音障碍的语音识别革新:基于大语言模型的准确性提升!
分析
这项研究介绍了一种突破性的方法,用于改善患有构音障碍的人的自动语音识别 (ASR),超越了传统的单词错误率 (WER)。 通过使用基于大语言模型 (LLM) 的智能体,该系统实现了显着的语义提升,展示了为受言语障碍影响的人显着增强沟通的潜力。
要点
引用 / 来源
查看原文"在多角度评估下,我们的智能体实现了14.51% 的 WER 降低以及实质性的语义提升,包括在具有挑战性的样本上,MENLI 提升了 +7.59 pp,Slot Micro F1 提升了 +7.66 pp。"
A
ArXiv Audio Speech2026年1月30日 05:00
* 根据版权法第32条进行合法引用。