使用Graph-of-Thoughts在全双工语音中进行推理

发布:2025年12月25日 15:00
1分で読める
ArXiv

分析

本文探讨了通过关注对话行为推理来构建更自然、更智能的全双工交互系统这一挑战。核心贡献是使用Graph-of-Thoughts (GoT) 进行语音行为因果推理的新框架,使系统能够理解和预测对话流程。结合模拟和真实世界数据的混合训练语料库的使用也很重要。本文的重要性在于它有可能提高对话式AI的自然度和响应速度,特别是在同时语音很常见的全双工场景中。

引用

GoT框架将流式预测构建为不断演进的图,使多模态转换器能够预测下一个语音行为,为其决策生成简洁的理由,并动态地完善其推理。