全二重音声におけるGraph-of-Thoughtsを用いた推論

公開:2025年12月25日 15:00
1分で読める
ArXiv

分析

この論文は、会話行動の推論に焦点を当てることで、より自然でインテリジェントな全二重インタラクティブシステムの構築という課題に取り組んでいます。主要な貢献は、Graph-of-Thoughts (GoT) を使用して発話行為の因果推論を行う新しいフレームワークであり、システムが会話の流れを理解し予測することを可能にします。シミュレーションと現実世界のデータを組み合わせたハイブリッドトレーニングコーパスの使用も重要です。この論文の重要性は、特に同時発話が一般的な全二重シナリオにおいて、会話型AIの自然さと応答性を向上させる可能性にあります。

参照

GoTフレームワークは、ストリーミング予測を進化するグラフとして構造化し、マルチモーダルトランスフォーマーが次の発話行為を予測し、決定に対する簡潔な正当化を生成し、その推論を動的に洗練することを可能にします。