research#voice📝 Blog分析: 2026年1月21日 23:32

Chroma 1.0: 颠覆实时口语对话,个性化声音克隆!

发布:2026年1月21日 19:29
1分で読める
r/StableDiffusion

分析

Chroma 1.0 是一款开创性的开源模型,为实时口语对话树立了新标准。它拥有令人难以置信的快速端到端处理时间和令人印象深刻的语音克隆能力,只需几秒钟的音频即可实现。这项研究令人兴奋,因为它有潜力改变我们与 AI 交互的方式。

引用

原生语音到语音 (无 ASR → LLM → TTS 流程)