KaniTTS2:开源语音克隆TTS模型发布!

research#voice📝 Blog|分析: 2026年2月14日 20:32
发布: 2026年2月14日 19:02
1分で読める
r/StableDiffusion

分析

KaniTTS2 引入了一款开创性的开源文本转语音模型,能够进行语音克隆,并且仅需3GB的VRAM即可运行。 这对于生成式人工智能的可访问性来说是一个巨大的进步,承诺了实时对话应用以及用你自己的语言训练模型的能力。 完整预训练代码的发布对于研究人员和开发人员来说是一场变革。
引用 / 来源
查看原文
"我们正在发布完整的预训练框架,以便任何人都可以为他们自己的语言、口音或领域训练 TTS 模型。"
R
r/StableDiffusion2026年2月14日 19:02
* 根据版权法第32条进行合法引用。