KaniTTS2：开源语音克隆TTS模型发布！

research #voice 📝 Blog|分析: 2026年2月14日 20:32•

发布: 2026年2月14日 19:02

•

1分で読める

分析

KaniTTS2 引入了一款开创性的开源文本转语音模型，能够进行语音克隆，并且仅需3GB的VRAM即可运行。这对于生成式人工智能的可访问性来说是一个巨大的进步，承诺了实时对话应用以及用你自己的语言训练模型的能力。完整预训练代码的发布对于研究人员和开发人员来说是一场变革。

引用 / 来源

"我们正在发布完整的预训练框架，以便任何人都可以为他们自己的语言、口音或领域训练 TTS 模型。"

r/StableDiffusion2026年2月14日 19:02

* 根据版权法第32条进行合法引用。

KaniTTS2: Open-Source Voice Cloning Model with Multilingual Support

Handwritten Digit Recognition Web App Goes Live!