KaniTTS2:多言語対応のオープンソース音声クローニングモデル

research#voice📝 Blog|分析: 2026年2月14日 20:31
公開: 2026年2月14日 18:48
1分で読める
r/LocalLLaMA

分析

KaniTTS2は、音声クローニング機能を備え、多言語対応の画期的なオープンソースのテキスト-トゥ-スピーチモデルです!3GBのVRAMしか必要としない小さなフットプリントが魅力的です。さらに、完全な事前トレーニングコードを公開しており、誰もが任意の言語でTTSモデルを作成できるようになります!
引用・出典
原文を見る
"完全な事前トレーニングフレームワークを公開しているので、誰もが自分の言語、アクセント、またはドメインのTTSモデルをトレーニングできます。"
R
r/LocalLLaMA2026年2月14日 18:48
* 著作権法第32条に基づく適法な引用です。