KaniTTS2:多言語対応のオープンソース音声クローニングモデル
分析
KaniTTS2は、音声クローニング機能を備え、多言語対応の画期的なオープンソースのテキスト-トゥ-スピーチモデルです!3GBのVRAMしか必要としない小さなフットプリントが魅力的です。さらに、完全な事前トレーニングコードを公開しており、誰もが任意の言語でTTSモデルを作成できるようになります!
重要ポイント
引用・出典
原文を見る"完全な事前トレーニングフレームワークを公開しているので、誰もが自分の言語、アクセント、またはドメインのTTSモデルをトレーニングできます。"