満州語TTS:絶滅危惧言語のための高品質音声合成

Research Paper#Speech Synthesis, Low-Resource Language Processing, Endangered Languages🔬 Research|分析: 2026年1月3日 16:26
公開: 2025年12月27日 06:21
1分で読める
ArXiv

分析

この論文は、データ不足と複雑な膠着語という課題に直面している絶滅危惧言語である満州語の音声合成に取り組んでいます。提案されたManchuTTSモデルは、階層的なテキスト表現、クロスモーダルアテンション、フローマッチングTransformer、階層的対照損失などの革新的な技術を導入して、これらの課題を克服しています。専用データセットの作成とデータ拡張も、モデルの有効性に貢献しています。高いMOSスコアと、膠着語の発音と韻律の自然さの大幅な改善を含む結果は、低リソース音声合成と言語保存の分野へのこの論文の重要な貢献を示しています。
引用・出典
原文を見る
"ManchuTTS attains a MOS of 4.52 using a 5.2-hour training subset...outperforming all baseline models by a notable margin."
A
ArXiv2025年12月27日 06:21
* 著作権法第32条に基づく適法な引用です。