Google、約70の言語に対応した非常に表現力豊かな「Gemini 3.1 Flash TTS」モデルを発表

product#voice📝 Blog|分析: 2026年4月15日 22:47
公開: 2026年4月15日 19:39
1分で読める
cnBeta

分析

Googleは、非常に表現力豊かなテキスト読み上げソリューションである「Gemini 3.1 Flash TTS」の公開により、音声生成を次のレベルへと引き上げました。シンプルなプロンプトエンジニアリングを通じて、感情やテンポ、スタイルを緻密に制御できるようにすることで、自然な音声を必要とするアプリケーションの新たな領域を切り開いています。自動検出機能付きの約70言語という大規模なサポートは、世界的なアクセシビリティを劇的に向上させ、低遅延(レイテンシ)で滑らかなAIエージェントの対話への道を拓きます。
引用・出典
原文を見る
"新モデルは、自然で高忠実度の音声を生成できるだけでなく、ナレーションや対話におけるトーン、間、感情の変化を正確に調整するなど、プロンプトを通じて音声の感情、テンポ、スタイルを制御できるようにしています。"
C
cnBeta2026年4月15日 19:39
* 著作権法第32条に基づく適法な引用です。