Google推出Gemini 3.1 Flash TTS文本转语音模型,支持近70种语言

product#voice📝 Blog|分析: 2026年4月15日 22:47
发布: 2026年4月15日 19:39
1分で読める
cnBeta

分析

Google推出了极具表现力的文本转语音解决方案Gemini 3.1 Flash TTS,将音频生成技术提升到了新的高度。通过允许开发者利用提示工程精细控制语音的情感、节奏和风格,这项突破为各种自然听感的AI应用打开了全新的大门。该模型支持自动检测约70种语言,不仅极大地提升了全球无障碍体验,还为低延迟的多模态交互铺平了道路。
引用 / 来源
查看原文
"新模型能够生成听感自然、高保真的语音,同时允许开发者通过提示词(prompt)控制语音的情感、节奏和风格,例如在旁白或对话中精确调节语气、停顿与情绪变化。"
C
cnBeta2026年4月15日 19:39
* 根据版权法第32条进行合法引用。