Google Gemini 3.1 Flash TTS:新一代 AI 语音技术

来源: 今日头条 - @科技资讯速报站 微头条 (2026-04-19)
原文链接: https://m.toutiao.com/w/1862792876423180/

核心亮点

最酷的功能

可以用自然语言来控制声音:调整语速、语调、情感风格,就像在给 AI 下导演指令。

与现有 TTS 方案对比

方案 优势 劣势
Azure TTS (当前 courseware-tts 使用) 成熟稳定,中文双声优 需要 API Key,按量计费
ElevenLabs (sag) 声音克隆,情感丰富 价格较高
Gemini 3.1 Flash TTS 自然语言控制,70+ 语言,内置水印 新发布,生态待验证
OpenAI TTS 简单易用 声音选择有限

潜在应用

#AI #TTS #Google #Gemini #语音合成 #语音技术