Google Gemini 3.1 Flash TTS:新一代 AI 语音技术
来源: 今日头条 - @科技资讯速报站 微头条 (2026-04-19)
原文链接: https://m.toutiao.com/w/1862792876423180/
核心亮点
- 超自然音质 — TTS 榜单拿下 1211 高分
- 70+ 语言支持 — 全球通用
- AI 生成检测 — 内置 SynthID 水印
最酷的功能
可以用自然语言来控制声音:调整语速、语调、情感风格,就像在给 AI 下导演指令。
与现有 TTS 方案对比
| 方案 | 优势 | 劣势 |
|---|---|---|
| Azure TTS (当前 courseware-tts 使用) | 成熟稳定,中文双声优 | 需要 API Key,按量计费 |
| ElevenLabs (sag) | 声音克隆,情感丰富 | 价格较高 |
| Gemini 3.1 Flash TTS | 自然语言控制,70+ 语言,内置水印 | 新发布,生态待验证 |
| OpenAI TTS | 简单易用 | 声音选择有限 |
潜在应用
- 替代或补充 courseware-tts 的 Azure TTS
- 多语言课件音频生成
- Agent 语音交互(结合 OpenClaw 的 TTS 技能)
#AI #TTS #Google #Gemini #语音合成 #语音技术