Higgs Audio v3 TTS:Boson AI 开源 4B 语音生成模型
Type: repo
Author: Boson AI
Primary Topic: AI工具
Ingested: 2026-06-10
Summary
Higgs Audio v3 是 Boson AI 开源的 4B 参数自回归语音生成模型,支持 100+ 语言的高质量文本转语音。模型最大亮点是通过内联控制标签实现情绪、语速、音高等细粒度表现力控制,同时支持零样本声音克隆和实时流式输出。提供 OpenAI 兼容 API 和基于 SGLang-Omni 的本地自托管两种使用方式。
Key Concepts
- 文本转语音
- 零样本声音克隆
- 内联情绪控制
- 多语言支持
- 自回归语音生成
- 流式TTS输出
Entities
- Boson AI
- Higgs Audio v3
- SGLang
- HuggingFace
- OmniVoice
Source
Relations
- (none)
Auto-generated on 2026-06-10