Higgs Audio v3 TTS：Boson AI 开源 4B 语音生成模型

Type: repo
Author: Boson AI
Primary Topic: AI工具
Ingested: 2026-06-10

Summary

Higgs Audio v3 是 Boson AI 开源的 4B 参数自回归语音生成模型，支持 100+ 语言的高质量文本转语音。模型最大亮点是通过内联控制标签实现情绪、语速、音高等细粒度表现力控制，同时支持零样本声音克隆和实时流式输出。提供 OpenAI 兼容 API 和基于 SGLang-Omni 的本地自托管两种使用方式。

Key Concepts

文本转语音
零样本声音克隆
内联情绪控制
多语言支持
自回归语音生成
流式TTS输出

Entities

Boson AI
Higgs Audio v3
SGLang
HuggingFace
OmniVoice

Source

Raw: higgs-audio-v3-tts-boson-ai.md

Relations

(none)

Auto-generated on 2026-06-10