Higgs Audio v3 TTS:Boson AI 开源 4B 语音生成模型

Type: repo
Author: Boson AI
Primary Topic: AI工具
Ingested: 2026-06-10

Summary

Higgs Audio v3 是 Boson AI 开源的 4B 参数自回归语音生成模型,支持 100+ 语言的高质量文本转语音。模型最大亮点是通过内联控制标签实现情绪、语速、音高等细粒度表现力控制,同时支持零样本声音克隆和实时流式输出。提供 OpenAI 兼容 API 和基于 SGLang-Omni 的本地自托管两种使用方式。

Key Concepts

Entities

Source

Relations


Auto-generated on 2026-06-10