VoxCPM2 — Tokenizer-Free TTS 多语言语音生成

Type: repo
Author: OpenBMB团队(清华大学NLP实验室)
Primary Topic: 行业动态
Ingested: 2026-05-31

Summary

VoxCPM2是OpenBMB发布的无分词器端到端TTS系统,基于扩散自回归架构,拥有2B参数并训练于超200万小时多语言语音数据,支持30种语言和48kHz录音室级别音频输出。系统提供声音设计、可控克隆、极致克隆和多语言合成四大核心能力,无需语言标签即可直接处理多语言输入。作为完全开源项目,VoxCPM2在中文多语言场景和自然度方面具有差异化优势,可与ElevenLabs、OpenAI Voice Engine等商业产品竞争。

Key Concepts

Entities

Source

Relations


Auto-generated on 2026-05-31