马上注册,下载更多AI资源软件
您需要 登录 才可以下载或查看,没有账号?立即注册
×
VoxCPM V3版 - 更新VoxCPM2,真人级多语言声音克隆 自然语言设计声音 一键整合包下载 ... ... ... ... ... ...
VoxCPM 是一个开源的文本转语音(TTS)系统,它的最大特点是“无分词器”设计,可以直接从文字生成连续的语音信号,实现更自然的语音合成和逼真的声音克隆。它支持多语言,能在实时场景下运行,并且只需一段短音频就能模仿说话者的声音。
简单说就是:你输入文字,它就能生成非常自然、像真人说话一样的音频。
传统语音合成像“先把文字切成小块(token),再一块块拼声音”,容易听起来生硬、机器味重。 VoxCPM 直接跳过“切块”这一步,用扩散自回归的方式,一口气生成连续的语音流,听起来更自然、更有感情、更像真人。
今天分享的 VoxCPM V3版,更新官方最新的 VoxCPM2,测试下来,应该是截至目前已知开源界里,在“自然度、克隆效果、创意控制”上表现最强的 TTS(文字转语音)项目,尤其是“极致克隆模式”功能,几乎是一比一复刻原声,非常适合对声音克隆相似度要求高的群体。
主要特点
多语言支持:
直接支持30种语言(包括中文、英语、日语、韩语、阿拉伯语等),还能支持多种中文方言(粤语、四川话、东北话等)。输入什么语言的文字,就直接说出来,不用额外标语言。
语音设计(Voice Design):
最酷的功能!不需要任何参考声音,你用自然语言描述就能生成新声音(性别、年龄、音色、情绪、语速……)凭空创建全新音色。比如输入“(一个温柔甜美的年轻女生,声音轻快带点笑意) 你好呀,今天天气真好”,它就能按描述生成声音。
声音克隆(Voice Cloning):
普通克隆:给一小段参考音频,就能模仿那个人的音色。
可控克隆:一边克隆音色,一边还能调整“说话快点、开心点、严肃点”等风格。
极致克隆:给参考音频+对应文字,能几乎完美复刻包括语气、节奏、情感在内的所有细节。
上下文感知:
能根据文本内容自动调整语调、节奏和情感,让语音更贴近真实交流。
音质高:直接输出48kHz的工作室级音质(比普通音频清晰很多),支持实时流式输出(边生成边播放)。
应用领域
内容创作:有声书、视频配音、短视频、播客自动生成声音。
虚拟主播/数字人:给AI角色配音,支持定制不同性格的声音。
教育/无障碍:多语言朗读、给视障人士朗读文字。
游戏/娱乐:生成NPC对话、个性化角色语音。
客服/智能助手:自然的多语言语音交互。
个性化语音:帮普通人“复活”声音、制作个性化语音包等。
使用教程:(建议N卡,显存6G起,支持50系显卡)
下载主程序和模型(models文件夹),解压主程序一键包,将models文件夹移动到主程序目录下即可
支持声音设计、声音克隆(包括可控克隆和极致克隆),启动后,页面有详细说明,参考页面说明使用即可
支持的语言(30种)
阿拉伯语、缅甸语、中文、丹麦语、荷兰语、英语、芬兰语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、高棉语、韩语、老挝语、马来语、挪威语、波兰语、葡萄牙语、俄语、西班牙语、斯瓦希里语、瑞典语、菲律宾语、泰语、土耳其语、越南语 中国方言:四川话、粤语、吴语、东北话、河南话、陕西话、山东话、天津话、闽南话
软件目录结构
📂 models/
├── 📂 VoxCPM2/
│ └── model.safetensors
│ └── audiovae.pth
📂 deepface/
```
下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOpkBgFRNpnxehIQSQNzy2_7A1?pwd=zxaw
夸克网盘:
🔒付费内容 游客, 上上宾会员 可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 30碎银 下载该资源
百度网盘:
🔒付费内容 游客, 上上宾会员 可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 50碎银 下载该资源
|