无言以对 发表于 5 天前

ChatterBox V2版 - 轻量且支持多语言的文本转语音系统 支持50系显卡 一键整合包下载


Chatterbox 是由 Resemble AI 开发的一款‌开源多语言文本转语音(TTS)模型‌,特点是‌支持23种语言‌,并且能实现‌零样本语音克隆‌(即用极短的语音样本克隆出相似的声音)。它基于强大的 0.5B Llama 模型架构,训练数据超过 50 万小时,性能媲美 ElevenLabs 等商业闭源方案,甚至在某些评测中更受用户青睐。

今天分享的 ChatterBox V2版,在官方的基础上,集成了包含中文等23种多国语言支持,新增了自定义音色功能。特点是小巧轻量,只有0.5B的参数量,且纯CPU即可实现快速生成。


核心特点‌ ‌

多语言支持‌:涵盖中文、英语、日语、法语、西班牙语等23种语言,适合全球化应用。 ‌
情感控制‌:可调整语音的‌夸张程度‌(如让声音更激昂或更平静),适合游戏、动画配音等场景。 ‌
零样本克隆‌:仅需几秒的语音样本,就能合成相似的声音,无需额外训练。 ‌
低延迟‌:生成速度快,适合实时交互场景(如AI助手、游戏NPC)。 ‌
水印技术‌:内置防滥用机制,所有生成音频均含不可见水印,可追踪来源。 ‌


应用领域‌

游戏/动画‌:为角色生成多语言配音,调整情感表现。 ‌
短视频/自媒体‌:快速制作多语言旁白或搞笑语音。 ‌
AI助手‌:提升语音交互的自然度,支持个性化音色。 ‌
教育‌:生成不同语言的朗读内容,辅助语言学习。


使用教程:(建议N卡,显存4G起。支持50系显卡,支持无限卡纯CPU生成)

分为TTS(文本转语音)和VC(语音转换)两种模式
TTS,和其他类似软件操作一样,输入文本,上传参考音频,生成即可。
VC,上传需要转换的音频和参考音频,提交生成即可。


如遇到 No module named "chatterbox" 报错,请将 src目录下的chatterbox目录复制到软件根目录,再启动 即可


下载地址:
123云盘:https://www.123684.com/s/OYeA-wf4Bh

百度网盘:**** 本内容需购买 ****

页: [1]
查看完整版本: ChatterBox V2版 - 轻量且支持多语言的文本转语音系统 支持50系显卡 一键整合包下载