GPT-SoVITS V3版，业界最强的AI语音克隆软件，文本转语音、零样本推理，更强的V3模型本地一键整合包下载

无言以对 发表于 2025-2-18 09:20:51

GPT-SoVITS软件由RVC变声器创始人“花儿不哭”大佬开发，GPT-SoVITS的面世，彻底结束了语音克隆被商业垄断的历史，只要你有一张显卡，也能玩曾经高大上的语音克隆了。今天分享的GPT-SoVITS V3版，同步官方最新的V3模型，零样本推理效果更好了。
软件下载后，解压出来，建议解压到非中文目录下，切记！在所有操作前，准备好需要克隆的声音素材，要求无杂音，吐齿清晰，1-3分钟左右即可。
素材的质量，决定合成的效果。
解压后，运行 go-webui.bat，即可启动webUI界面，后期所有的操作，就在整个页面进行。模型训练更多操作，可以参考 GPT-SoVITS V2版关于模型训练，可以参考V2版教程，这里只说下V3版的0样本推理，操作参考上图。启动一键推理.bat，然后按照上图操作即可。

UI最上方有官方的使用教程手册，想系统的学习可以参考：https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e
V3新增功能：UVR51.将hp2模型替换为model_bs_roformer_ep_317_sdr_12.9755模型，大幅提升分离人声的效果2.新增DeEchoNormal和DeReverb模型。去混响效果Normal<Aggressive<DeReverb
切分&降噪&打标&校对1.自动填充路径2.funasr增加粤语，whisper增加韩语和粤语标注功能。funasr的粤语标注更为准确3.whisper可选推理精度，float16可以带来更快的推理速度
预处理1.中文改为G2PW处理以优化多音字效果，但处理速度变慢了2.优化了英文多音字效果，处理速度也变快了
训练1.全新底膜，训练集增加到5k小时2.增加韩粤两种语言3.训练所需数据集更少
推理1.zero shot效果大幅增强2.中日英韩粤5个语种均可跨语种合成3.对低音质参考音频合成出来音质更好4.更好的文本前端，中英文加入多音字优化5.增加语速调节6.增加音色融合
下载地址：夸克网盘：https://pan.quark.cn/s/b6a338919ac0 百度网盘：**** Hidden Message *****

funy 发表于 2025-2-18 11:36:16

谢谢分享

53992567 发表于 2025-2-18 17:25:58

谢谢分享

eihj2002 发表于 2025-2-18 20:22:28

謝謝分享，來試試

kj123456789 发表于 2025-2-18 22:28:53

又更新了，看看效果比V2怎么样

krysan 发表于 2025-2-19 08:35:25

好像很厉害的样子

pls273329263 发表于 2025-2-19 09:45:05

感谢分享

szfjm 发表于 2025-2-19 12:45:31

ModuleNotFoundError: No module named 'feature_extractor'
请按任意键继续. . .

sy5216132 发表于 2025-2-19 22:46:07

好像很厉害的样子

sy5216132 发表于 2025-2-19 22:47:27

好像很厉害的样子

页: [1] 2 3 4 5 6 7 8

前沿AI软件资源站's Archiver

GPT-SoVITS V3版，业界最强的AI语音克隆软件，文本转语音、零样本推理，更强的V3模型 本地一键整合包下载

GPT-SoVITS V3版，业界最强的AI语音克隆软件，文本转语音、零样本推理，更强的V3模型本地一键整合包下载