GPT-SoVITS V3版,业界最强的AI语音克隆软件,文本转语音、零样本推理,更强的V3模型 本地一键整合包下载
GPT-SoVITS软件由RVC变声器创始人“花儿不哭”大佬开发,GPT-SoVITS的面世,彻底结束了语音克隆被商业垄断的历史,只要你有一张显卡,也能玩曾经高大上的语音克隆了。今天分享的GPT-SoVITS V3版,同步官方最新的V3模型,零样本推理效果更好了。
软件下载后,解压出来,建议解压到非中文目录下,切记!在所有操作前,准备好需要克隆的声音素材,要求无杂音,吐齿清晰,1-3分钟左右即可。
素材的质量,决定合成的效果。
解压后,运行 go-webui.bat,即可启动webUI界面,后期所有的操作,就在整个页面进行。模型训练更多操作,可以参考 GPT-SoVITS V2版关于模型训练,可以参考V2版教程,这里只说下V3版的0样本推理,操作参考上图。启动 一键推理.bat,然后按照上图操作即可。
UI最上方有官方的使用教程手册,想系统的学习可以参考:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e
V3新增功能:UVR51.将hp2模型替换为model_bs_roformer_ep_317_sdr_12.9755模型,大幅提升分离人声的效果2.新增DeEchoNormal和DeReverb模型。去混响效果Normal<Aggressive<DeReverb
切分&降噪&打标&校对1.自动填充路径2.funasr增加粤语,whisper增加韩语和粤语标注功能。funasr的粤语标注更为准确3.whisper可选推理精度,float16可以带来更快的推理速度
预处理1.中文改为G2PW处理以优化多音字效果,但处理速度变慢了2.优化了英文多音字效果,处理速度也变快了
训练1.全新底膜,训练集增加到5k小时2.增加韩粤两种语言3.训练所需数据集更少
推理1.zero shot效果大幅增强2.中日英韩粤5个语种均可跨语种合成3.对低音质参考音频合成出来音质更好4.更好的文本前端,中英文加入多音字优化5.增加语速调节6.增加音色融合
下载地址:夸克网盘:https://pan.quark.cn/s/b6a338919ac0 百度网盘:**** Hidden Message ***** 谢谢分享 谢谢分享 謝謝分享,來試試 又更新了,看看效果比V2怎么样 好像很厉害的样子 感谢分享 ModuleNotFoundError: No module named 'feature_extractor'
请按任意键继续. . .
好像很厉害的样子 好像很厉害的样子