F5-TTS V4版 - 接入千问大语言模型，上海交大最新零样本语音克隆，文本转语音本地一键整合包下载 - 第10页 - AI语音 - 前沿AI软件资源站

tomwinner 发表于 2024-11-11 21:17:11

很好哟，谢谢

tdwfwsk 发表于 2024-11-11 21:44:20

训练后的模型只能在启动模型微调的测试模型里加载，一键启动推理要怎么加载自己微调训练的模型？

jjh8888 发表于 2024-11-11 21:49:38

无言以对发表于 2024-11-11 20:36
百度 vml_dispmd.dll 这个文件，下载到本地
复制到 C:\Windows\System32中

感谢大佬。已经正常了，我试试看:lol

jjh8888 发表于 2024-11-12 09:50:01

大佬。再请教一个问题。我昨天训练了150个模型，素材应该是没问题的，都是经过好几道处理过，去噪啥的，大概是两分多的素材。打标也是手动修改的，但是训练了这么多，还是有很多地方多或者漏，又或者乱度的情况发生（当然音质没的说，也很还原原声的），这个问题是不是我素材量少了的原因，还是说f5本身就有这方面问题（我之前用默认的也是这种情况），如果通过训练解决不了，又或者需要极大地数据集训练（比如几小时甚至几百小时）。所以不太明白这个

无言以对 发表于 2024-11-12 09:54:27

jjh8888 发表于 2024-11-12 09:50
大佬。再请教一个问题。我昨天训练了150个模型，素材应该是没问题的，都是经过好几道处理过，去噪啥的，大 ...

两分钟肯定不够。最少10分钟起，我测试过的都是10分钟以上的，效果都很好。

klxq 发表于 2024-11-12 10:13:09

ganxiefenxiang

jjh8888 发表于 2024-11-12 10:23:21

无言以对发表于 2024-11-12 09:54
两分钟肯定不够。最少10分钟起，我测试过的都是10分钟以上的，效果都很好。 ...

嗯嗯。好的，我回头整理一下

fqshl 发表于 2024-11-12 11:17:31

研究研究，谢谢大佬

chicken13 发表于 2024-11-12 13:29:23

大佬辛苦！

泷洲小黎 发表于 2024-11-12 14:41:30

感谢分享

页: 1 2 3 4 5 6 7 8 9 [10] 11 12 13

前沿AI软件资源站's Archiver