tomwinner 发表于 2024-11-11 21:17:11

很好哟,谢谢

tdwfwsk 发表于 2024-11-11 21:44:20

训练后的模型只能在启动模型微调的测试模型里加载,一键启动推理要怎么加载自己微调训练的模型?

jjh8888 发表于 2024-11-11 21:49:38

无言以对 发表于 2024-11-11 20:36
百度 vml_dispmd.dll 这个文件,下载到本地
复制到 C:\Windows\System32中

感谢大佬。已经正常了,我试试看:lol

jjh8888 发表于 2024-11-12 09:50:01

大佬。再请教一个问题。我昨天训练了150个模型,素材应该是没问题的,都是经过好几道处理过,去噪啥的,大概是两分多的素材。打标也是手动修改的,但是训练了这么多,还是有很多地方多或者漏,又或者乱度的情况发生(当然音质没的说,也很还原原声的),这个问题是不是我素材量少了的原因,还是说f5本身就有这方面问题(我之前用默认的也是这种情况),如果通过训练解决不了,又或者需要极大地数据集训练(比如几小时甚至几百小时)。所以不太明白这个

无言以对 发表于 2024-11-12 09:54:27

jjh8888 发表于 2024-11-12 09:50
大佬。再请教一个问题。我昨天训练了150个模型,素材应该是没问题的,都是经过好几道处理过,去噪啥的,大 ...

两分钟肯定不够。最少10分钟起,我测试过的都是10分钟以上的,效果都很好。

klxq 发表于 2024-11-12 10:13:09

ganxiefenxiang

jjh8888 发表于 2024-11-12 10:23:21

无言以对 发表于 2024-11-12 09:54
两分钟肯定不够。最少10分钟起,我测试过的都是10分钟以上的,效果都很好。 ...

嗯嗯。好的,我回头整理一下

fqshl 发表于 2024-11-12 11:17:31

研究研究,谢谢大佬

chicken13 发表于 2024-11-12 13:29:23

大佬辛苦!

泷洲小黎 发表于 2024-11-12 14:41:30

感谢分享
页: 1 2 3 4 5 6 7 8 9 [10] 11 12 13
查看完整版本: F5-TTS V4版 - 接入千问大语言模型,上海交大最新零样本语音克隆,文本转语音 本地一键整合包下载