无言以对 发表于 2025-5-23 10:10:52

F5-TTS V6版 - 零样本免训练语音克隆,文本转语音软件 支持50系显卡 本地一键整合包下载


F5-TTS 是来自上海交通大学、剑桥大学和吉利汽车研究院的研究团队推出了一种全新的文本到语音(TTS)系统,名为 F5-TTS。它以其高效、自然和多语言支持的特点脱颖而出,接近商用水平。支持免训练,上传一段3秒音频实现一键声音克隆和文本生成语音等功能。
F5-TTS 包含两种语音模型,F5-TTS 和 E2-TTS,应用较多且成熟的是F5-TTS,E2-TTS在某些场景下,也有不错的推理效果,大家可以多对比尝试。

今天分享的 F5-TTS V6版,主要包含以下内容:
新增对50系显卡的支持;
同步更新了官方最新的 FT-TTS V1模型,推理和训练速度更快,效果更好;
同步官方源代码;

因新版主要新了推理模型,所以该版只做了推理启动。如需微调模型,请下载 F5-TTS V4版


应用领域

智能助手‌:如导航、客服机器人,让交互更自然。
有声书创作:利用 F5-TTS,作者可以快速将其书籍转化为有声书,节省录音时间,并保持书籍原有的情感与语调。
在线学习内容开发:教育工作者可以使用 F5-TTS 制作高质量的语音学习资料,提高在线教学的互动性,并帮助学生更好地吸收知识。
配音制作:对于电影、广告及视频游戏等领域,F5-TTS 提供了丰富的声音选择,帮助内容创作者实现理想中的配音效果。
播客制作:播客主可以使用 F5-TTS 生成具有专业效果的音频内容,以吸引听众的注意。
游戏角色对话:开发者能够快速创建多种声音,赋予游戏角色更丰富的个性化声音,增强玩家的沉浸感。


使用教程:(建议N卡,显存4G起。CPU可运行,速度略慢。支持50系显卡,基于CUDA12.8)

上传参考音频,输入需要生成的文本,生成即可
多人会话页面有使用说明,参考页面格式
语音聊天功能需要加载模型,等待模型下载完成,上传参考音频,输入聊天指令即可实现参考音频聊天互动。

如遇 ‘ModuleNotFoundError: No module named 'f5_tts'’ 错误,可下载此补丁: https://pan.quark.cn/s/f4fb2221f3af 复制到一键包目录,右键,解压到当前文件夹,根据提示覆盖。再运行一键启动。


下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOSNn7xMk25EMGu33C6jrdLRA1?pwd=ufvi (默认不自带模型,首次运行会自动下载。请耐心等待模型下载完成)
百度网盘:**** 本内容需购买 ****

解压密码:https://deepfaces.cc/ 复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可

szfjm 发表于 2025-5-23 13:33:22

Traceback (most recent call last):
File "P:\Ai_video\F5-TTS-V6\deepface\lib\runpy.py", line 196, in _run_module_as_main
    return _run_code(code, main_globals, None,
File "P:\Ai_video\F5-TTS-V6\deepface\lib\runpy.py", line 86, in _run_code
    exec(code, run_globals)
File "P:\Ai_video\F5-TTS-V6\src\f5_tts\infer\infer_gradio.py", line 38, in <module>
    from f5_tts.infer.utils_infer import (
ModuleNotFoundError: No module named 'f5_tts'
Press any key to continue . . .
与上个版本一样,还是遇到这个问题

szfjm 发表于 2025-5-23 13:42:52

把上次那个补丁覆盖后,下载了模型,然后就卡在这儿了

Download Vocos from huggingface charactr/vocos-mel-24khz

vocab :P:\Ai_video\F5-TTS-V6\src\f5_tts\infer\examples\vocab.txt
token :custom
model :cache\hub\models--SWivid--F5-TTS\snapshots\84e5a410d9cead4de2f847e7c9369a6440bdfaca\F5TTS_v1_Base\model_1250000.safetensors

P:\Ai_video\F5-TTS-V6\src\f5_tts\infer\infer_gradio.py:606: UserWarning: You have not specified a value for the `type` parameter. Defaulting to the 'tuples' format for chatbot messages, but this is deprecated and will be removed in a future version of Gradio. Please set type='messages' instead, which uses openai-style dictionaries with 'role' and 'content' keys.
chatbot_interface = gr.Chatbot(label="交谈")
程序正在启动...
* Running on local URL:http://127.0.0.1:7860
* 整合包制作:https://deepfaces.cc
* To create a public link, set `share=True` in `launch()`.

无言以对 发表于 2025-5-23 14:00:42

szfjm 发表于 2025-5-23 13:42
把上次那个补丁覆盖后,下载了模型,然后就卡在这儿了

Download Vocos from huggingface charactr/vocos-m ...

下载这个覆盖
https://pan.quark.cn/s/f4fb2221f3af

lujun1996 发表于 2025-5-23 18:48:11

szfjm 发表于 2025-5-23 13:42
把上次那个补丁覆盖后,下载了模型,然后就卡在这儿了

Download Vocos from huggingface charactr/vocos-m ...

软件使用的好不好,确实是需要大家不停的尝试哦

jhza1 发表于 2025-5-30 09:18:30

提示找不到文件

res = Popen(command, stdin=stdin_parameter, stdout=PIPE, stderr=PIPE)
File "E:\F5V6\deepface\lib\subprocess.py", line 971, in __init__
    self._execute_child(args, executable, preexec_fn, close_fds,
File "E:\F5V6\deepface\lib\subprocess.py", line 1456, in _execute_child
    hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
FileNotFoundError: 系统找不到指定的文件。

jiangxiaobai 发表于 2025-6-6 11:03:00

生产显示错误
File "E:\声音克隆\F5-TTS-V6\F5-TTS-V6\deepface\lib\subprocess.py", line 1456, in _execute_child
    hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
FileNotFoundError: 系统找不到指定的文件。

jiangxiaobai 发表于 2025-6-6 11:04:18

jiangxiaobai 发表于 2025-6-6 11:03
生产显示错误
File "E:\声音克隆\F5-TTS-V6\F5-TTS-V6\deepface\lib\subprocess.py", line 1456, in _execu ...

这个怎么解决呀,大佬
页: [1]
查看完整版本: F5-TTS V6版 - 零样本免训练语音克隆,文本转语音软件 支持50系显卡 本地一键整合包下载