设为首页收藏本站 劰载中...

 找回密码
 立即注册
查看: 957|回复: 8

GLM-TTS - 自然、富有情感和表现力的语音克隆/文本转语音系统 支持批量生成 支持50系显卡 一键整合包下载

[复制链接]

883

主题

1461

回帖

8万

积分

武林盟主

积分
86703

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2025-12-13 23:00:30 | 显示全部楼层 |阅读模式

马上注册,下载更多AI资源软件

您需要 登录 才可以下载或查看,没有账号?立即注册

×

GLM-TTS - 自然、富有情感和表现力的语音克隆/文本转语音系统 支持50系显卡 一键整合包下载 ... ... ... .. ...

GLM-TTS - 自然、富有情感和表现力的语音克隆/文本转语音系统 支持50系显卡 一键整合包下载 ... ... ... .. ...

GLM-TTS - 自然、富有情感和表现力的语音克隆/文本转语音系统 支持50系显卡 一键整合包下载 ... ... ... .. ...

GLM-TTS - 自然、富有情感和表现力的语音克隆/文本转语音系统 支持50系显卡 一键整合包下载 ... ... ... .. ...


GLM-TTS 是智谱AI开源的一个新型的文本转语音(TTS)系统,它能在“零样本”条件下模仿声音,在极少的语音样本模仿声音,生成自然、有情绪的语音,并且让合成语音更有情感和表现力。它的特点是可控、自然、支持实时推理。
GLM-TTS 就像是“情感版的语音生成器”,不仅能把文字变成声音,还能让声音带上情绪和个性。它的应用场景非常广泛,尤其适合需要自然、富有表现力语音的领域。

GLM-TTS 测试下来,相比同类文本转语音系统,除了克隆音色相似度更高外,在情感表达和自然度方便也更好,还有就是长文本生成更稳定,且速度快,生成的音频质量也更高。缺点是对显卡要求高,至少需要8G显存,长文本对显卡要求更高。
今天分享的 GLM-TTS 一键包,基于原版WebUI,新增了音色管理功能,支持自定义保存和加载音色;新增批量生成功能,支持一键上传多个txt文档批量生成语音。批量生成需要更多的显存资源,大家根据自己显卡选择批量生成的数量。


主要特点

零样本语音克隆:只需 3–10 秒的语音片段,就能快速模仿目标声音。  
情感控制:通过多奖励强化学习(GRPO),让语音带有情绪和表现力,而不是平淡机械。  
高质量合成:生成的语音在清晰度和自然度上接近商业系统,并且字符错误率(CER)更低。  
精细控制:支持“音素 + 文本”混合输入,能精确控制发音,尤其适合多音字。  
实时推理:支持流式生成,适合需要即时反馈的场景。  
双语支持:针对中英文混合文本进行了优化。



应用领域

虚拟助手与客服机器人:让语音更自然、更有情感,提升用户体验。  
有声读物与播客:快速生成不同风格和情绪的朗读,减少人工录音成本。  
游戏与虚拟角色:为 NPC 或虚拟角色生成个性化、有情感的声音。  
教育与培训:在语言学习或在线课程中提供更生动的语音讲解。  
无障碍应用:帮助视障人士获得更自然的语音反馈。



使用教程:(建议N卡,显存8G起,支持50系显卡)


分别下载主程序压缩包和模型(ckpt文件夹),解压主程序,移动ckpt目录到主程序下即可。

上传需要克隆的参考音频,输入参考文本,输入需要生成文字内容,设置相关参数,生成即可。

音色管理:上传需要保存的音色音频和参考文本,输入音色名称,保存。右侧加载音色,选择音色,输入需要生成的文字内容,生成即可。
批量生成:批量上传多个txt文本文档,刷新音色,选择音色,批量生成。生成结果保存在 batch_outputs 目录,可一键下载打包文件。

实测8G显存开启共享显存也能运行,但速度略慢,建议10G起,长文本建议12G显存起。


软件目录结构:

📂 ckpt/
├── 📂 flow/
│          └── flow.pt
├── 📂 llm/
│          └── model-00001-of-00002.safetensors
├── 📂 vq32k-phoneme-tokenizer/
│          └── tokenizer.model
📂 deepface/
📂 tools/
......


下载地址:
UC网盘:https://drive.uc.cn/s/203a6ae0a00d4

夸克网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 50碎银 下载该资源立即购买


百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源立即购买



DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

0

主题

28

回帖

33

积分

初入江湖

积分
33
发表于 2025-12-13 23:18:58 | 显示全部楼层
请问克隆后的音频采样率和比特率有多少呢?

883

主题

1461

回帖

8万

积分

武林盟主

积分
86703

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-12-13 23:19:37 | 显示全部楼层
Benny77 发表于 2025-12-13 23:18
请问克隆后的音频采样率和比特率有多少呢?

24000和32000
不过我试了32000,会报错,可能是当前模型不支持

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

0

主题

28

回帖

33

积分

初入江湖

积分
33
发表于 2025-12-13 23:25:39 | 显示全部楼层
VoxCPM有44kHz,不知道跟这个比起来音质怎么样呢?

0

主题

183

回帖

384

积分

上上宾

积分
384

上上宾

发表于 2025-12-15 12:49:19 | 显示全部楼层
老哥,用夸克网盘下载了使用出现错误:gradio.exceptions.Error: 'Inference failed: No such file or directory: ckpt\\llm\\model-00001-of-00002.safetensors'
llm这个文件夹里没有这个model文件哦

883

主题

1461

回帖

8万

积分

武林盟主

积分
86703

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-12-15 15:13:22 | 显示全部楼层
0879sazabi 发表于 2025-12-15 12:49
老哥,用夸克网盘下载了使用出现错误:gradio.exceptions.Error: 'Inference failed: No such file or dire ...

llm重新下载

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

0

主题

2

回帖

7

积分

初入江湖

积分
7
发表于 2025-12-16 10:45:27 | 显示全部楼层
启动的时候,运行会报错为什么呢

0

主题

87

回帖

230

积分

上上宾

积分
230

上上宾

发表于 2025-12-23 17:07:01 | 显示全部楼层
百度网盘和夸克网盘模型里面文件不一样,百度的少文件

883

主题

1461

回帖

8万

积分

武林盟主

积分
86703

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-12-23 17:20:30 | 显示全部楼层
jcchenwengang 发表于 2025-12-23 17:07
百度网盘和夸克网盘模型里面文件不一样,百度的少文件

百度估计是被吞了,我等下补。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|前沿AI软件资源站

GMT+8, 2026-1-20 00:54 , Processed in 0.163687 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表