无言以对 发表于 2024-9-9 10:57:13

ChatTTS V2 - 新增克隆功能,高度逼真的人类情感文本生成语音工具(TTS)本地一键整合包下载



先介绍下ChatTTS

和本版之前发布的 AI语音工具 类似,都是免费开源的文本生成语音的AI软件,但不同的是,ChatTTS测试下来,对于人类情感语调的模仿,应该是目前开源项目做的最好的,是一款高度接近人类情感、音色、语调的文本语音合成项目。不像其他的语音合成项目,出来的音调很生硬,一听就知道是合成的。ChatTTS的合成效果,高度模仿人类情感,不仔细听,根本分不清是真人还是合成。关键是开源免费。目前只支持中英两种语言。

项目地址:https://github.com/2noise/ChatTTS/
今天分享这个项目是基于官方最新的代码整合,解压即用。显卡要求也不高,4G显存就可以用,但速度慢了些,做自媒体的朋友必备神器。

ChatTTS V2版,我是方便更新区分取的名字,官方并没有以此命名。


V2版更新内容:
1、同步官方最新代码;
2、模型更新;
3、新增参考音频克隆,可以根据参考音频克隆音色;
4、功能优化;
5、bug修复


V2生成案例试听:



几种常见控制符号,比如停顿、大笑等,适当加入,可以生成更加逼真的效果

oral: 连接词,也可以叫做口头语,AI可能会自己加字,比如卡壳、嘴瓢、嗯、啊、就是之类的词。设置范围为0-9,比如
break: 停顿,设置范围为0-9,比如
laugh: 笑,取值范围为0-9,比如 [laugh_3]


比如 “四 川 美 食 确 实 以 辣 闻 名 , 但 也 有 不 辣 的 选 择 。 比 如 甜 水 面 、 赖 汤 圆 、 蛋 烘 糕 、 叶 儿 粑 等 , 这 些 小 吃 口 味 温 和 , 甜 而 不 腻 , 也 很 受 欢 迎 。”
生成的效果就更加接近人类情感的真实度。也可以在中间插入停顿和笑声等。

下载地址:
夸克网盘:https://pan.quark.cn/s/9f5f176063f7
百度网盘:
**** Hidden Message *****

szfjm 发表于 2024-9-9 12:46:40

谢谢分享,下载试试

sy5216132 发表于 2024-9-9 13:59:50

感谢分享

simonchen760918 发表于 2024-9-9 14:17:49

cosyvoice还没闹明白呢,这个又更新版本了,也试试看对比下效果。

askstar 发表于 2024-9-9 14:32:37

谢谢分享

无情点杀 发表于 2024-9-9 15:02:59

谢谢分享...

fcrj1996 发表于 2024-9-9 19:42:07

支持支持支持

inhva1 发表于 2024-9-9 19:50:55

问下用过的大佬们,这个和cosyvoice 哪个效果更好啊?尤其是对长文本的支持方面

yncncn 发表于 2024-9-10 00:41:34

感谢楼主分享,还有细心的小技巧 ,看看TT的参考克隆效果如何

学习ai 发表于 2024-9-10 06:52:13

感谢分享
页: [1] 2 3 4 5 6 7 8 9 10
查看完整版本: ChatTTS V2 - 新增克隆功能,高度逼真的人类情感文本生成语音工具(TTS)本地一键整合包下载