ChatTTS V2 - 新增克隆功能,高度逼真的人类情感文本生成语音工具(TTS)本地一键整合包下载
先介绍下ChatTTS
和本版之前发布的 AI语音工具 类似,都是免费开源的文本生成语音的AI软件,但不同的是,ChatTTS测试下来,对于人类情感语调的模仿,应该是目前开源项目做的最好的,是一款高度接近人类情感、音色、语调的文本语音合成项目。不像其他的语音合成项目,出来的音调很生硬,一听就知道是合成的。ChatTTS的合成效果,高度模仿人类情感,不仔细听,根本分不清是真人还是合成。关键是开源免费。目前只支持中英两种语言。
项目地址:https://github.com/2noise/ChatTTS/
今天分享这个项目是基于官方最新的代码整合,解压即用。显卡要求也不高,4G显存就可以用,但速度慢了些,做自媒体的朋友必备神器。
ChatTTS V2版,我是方便更新区分取的名字,官方并没有以此命名。
V2版更新内容:
1、同步官方最新代码;
2、模型更新;
3、新增参考音频克隆,可以根据参考音频克隆音色;
4、功能优化;
5、bug修复
V2生成案例试听:
几种常见控制符号,比如停顿、大笑等,适当加入,可以生成更加逼真的效果
oral: 连接词,也可以叫做口头语,AI可能会自己加字,比如卡壳、嘴瓢、嗯、啊、就是之类的词。设置范围为0-9,比如
break: 停顿,设置范围为0-9,比如
laugh: 笑,取值范围为0-9,比如 [laugh_3]
比如 “四 川 美 食 确 实 以 辣 闻 名 , 但 也 有 不 辣 的 选 择 。 比 如 甜 水 面 、 赖 汤 圆 、 蛋 烘 糕 、 叶 儿 粑 等 , 这 些 小 吃 口 味 温 和 , 甜 而 不 腻 , 也 很 受 欢 迎 。”
生成的效果就更加接近人类情感的真实度。也可以在中间插入停顿和笑声等。
下载地址:
夸克网盘:https://pan.quark.cn/s/9f5f176063f7
百度网盘:
**** Hidden Message *****
谢谢分享,下载试试 感谢分享 cosyvoice还没闹明白呢,这个又更新版本了,也试试看对比下效果。 谢谢分享 谢谢分享... 支持支持支持 问下用过的大佬们,这个和cosyvoice 哪个效果更好啊?尤其是对长文本的支持方面 感谢楼主分享,还有细心的小技巧 ,看看TT的参考克隆效果如何 感谢分享