无言以对 发表于 2024-6-14 21:15:32

ChatTTS改良版0614 - 优化数字和字母朗读情感、接入Ollama大模型,api接入读书软件等



这个版本是ChatTTS的一个分支,基于ChatTTS修改,由6drf21e大佬改良,大佬GitHub地址 https://github.com/6drf21e/ChatTTS_colab
支持本地一键运行,同时支持colab运行。最大的亮点还要属“角色扮演”了,可以用一段剧情或故事生成角色扮演对话,并为不同的角色配音,这个功能简直炸裂了。

6drf21e大佬持续更新优化,此次主要优化了数字和字母的朗读,相比以前的干巴巴的字母和数字朗读,这次更有人味儿了。api持续优化,可以接入第三方读书软件了人性的听书了。还接入了Ollama本地大模型。同时新增上传文本功能,无需手动输入。


PR上还有更多的大佬前仆后继,基于ChatTTS开发更多实用好玩的新功能,后期有新的分支还会继续更新。


更新日志: 2024年6月14日

支持播放已保存的种子 。
增加文本预处理功能。
添加了支持流式音频的异步 FastAPI 接口和测试页。
使用 WeTextProcessing 进行中英文的文本正则化。
修复了分段的bug。
统一了“的”、“地”、“得”为“的”。


版本特点:
Colab 一键运行:无需复杂的环境配置,只需点击上方的 Colab 按钮,即可在浏览器中直接运行项目。
音色抽卡功能:批量生成多个音色,并可保存自己喜欢的音色。
支持生成长音频:适合生成较长的语音内容。
字符处理:对数字和朗读错误的标点做了初步处理。
分角色朗读功能 :支持对不同角色的文本进行分角色朗读,并支持大模型一键生产脚本。


API接口服务说明:
启动接口服务后,接口地址为:
https://127.0.0.1:9880/text=转换文字&seed=音色id


下载地址:
夸克网盘:https://pan.quark.cn/s/d16c6a424375
百度网盘:
**** Hidden Message *****





yys 发表于 2024-6-15 08:47:18

szfjm 发表于 2024-6-15 09:22:35

又有改良了,谢谢分享

早晚各一次 发表于 2024-6-15 10:52:29

感谢大佬分享

傅天行 发表于 2024-6-15 14:32:52

谢谢分享

pc2pc 发表于 2024-6-15 19:54:08

感谢楼主分享!!!

wyx567 发表于 2024-6-18 00:14:26

感谢大佬分享

youxdn 发表于 2024-6-18 22:25:05

这个牛啊!!!!!!!

白色琥珀bshp 发表于 2024-6-18 23:17:25

更新太快了

白色琥珀bshp 发表于 2024-6-19 00:44:19

测试了前几个版本,早期版本会遇到文本加载不全的情况,现在可以了,0609版本功能强大了不少,但是不论是抽卡还是长音频,定制,这些模块都在一些问题,指定唯一音色后,在推理较长文本时(几百字左右)会出现跳音色的情况,一段一分多钟的生成音频里会出现多个不同音色,测试了很多遍都是这种情况,大佬有办法稳定固定音色吗,0614版还没测试
页: [1] 2 3 4 5 6 7 8
查看完整版本: ChatTTS改良版0614 - 优化数字和字母朗读情感、接入Ollama大模型,api接入读书软件等