找回密码
 立即注册
查看: 3628|回复: 73

ChatTTS改良版0614 - 优化数字和字母朗读情感、接入Ollama大模型,api接入读书软件等

  [复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-6-14 21:15:32 | 显示全部楼层 |阅读模式

ChatTTS改良版0614 - 优化数字和字母朗读情感、接入Ollama大模型,api接入读书软件等 ... ... ... ... ... ...

ChatTTS改良版0614 - 优化数字和字母朗读情感、接入Ollama大模型,api接入读书软件等 ... ... ... ... ... ...


这个版本是ChatTTS的一个分支,基于ChatTTS修改,由6drf21e大佬改良,大佬GitHub地址 https://github.com/6drf21e/ChatTTS_colab

支持本地一键运行,同时支持colab运行。最大的亮点还要属“角色扮演”了,可以用一段剧情或故事生成角色扮演对话,并为不同的角色配音,这个功能简直炸裂了。

6drf21e大佬持续更新优化,此次主要优化了数字和字母的朗读,相比以前的干巴巴的字母和数字朗读,这次更有人味儿了。api持续优化,可以接入第三方读书软件了人性的听书了。还
接入了Ollama本地大模型。同时新增上传文本功能,无需手动输入。


PR上还有更多的大佬前仆后继,基于ChatTTS开发更多实用好玩的新功能,后期有新的分支还会继续更新。


更新日志: 2024年6月14日

支持播放已保存的种子 。
增加文本预处理功能。
添加了支持流式音频的异步 FastAPI 接口和测试页。
使用 WeTextProcessing 进行中英文的文本正则化。
修复了分段的bug。
统一了“的”、“地”、“得”为“的”。


版本特点:
Colab 一键运行:无需复杂的环境配置,只需点击上方的 Colab 按钮,即可在浏览器中直接运行项目。
音色抽卡功能:批量生成多个音色,并可保存自己喜欢的音色。
支持生成长音频:适合生成较长的语音内容。
字符处理:对数字和朗读错误的标点做了初步处理。
分角色朗读功能 :支持对不同角色的文本进行分角色朗读,并支持大模型一键生产脚本。


API接口服务说明:
启动接口服务后,接口地址为:
https://127.0.0.1:9880/text=转换文字&seed=音色id


下载地址:
夸克网盘:https://pan.quark.cn/s/d16c6a424375
百度网盘:

游客,如果您要查看本帖隐藏内容请回复






DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

8

回帖

20

积分

禁止访问

积分
20
发表于 2024-6-15 08:47:18 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

该用户从未签到

0

主题

103

回帖

130

积分

无名之辈

积分
130
发表于 2024-6-15 09:22:35 | 显示全部楼层
又有改良了,谢谢分享

该用户从未签到

0

主题

2

回帖

8

积分

初入江湖

积分
8
发表于 2024-6-15 10:52:29 | 显示全部楼层
感谢大佬分享

该用户从未签到

0

主题

2

回帖

8

积分

初入江湖

积分
8
发表于 2024-6-15 14:32:52 | 显示全部楼层
谢谢分享

该用户从未签到

0

主题

3

回帖

9

积分

初入江湖

积分
9
发表于 2024-6-15 19:54:08 | 显示全部楼层
感谢楼主分享!!!

该用户从未签到

0

主题

2

回帖

9

积分

初入江湖

积分
9
发表于 2024-6-18 00:14:26 | 显示全部楼层
感谢大佬分享

该用户从未签到

0

主题

3

回帖

24

积分

初入江湖

积分
24
发表于 2024-6-18 22:25:05 | 显示全部楼层
这个牛啊!!!!!!!

该用户从未签到

0

主题

10

回帖

24

积分

初入江湖

积分
24
发表于 2024-6-18 23:17:25 | 显示全部楼层
更新太快了

该用户从未签到

0

主题

10

回帖

24

积分

初入江湖

积分
24
发表于 2024-6-19 00:44:19 | 显示全部楼层
测试了前几个版本,早期版本会遇到文本加载不全的情况,现在可以了,0609版本功能强大了不少,但是不论是抽卡还是长音频,定制,这些模块都在一些问题,指定唯一音色后,在推理较长文本时(几百字左右)会出现跳音色的情况,一段一分多钟的生成音频里会出现多个不同音色,测试了很多遍都是这种情况,大佬有办法稳定固定音色吗,0614版还没测试
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-19 08:04 , Processed in 0.098292 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表