MOSS-TTSD V3版 - 文本到语音对话生成 支持零样本多人语音克隆 支持50系显卡 一键整合包下载
MOSS-TTSD 是一种语音对话生成模型,能够支持中英文的富有表现力的对话语音合成,支持零样本多说话人语音克隆、语音事件控制和长文本语音生成。
MOSS-TTSD(文本到语音对话)支持中英文的双语语音对话合成,能够将两个说话者之间的对话脚本转化为自然、富有表现力的会话式语音。MOSS-TTSD 支持语音克隆和长单次会话语音生成,非常适合 AI 播客制作。
通俗的讲,只需要上传两段参考音频,输入两个人的对话文字内容,即可一键生成两人的对话音频内容,生成对话语音自然、且富有表现力,几乎接近真人对话水平。
今天分享的 MOSS-TTSD V3版,修复更新了以下内容:
移除了英语语言,只保留中文;
重构精简了WebUI,界面更加简洁易用;
移除Flash_attn,支持50系显卡;
应用领域
AI 播客制作: 自动将文本内容转化为多人对话的播客音频,支持零样本人声克隆和长语音生成,降低制作成本。
影视配音与动画: 为影视作品、动画生成自然对话语音,支持多语言切换,提升配音效率。
长篇访谈与会议记录: 将访谈或会议文本转化为语音,保留对话的韵律和情感,便于存档和分享。
数字人对话带货: 为虚拟主播或数字人提供自然流畅的对话语音,增强互动体验。
语音助手与客服: 提升语音助手的对话自然度,支持多轮对话和情感表达,改善用户体验。
使用教程:(建议N卡,显存8G起。支持30-50系显卡,基于CUDA12.8)
输入两个人对话文本内容,用标签和区分,上传两段说话人的参考音频,生成即可。
下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOVWk5MDdbeWnP6zMdwzcdmLA1?pwd=a89r
百度网盘:**** 本内容需购买 ****
又赶上了热乎乎的啦!版主辛苦 刚翻旧文件,看到这个软件的V2,一登陆咱这个网站,第一个就是这个,啊哈哈,太巧了吧 guozhixin86 发表于 2025-7-19 15:23
刚翻旧文件,看到这个软件的V2,一登陆咱这个网站,第一个就是这个,啊哈哈,太巧了吧 ...
刷新下,刚上传完 谢谢无言的分享!!! 无言以对 发表于 2025-7-19 15:28
刷新下,刚上传完
已经下载,啊哈哈,谢谢啦,很激动。
刚看到一个新的,IndexTTS2,不知道啥时候开源。这个从宣传上看,非常牛逼,情感控制等,包括英语啥的,都非常逼真。
拭目以待开源后,大大的热情分享 guozhixin86 发表于 2025-7-20 17:15
已经下载,啊哈哈,谢谢啦,很激动。
刚看到一个新的,IndexTTS2,不知道啥时候开源。这个从宣传上看,非 ...
我也很期待,试听了下效果确实很棒
还有cosyvoice3,估计下半年都会开源 无言以对 发表于 2025-7-20 17:17
我也很期待,试听了下效果确实很棒
还有cosyvoice3,估计下半年都会开源
{:3_52:}有了这些东西,短剧行业估计要被颠覆了
楼主分享的这些软件,被脑瓜子灵光的人拿来应用,绝对可以做成【一人公司】的
未来【一人公司】模式可能要盛行,而楼主这个论坛真的是宝藏基地 太贊了吧 感谢分享
页:
[1]
2