MOSS-TTSD V3版 - 文本到语音对话生成支持零样本多人语音克隆支持50系显卡一键整合包下载 - AI语音 - 前沿AI软件资源站

无言以对 发表于 2025-7-19 10:54:45

MOSS-TTSD V3版 - 文本到语音对话生成支持零样本多人语音克隆支持50系显卡一键整合包下载

MOSS-TTSD 是一种语音对话生成模型，能够支持中英文的富有表现力的对话语音合成，支持零样本多说话人语音克隆、语音事件控制和长文本语音生成。
MOSS-TTSD（文本到语音对话）支持中英文的双语语音对话合成，能够将两个说话者之间的对话脚本转化为自然、富有表现力的会话式语音。MOSS-TTSD 支持语音克隆和长单次会话语音生成，非常适合 AI 播客制作。

通俗的讲，只需要上传两段参考音频，输入两个人的对话文字内容，即可一键生成两人的对话音频内容，生成对话语音自然、且富有表现力，几乎接近真人对话水平。

今天分享的 MOSS-TTSD V3版，修复更新了以下内容：

移除了英语语言，只保留中文；
重构精简了WebUI，界面更加简洁易用；
移除Flash_attn，支持50系显卡；

应用领域

AI 播客制作：自动将文本内容转化为多人对话的播客音频，支持零样本人声克隆和长语音生成，降低制作成本。
影视配音与动画：为影视作品、动画生成自然对话语音，支持多语言切换，提升配音效率。
长篇访谈与会议记录：将访谈或会议文本转化为语音，保留对话的韵律和情感，便于存档和分享。
数字人对话带货：为虚拟主播或数字人提供自然流畅的对话语音，增强互动体验。
语音助手与客服：提升语音助手的对话自然度，支持多轮对话和情感表达，改善用户体验。

使用教程：（建议N卡，显存8G起。支持30-50系显卡，基于CUDA12.8）

输入两个人对话文本内容，用标签和区分，上传两段说话人的参考音频，生成即可。

下载地址：
迅雷云盘：https://pan.xunlei.com/s/VOVWk5MDdbeWnP6zMdwzcdmLA1?pwd=a89r
百度网盘：**** 本内容需购买 ****

lujun1996 发表于 2025-7-19 11:48:35

又赶上了热乎乎的啦！版主辛苦

guozhixin86 发表于 2025-7-19 15:23:29

刚翻旧文件，看到这个软件的V2，一登陆咱这个网站，第一个就是这个，啊哈哈，太巧了吧

无言以对 发表于 2025-7-19 15:28:12

guozhixin86 发表于 2025-7-19 15:23
刚翻旧文件，看到这个软件的V2，一登陆咱这个网站，第一个就是这个，啊哈哈，太巧了吧 ...

刷新下，刚上传完

zbn2025 发表于 2025-7-20 15:04:17

谢谢无言的分享！！！

guozhixin86 发表于 2025-7-20 17:15:59

无言以对发表于 2025-7-19 15:28
刷新下，刚上传完

已经下载，啊哈哈，谢谢啦，很激动。
刚看到一个新的，IndexTTS2，不知道啥时候开源。这个从宣传上看，非常牛逼，情感控制等，包括英语啥的，都非常逼真。
拭目以待开源后，大大的热情分享

无言以对 发表于 2025-7-20 17:17:10

guozhixin86 发表于 2025-7-20 17:15
已经下载，啊哈哈，谢谢啦，很激动。
刚看到一个新的，IndexTTS2，不知道啥时候开源。这个从宣传上看，非 ...

我也很期待，试听了下效果确实很棒
还有cosyvoice3，估计下半年都会开源

guozhixin86 发表于 2025-7-20 17:27:20

无言以对发表于 2025-7-20 17:17
我也很期待，试听了下效果确实很棒
还有cosyvoice3，估计下半年都会开源

{:3_52:}有了这些东西，短剧行业估计要被颠覆了
楼主分享的这些软件，被脑瓜子灵光的人拿来应用，绝对可以做成【一人公司】的
未来【一人公司】模式可能要盛行，而楼主这个论坛真的是宝藏基地

happy74527 发表于 2025-7-20 22:34:43

太贊了吧

znanr 发表于 2025-7-29 15:41:47

感谢分享

页: [1] 2

前沿AI软件资源站's Archiver

MOSS-TTSD V3版 - 文本到语音对话生成 支持零样本多人语音克隆 支持50系显卡 一键整合包下载

MOSS-TTSD V3版 - 文本到语音对话生成支持零样本多人语音克隆支持50系显卡一键整合包下载