无言以对 发表于 2025-5-19 16:23:32

IndexTTS V3版 - 更新最强大的1.5版模型 B站开源可控零样本文本转语音/语音克隆系统 本地一键整合包下载


IndexTTS 是B站推出的最新文本转语音(TTS)模型,它能够使用拼音纠正汉字的发音,并通过标点符号在任何位置控制停顿。它在中文场景下展现了卓越的表现,并刷新了行业记录。IndexTTS通过中文字符-拼音混合建模、精准停顿控制与跨模态优化等先进技术,显著提升了语音生成的精度和自然度。
IndexTTS 系统经过数万小时的数据训练,已实现业内领先的性能,超越了当前流行的 TTS 系统,包括 XTTS、CosyVoice2、Fish-Speech 和 F5-TTS 等。系统的多个模块经过增强,特别是在扬声器条件特征表示和音频质量优化方面进行了深度改进。通过引入混合建模的方式,IndexTTS 能够快速纠正误读的汉字,提升了用户的使用体验。

今天分享的V3版,更新官方更强大的IndexTTS-1.5模型,显著提高了模型的稳定性和英语语言性能。

应用场景
IndexTTS的成功在于对中文语言特性的深刻理解和创新应用,适用于需要高精度和自然度语音生成的场景,如教育、娱乐、新闻播报等。其精准的停顿控制和多音字处理能力使其在中文朗读和语音合成领域具有显著优势‌。


使用教程:(建议N卡,显存4G起。支持50系显卡,基于CUDA12.8)
上传参考音频,输入文本,生成即可。
根据自己的文本长度选择“普通推理”和“批次推理”,实测“批次推理”充分利用显存,生成速度提升10倍+,但稳定性不如“普通推理”,大家根据需要自行调整。


下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOSNnS9pxnREGZDVk1arOLQoA1?pwd=kjh5
百度网盘:**** 本内容需购买 ****

解压密码:https://deepfaces.cc/ 复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可

来日方长 发表于 2025-5-19 18:56:26

批次推理还是有吞字的情况,不过已经好多了

xwsuper 发表于 2025-5-21 19:12:19

感谢楼主分享:lol:lol

lujun1996 发表于 2025-5-23 23:47:34

必须要大力支持的,版主继续努力:)

一抹深蓝 发表于 2025-6-14 21:22:58

迅雷下载太慢了。。。。

shao12138 发表于 2025-6-18 09:14:42

这个是所有体验下来最屌的(克隆模式),比如一些停顿语气衔接。

qiqiang 发表于 2025-6-28 19:54:27

多谢分享

rake_li 发表于 2025-6-30 17:54:45

请问下可以用粤语吗?

无言以对 发表于 2025-6-30 18:07:13

rake_li 发表于 2025-6-30 17:54
请问下可以用粤语吗?

不支持

一抹深蓝 发表于 2025-7-7 00:18:30

The name specified is not recognized as an internal or external command,operable program or batch file.这是没安装依赖吗?
页: [1] 2
查看完整版本: IndexTTS V3版 - 更新最强大的1.5版模型 B站开源可控零样本文本转语音/语音克隆系统 本地一键整合包下载