设为首页收藏本站 劰载中...

 找回密码
 立即注册
查看: 942|回复: 18

SoulX-Podcast - 支持方言和副语言的逼真长篇播客生成 支持50系显卡 一键整合包下载

[复制链接]

825

主题

1341

回帖

8万

积分

武林盟主

积分
80048

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2025-10-31 09:40:16 | 显示全部楼层 |阅读模式

马上注册,下载更多AI资源软件

您需要 登录 才可以下载或查看,没有账号?立即注册

×

SoulX-Podcast - 支持方言和副语言的逼真长篇播客生成 支持50系显卡 一键整合包下载 ... ... ... ... ... . ...

SoulX-Podcast - 支持方言和副语言的逼真长篇播客生成 支持50系显卡 一键整合包下载 ... ... ... ... ... . ...

SoulX-Podcast 是由Soul(没听错,就是聊天软件Soul)AI团队开发的语音合成工具,能够根据文本生成高质量、逼真的播客音频。它不仅能处理单人独白,更擅长模拟多人多轮对话,让生成的语音像真实播客一样自然。
SoulX-Podcast 支持提供多段参考音频实现零样本克隆生成逼真且富有情感的播客对话音频,不仅支持多种方言(比如四川话、粤语、河南话等)和副语言(比如笑声、叹息、清嗓等非语言声音),且支持超长文本生成,支持持续生成60分钟以上的对话内容,同时保持情感和音色稳定。


核心功能

多轮次、多角色对话生成
可生成超过90分钟的连贯对话,角色间音色稳定、过渡自然。 示例:模拟两人讨论“AI技术”或“方言文化”,语音节奏和情感随对话进展自适应调整。

跨方言零样本语音克隆
支持普通话、英语及四川话、河南话、粤语等方言。 无需目标说话人的训练数据,即可克隆其方言语音。 示例:用普通话音频克隆出粤语播客,音色和方言特征均保留。

副语言控制
可控制笑声、叹息、清嗓等非语言声音,增强语音真实感。 示例:在播客中插入笑声或叹息,使对话更生动。

长篇内容稳定性
持续生成超60分钟的播客时,保持角色音色一致性和情感连贯性。



应用领域

个性化语音合成: 可用于生成具有特定方言或语言风格的个性化语音,适用于语音助手、导航系统等。
娱乐和媒体制作: 适用于播客制作、有声书录制、游戏角色配音等娱乐和媒体领域。
辅助技术: 为有特殊需求的人群提供定制化的语音合成服务,如视障人士的语音阅读。
语言研究: 用于语言学研究,分析不同方言和语言的语音特征。


使用教程:(建议N卡,显存6G起,支持50系显卡,建议CUDA≥12.8)

分别下载压缩包和模型(pretrained_models文件夹),解压压缩包后,将模型(pretrained_models文件夹)移动到主程序目录下即可。目录结构如下:

│  app.py
│  一键启动-方言.exe
│  一键启动.exe
├─assets
├─cache
├─cli
├─deepface
├─example
├─pretrained_models

├─soulxpodcast


包含两种启动方式,普通话和方言,请根据自己需要的场景选择启动方式。
上传两段需要生成的参考音频,输入参考文本(支持普通话和方言两种模式,根据需要选择启动方式),最后生成即可。
如果是普通话,在“参考文本”里输入参考文本,直接输入即可,无需任何前缀
如果是方言,在“参考推理链文本”里输入参考文本,前缀如下:<|Sichuan|>/<|Yue|>/<|Henan|>,如:<|Sichuan|>走嘛,切吃那家新开的麻辣烫,听别个说味道硬是霸道得很,好吃到不摆了,去晚了还得排队!


常见副语言标签:<|laughter|> 笑、<|sigh|> 叹气、<|breathing|> 停顿、<|coughing|>咳嗽、<|throat_clearing|>清嗓子


也可参考下方“播客模板示例”


视频教程:https://www.toutiao.com/video/7567306555020821032/


下载地址:
UC网盘:https://drive.uc.cn/s/b406704f43c54

夸克网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源立即购买


百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源立即购买


DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

0

主题

10

回帖

16

积分

初入江湖

积分
16
发表于 2025-10-31 09:56:24 | 显示全部楼层
谢谢分享!

0

主题

31

回帖

58

积分

无名之辈

积分
58
发表于 2025-10-31 10:06:07 | 显示全部楼层
感谢分享

0

主题

7

回帖

126

积分

上上宾

积分
126

突出贡献上上宾

发表于 2025-10-31 20:39:21 | 显示全部楼层
群主真棒,我爱群主

0

主题

1

回帖

6

积分

初入江湖

积分
6
发表于 2025-11-1 13:21:39 | 显示全部楼层
谢谢分享!

0

主题

73

回帖

97

积分

无名之辈

积分
97
发表于 2025-11-3 00:26:08 | 显示全部楼层
UC网盘就很奇怪,我一尝试下载就告诉我“下载失败,请稍后重试”。

0

主题

59

回帖

100

积分

无名之辈

积分
100
发表于 2025-11-3 07:56:55 | 显示全部楼层
谢谢分享

0

主题

37

回帖

72

积分

无名之辈

积分
72
发表于 2025-11-3 09:40:36 | 显示全部楼层
谢谢分享

0

主题

22

回帖

127

积分

上上宾

积分
127

上上宾

发表于 2025-11-3 14:28:55 | 显示全部楼层
普通话版可以正常生成,但是到方言版的时候,报错了:    "prompt_cot_text_tokens_for_llm": data["prompt_cot_text_tokens"],  KeyError: 'prompt_cot_text_tokens'
是哪里设置不对吗?

825

主题

1341

回帖

8万

积分

武林盟主

积分
80048

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-11-3 15:24:57 | 显示全部楼层
ph.li 发表于 2025-11-3 14:28
普通话版可以正常生成,但是到方言版的时候,报错了:    "prompt_cot_text_tokens_for_llm": data["prompt_ ...

两个启动程序,方言运行方言启动程序

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|前沿AI软件资源站

GMT+8, 2025-11-26 09:11 , Processed in 0.148426 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表