DiffRhythm(谛韵) V2版本 - AI音乐创作新纪元,新增文本提示生成歌曲,10 秒生成 AI 歌曲,人声伴奏一键搞 ...
DiffRhythm(谛韵) 是第一个开源的基于扩散的音乐生成模型,能自动生成包含人声和伴奏的完整歌曲。该名称结合了 “Diff” (引用其扩散架构) 和 “Rhythm” (突出其对音乐和歌曲创作的关注)。中文名称 谛韵 (Dì Yùn) 在发音上反映了 “DiffRhythm”,其中 “谛” (专心聆听) 象征听觉感知,“韵” (旋律魅力) 代表音乐性。
DiffRhythm(谛韵) 带来了真正的AI音乐创新!它彻底改变了传统音乐创作模式,实现了端到端自动生成完整歌曲,整个过程无需任何人工干预!你不再需要像传统音乐人一样耗费大量时间编曲、混音,只需要上传一段参考音频,填写好歌词,即可一键生成一首完整的音乐歌曲。
今天分享的 DiffRhythm(谛韵) V2版 新增了提示词生成歌曲,相比上个版本只支持参考音频,这次提示词生成更加丰富和灵活,无需参考音频,只需要输入曲风等关键词即可,比如流行,古典,钢琴等,即可根据提示词生成对应曲风的歌曲,还支持生成纯音乐。
功能特点
端到端音乐生成:用户只需输入歌词和风格提示,DiffRhythm即可自动生成包含人声和伴奏的完整歌曲,无需任何人工干预。
快速生成:DiffRhythm能够在短短10秒钟内生成一首4分45秒的完整歌曲,这得益于其采用的扩散变换器架构,避免了传统自回归模型推理速度慢的问题。
高质量音乐输出:生成的音乐作品人声和伴奏自然融合,歌词和旋律同步丝滑,听起来就像是出自专业音乐人之手。
智能歌词创作:DiffRhythm不仅能根据已有歌词生成歌曲,还能利用内置的大语言模型自动创作歌词,生成流畅、语法正确的歌词,并与旋律完美匹配。
风格自适应:该工具能够根据用户输入的音乐风格自动调整歌词主题,确保歌词和音乐风格浑然一体。
应用场景DiffRhythm是全球首个基于扩散模型的端到端音乐模型,具有极高的创新性。它极大地提高了音乐创作的效率,使得用户能够在短时间内获得满意的作品。 此外,DiffRhythm还降低了音乐创作的门槛,让更多人能够参与到音乐创作中来。 通过这些功能特点和创新优势,DiffRhythm不仅为音乐创作者提供了便捷的工具,还为那些对音乐创作感兴趣但缺乏专业技能的人打开了大门。
使用教程:(建议N卡,显存6G起。基于CUDA12.4) 上传参考音乐,输入歌词,生成即可。 视频教程:https://www.toutiao.com/video/7482918199403627045/
手动配置部分: 解压一键包,先安装MbrolaTools35.exe(双击,一路下一步即可,不要更改路径) 再安装目录里的 espeak-ng.msi(双击,一路下一步即可,不要更改路径)
默认安装路径是 C:\Program Files\eSpeak NG
把这个路径 C:\Program Files\eSpeak NG 添加到Path环境变量,如下图

然后依次打开一键包的 deepface\eSpeak NG ,全选这里的文件,并复制到 C:\Program Files\eSpeak NG,根据提示覆盖
再运行 一键启动
下载地址: 迅雷云盘:https://pan.xunlei.com/s/VOLI8BxfOKcsA5N3MNALK33oA1?pwd=8w6b 夸克网盘: 游客, 上上宾会员可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 30碎银 下载该资源 立即购买百度网盘: 游客, 上上宾会员可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源 立即购买
解压密码:https://deepface.cc/ 复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可
|