DiffRhythm(谛韵) V3版 - AI音乐创作新纪元,新增完整版(4分45秒模型),10 秒生成 AI 歌曲,本地一键整合包下载
DiffRhythm(谛韵)是第一个开源的基于扩散的音乐生成模型,能自动生成包含人声和伴奏的完整歌曲。该名称结合了 “Diff” (引用其扩散架构) 和 “Rhythm” (突出其对音乐和歌曲创作的关注)。中文名称 谛韵 (Dì Yùn) 在发音上反映了 “DiffRhythm”,其中 “谛” (专心聆听) 象征听觉感知,“韵” (旋律魅力) 代表音乐性。
DiffRhythm(谛韵)带来了真正的AI音乐创新!它彻底改变了传统音乐创作模式,实现了端到端自动生成完整歌曲,整个过程无需任何人工干预!你不再需要像传统音乐人一样耗费大量时间编曲、混音,只需要上传一段参考音频,填写好歌词,即可一键生成一首完整的音乐歌曲。
今天分享的 DiffRhythm(谛韵) V3版 新增了完整版模型,现在可以生成完整的4分45秒时长的歌曲了。
功能特点
端到端音乐生成:用户只需输入歌词和风格提示,DiffRhythm即可自动生成包含人声和伴奏的完整歌曲,无需任何人工干预。
快速生成:DiffRhythm能够在短短10秒钟内生成一首4分45秒的完整歌曲,这得益于其采用的扩散变换器架构,避免了传统自回归模型推理速度慢的问题。
高质量音乐输出:生成的音乐作品人声和伴奏自然融合,歌词和旋律同步丝滑,听起来就像是出自专业音乐人之手。
智能歌词创作:DiffRhythm不仅能根据已有歌词生成歌曲,还能利用内置的大语言模型自动创作歌词,生成流畅、语法正确的歌词,并与旋律完美匹配。
风格自适应:该工具能够根据用户输入的音乐风格自动调整歌词主题,确保歌词和音乐风格浑然一体。
应用场景DiffRhythm是全球首个基于扩散模型的端到端音乐模型,具有极高的创新性。它极大地提高了音乐创作的效率,使得用户能够在短时间内获得满意的作品。此外,DiffRhythm还降低了音乐创作的门槛,让更多人能够参与到音乐创作中来。通过这些功能特点和创新优势,DiffRhythm不仅为音乐创作者提供了便捷的工具,还为那些对音乐创作感兴趣但缺乏专业技能的人打开了大门。
使用教程:(建议N卡,显存8G起。基于CUDA12.4)上传参考音乐,输入歌词,生成即可。
手动配置部分:解压一键包,先安装MbrolaTools35.exe(双击,一路下一步即可,不要更改路径)再安装目录里的 espeak-ng.msi(双击,一路下一步即可,不要更改路径)
默认安装路径是 C:\Program Files\eSpeak NG
把这个路径 C:\Program Files\eSpeak NG 添加到Path环境变量,如下图
https://deepface.cc/data/attachment/forum/202503/13/164025xo7c3z0h0hi5jlj0.webp
然后依次打开一键包的 deepface\eSpeak NG ,全选这里的文件,并复制到 C:\Program Files\eSpeak NG,根据提示覆盖
再运行 一键启动
下载地址:迅雷云盘:https://pan.xunlei.com/s/VOLalrVJiW55lbiC93IdW-7wA1?pwd=m385
夸克网盘:**** 本内容需购买 ****
百度网盘:**** 本内容需购买 ****
解压密码:https://deepface.cc/ 复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可
测试了下,4分完整版生成也很快,掉字问题还是没解决。 来日方长 发表于 2025-3-18 09:03
测试了下,4分完整版生成也很快,掉字问题还是没解决。
这次好多了,可以多合成几次试试
页:
[1]