DiffRhythm(谛韵) V2版 - AI音乐创作新纪元，新增文本提示生成歌曲，10 秒生成 AI 歌曲，人声伴奏一键搞定本地一键整合包下载 - AI语音 - 前沿AI软件资源站

无言以对 发表于 2025-3-14 08:52:33

DiffRhythm(谛韵) V2版 - AI音乐创作新纪元，新增文本提示生成歌曲，10 秒生成 AI 歌曲，人声伴奏一键搞定本地一键整合包下载

DiffRhythm(谛韵)是第一个开源的基于扩散的音乐生成模型，能自动生成包含人声和伴奏的完整歌曲。该名称结合了 “Diff” （引用其扩散架构）和 “Rhythm” （突出其对音乐和歌曲创作的关注）。中文名称谛韵（Dì Yùn）在发音上反映了 “DiffRhythm”，其中 “谛” （专心聆听）象征听觉感知，“韵” （旋律魅力）代表音乐性。
DiffRhythm(谛韵)带来了真正的AI音乐创新！它彻底改变了传统音乐创作模式，实现了端到端自动生成完整歌曲，整个过程无需任何人工干预！你不再需要像传统音乐人一样耗费大量时间编曲、混音，只需要上传一段参考音频，填写好歌词，即可一键生成一首完整的音乐歌曲。

今天分享的 DiffRhythm(谛韵) V2版新增了提示词生成歌曲，相比上个版本只支持参考音频，这次提示词生成更加丰富和灵活，无需参考音频，只需要输入曲风等关键词即可，比如流行，古典，钢琴等，即可根据提示词生成对应曲风的歌曲，还支持生成纯音乐。

功能特点‌
端到端音乐生成‌：用户只需输入歌词和风格提示，DiffRhythm即可自动生成包含人声和伴奏的完整歌曲，无需任何人工干预‌。‌
快速生成‌：DiffRhythm能够在短短10秒钟内生成一首4分45秒的完整歌曲，这得益于其采用的扩散变换器架构，避免了传统自回归模型推理速度慢的问题‌。‌
高质量音乐输出‌：生成的音乐作品人声和伴奏自然融合，歌词和旋律同步丝滑，听起来就像是出自专业音乐人之手‌。‌
智能歌词创作‌：DiffRhythm不仅能根据已有歌词生成歌曲，还能利用内置的大语言模型自动创作歌词，生成流畅、语法正确的歌词，并与旋律完美匹配‌。‌
风格自适应‌：该工具能够根据用户输入的音乐风格自动调整歌词主题，确保歌词和音乐风格浑然一体‌。

应用场景DiffRhythm是全球首个基于扩散模型的端到端音乐模型，具有极高的创新性。它极大地提高了音乐创作的效率，使得用户能够在短时间内获得满意的作品。此外，DiffRhythm还降低了音乐创作的门槛，让更多人能够参与到音乐创作中来‌。通过这些功能特点和创新优势，DiffRhythm不仅为音乐创作者提供了便捷的工具，还为那些对音乐创作感兴趣但缺乏专业技能的人打开了大门。

使用教程：(建议N卡，显存6G起。基于CUDA12.4)上传参考音乐，输入歌词，生成即可。视频教程：https://www.toutiao.com/video/7482918199403627045/
手动配置部分：解压一键包，先安装MbrolaTools35.exe（双击，一路下一步即可，不要更改路径）再安装目录里的 espeak-ng.msi（双击，一路下一步即可，不要更改路径）
默认安装路径是 C:\Program Files\eSpeak NG
把这个路径 C:\Program Files\eSpeak NG 添加到Path环境变量，如下图
https://deepface.cc/data/attachment/forum/202503/13/164025xo7c3z0h0hi5jlj0.webp

然后依次打开一键包的 deepface\eSpeak NG ，全选这里的文件，并复制到 C:\Program Files\eSpeak NG，根据提示覆盖
再运行一键启动

下载地址：迅雷云盘：https://pan.xunlei.com/s/VOSNyU5xk25EMGu33C6jxXMqA1?pwd=y7nz夸克网盘：**** 本内容需购买 ****百度网盘：**** 本内容需购买 ****
解压密码：https://deepface.cc/ 复制这个完整的网址即是解压密码，不要有空格，复制粘贴即可

丛林法则 发表于 2025-3-14 10:16:14

C盘已整理，等包中

onlymyme 发表于 2025-3-14 23:42:07

能看看是什么问题吗
笔记本4060 8G现存 16G内存
NVIDIA-SMI 566.14
Driver Version: 566.14
CUDA Version: 12.7

RuntimeError: CUDA out of memory. Tried to allocate 2.00 GiB. GPU 0 has a total capacity of 8.00 GiB of which 0 bytes is free. Of the allocated memory 11.15 GiB is allocated by PyTorch, and 1.02 GiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.See documentation for Memory Management(https :// pytorch.org/docs/stable/notes/cuda.html#environment-variables)

无言以对 发表于 2025-3-15 07:52:10

onlymyme 发表于 2025-3-14 23:42
能看看是什么问题吗
笔记本4060 8G现存 16G内存
NVIDIA-SMI 566.14

显存不足，理论上这卡是可以运行的，内存回退策略开启试试，不要开别的软件

onlymyme 发表于 2025-3-15 11:24:16

无言以对发表于 2025-3-15 07:52
显存不足，理论上这卡是可以运行的，内存回退策略开启试试，不要开别的软件 ...

566的驱动无法更改内存回退政策，于是更新到目前最新的572版本的驱动，成功修改

“偏好系统内存回退” 和 “偏好无系统内存回退”都试了，没能成功

RuntimeError: CUDA out of memory. Tried to allocate 512.00 MiB. GPU 0 has a total capacity of 8.00 GiB of which 0 bytes is free. Of the allocated memory 6.65 GiB is allocated by PyTorch, and 350.86 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.See documentation for Memory Management

来日方长 发表于 2025-3-16 22:14:39

onlymyme 发表于 2025-3-15 11:24
566的驱动无法更改内存回退政策，于是更新到目前最新的572版本的驱动，成功修改

“偏好系统内存回退”...

这确实是显存不足，我看有人4060Laptop，用了共享显存也能玩。
你看看后台是不是有其他程序在吃显存

onlymyme 发表于 2025-3-16 23:02:21

来日方长发表于 2025-3-16 22:14
这确实是显存不足，我看有人4060Laptop，用了共享显存也能玩。
你看看后台是不是有其他程序在吃显存 ...

应该没其它的软件抢显存了，我直接关了自启软件重启电脑开机就直接运行DiffRhythm，还是爆了显存，后边我又找了一些其他人发的一键包是能成功跑出结果的，从任务管理器上看显存，v2版运行失败的是显存7.6/8.0然后爆了显存，用别人发的跑成功显存是6点几没超过7，如果v2版能再降一点显存应该也是能成功的

来日方长 发表于 2025-3-17 10:01:51

onlymyme 发表于 2025-3-16 23:02
应该没其它的软件抢显存了，我直接关了自启软件重启电脑开机就直接运行DiffRhythm，还是爆了显存，后边我 ...

你看看共享显存有没有使用

xuesefu 发表于 2025-4-9 07:33:34

本帖最后由 xuesefu 于 2025-4-9 07:35 编辑

onlymyme 发表于 2025-3-14 23:42
能看看是什么问题吗
笔记本4060 8G现存 16G内存
NVIDIA-SMI 566.14

我4070 8G，另外吃掉16GB共享显存，没爆:D

sdtdt888 发表于 2025-11-16 18:22:27

密码错误

页: [1]

前沿AI软件资源站's Archiver

DiffRhythm(谛韵) V2版 - AI音乐创作新纪元，新增文本提示生成歌曲，10 秒生成 AI 歌曲，人声伴奏一键搞定 本地一键整合包下载

DiffRhythm(谛韵) V2版 - AI音乐创作新纪元，新增文本提示生成歌曲，10 秒生成 AI 歌曲，人声伴奏一键搞定本地一键整合包下载