设为首页收藏本站 劰载中...

 找回密码
 立即注册
查看: 105|回复: 2

ACE-Step V3版 - 用AI玩转专业音乐创作 更新ACE-Step v1.5模型 小白创作音乐,支持50系显卡 一键整合包下载

[复制链接]

900

主题

1502

回帖

8万

积分

武林盟主

积分
89016

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 昨天 16:23 | 显示全部楼层 |阅读模式

马上注册,下载更多AI资源软件

您需要 登录 才可以下载或查看,没有账号?立即注册

×

ACE-Step V3版 - 用AI玩转专业音乐创作 更新ACE-Step v1.5模型 小白创作音乐,支持50系显卡 一键整合包下载 ...

ACE-Step V3版 - 用AI玩转专业音乐创作 更新ACE-Step v1.5模型 小白创作音乐,支持50系显卡 一键整合包下载 ...

ACE-Step V1.5 是一个开源的 AI 音乐生成工具,它能在普通电脑上快速生成高质量的歌曲,功能比很多商业音乐 AI 还强。你只要输入简单的描述,它就能帮你做出完整的音乐作品。

简单的说,它让你的家用电脑(哪怕显卡只有4~8GB显存)也能几秒钟做出接近Suno、Udio那种商用级、带人声+完整结构的AI歌曲,而且完全免费、本地跑、不用联网。你只需要给它一个简单的提示(比如“欢快的电子舞曲”),它就能在几秒钟内生成一首完整的歌,还能附带歌词和描述。如果你想让它更像你自己的风格,只要喂几首你喜欢的歌,它就能学会并模仿。并且支持歌曲翻唱和片段修改,普通小白也能创作出专业的音乐和歌曲。


今天分享的ACE-Step V3版基于最新的ACE-Step v1.5模型制作,在官方WebUI的基础上做了本地化功能和bug修复,自动根据本地设备显存调节参数,最低4G显存即可运行。
相比之前分享的傻瓜AI音乐创作工具,它更像是一个专业的AI音乐创作工具,除了傻瓜式的一键生成,还支持高级参数调教,同样适合专业的音乐创作人。




核心特点

速度快:在高端显卡(A100)上生成一首歌只需 2 秒左右,在 RTX 3090 上不到 10 秒;普通显卡只要有 4GB 显存也能跑。  
高质量:生成效果接近甚至超过一些商业产品(比如 Suno v4.5/v5)。  
多样化风格:支持 1000+ 种乐器和风格,还能精细控制音色。  
多语言歌词:支持 50+ 种语言,能根据提示生成歌词并保持结构和风格。  
灵活时长:可以生成从 10 秒到 10 分钟的音乐。  
批量生成:一次可以同时生成多首歌(最多 8 首)。




特殊功能

翻唱与改编:能把已有音频改成不同风格的翻唱。  
局部编辑:支持“重绘”,只修改歌曲的一部分。  
人声转伴奏:可以把人声自动转成背景音乐。  
多轨生成:像专业音乐软件一样,可以给歌曲加层次。  
参数控制:能指定节奏(BPM)、调性、拍号等。  
歌词时间轴:自动生成 LRC 歌词文件。  
个性化训练:只需几首歌,就能用 LoRA 微调出自己的风格。




使用教程:(建议N卡,显存4G起,支持50系显卡)


下载主程序压缩包和模型文件(checkpoints文件夹),解压主程序,并把模型文件移动到主程序目录下

支持多种创作模式,简洁模式、自定义模式、翻唱模式、局部编辑模式
简洁模式:输入音乐风格和主体,AI自动一键创作,包含伴奏和歌词及人声演唱。
自定义模式:自定义输入歌曲风格、歌词以及各种高级参数,一键生成自定义歌曲。
翻唱:支持创作的音乐二次翻唱创作,也支持现有歌曲翻唱,保留旋律结构但风格不同。
局部编辑:可选择音乐片段进行修改,比如曲风和歌词。


自带两种模型:turbo和shift3两种
如果你需要精确控制音乐结构(比如分段生成、风格切换),推荐使用 shift3。  
如果你想要快速生成长时间连续的音乐(如背景音乐、氛围音轨),可以尝试turbo

软件目录结构

📂 ACE-Step-V3/

├── 📂 acestep/
├── 📂 checkpoints/
│   ├── 📂 acestep-5Hz-lm-1.7B/
│   │      └── model.safetensors
│   ├── 📂 acestep-v15-turbo/
│   │      └── model.safetensors
│   ├── 📂 acestep-v15-turbo-shift3/
├── 📂 deepface/
......



下载地址:
夸克网盘:https://pan.quark.cn/s/3d939221d79e
百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 30碎银 下载该资源立即购买



DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

900

主题

1502

回帖

8万

积分

武林盟主

积分
89016

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 昨天 16:38 | 显示全部楼层
关于提示词
可以输入简短的风格描述,比如“female vocals,rap,modern,hip hibhi, Indian fusion,whispered.”
然后点击下方的格式化

关于歌词
包含 Intro -> Verse 1 -> Chorus -> Verse 2 -> Chorus -> Outro几个标签


各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

900

主题

1502

回帖

8万

积分

武林盟主

积分
89016

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 昨天 16:41 | 显示全部楼层
歌词也可以借助大语言模型,比如千问,ChatGPT,豆包等
输入以下提示词
  1. # Role
  2. 你现在是 ACE-Step 1.5 模型的专家级提示词工程师和资深音乐制作人。你的任务是根据用户的主题,生成能驱动 ACE-Step 1.5 创作出高质量(90-120秒)歌曲的完整配置方案。

  3. # ACE-Step 1.5 Technical Context (技术背景)
  4. 1. **架构**:该模型使用 LLM 进行结构规划,DiT 进行声音渲染。因此,提示词需要兼顾“逻辑结构”和“声音细节”。
  5. 2. **格式偏好**:
  6.    - **Tags (标签式)**:适合 ComfyUI,用逗号分隔,堆叠风格、乐器、情绪、人声特征。
  7.    - **Narrative (叙述式)**:适合 Playground,用自然语言详细描述编曲层次。
  8. 3. **时长控制**:目标生成 90-120 秒。这意味着歌词结构不能太长,通常包含 Intro -> Verse 1 -> Chorus -> Verse 2 -> Chorus -> Outro 即可。
  9. 4. **强效词汇**:模型对具体的合成器型号(如 TB-303, DX7)、鼓机(TR-808/909)、混音术语(Sidechain Compression)以及具体乐理(Phrygian Mode)敏感。

  10. # Task
  11. 当用户提供一个简短的主题(例如:“赛博朋克风格的雨夜” 或 “一首关于失恋的悲伤民谣”)时,你需要输出以下三个部分:

  12. ## Part 1: ComfyUI Tags (标签式提示词)
  13. - 格式:英文,逗号分隔。
  14. - 必须包含:具体的流派 (Genre)、乐器 (Instruments)、情绪 (Mood)、速度 (BPM)、人声风格 (Vocal Style)。
  15. - *技巧*:加入 "High fidelity", "Studio quality", "Masterpiece" 等质量词。

  16. ## Part 2: Narrative Prompt (叙述式提示词)
  17. - 格式:一段 3-4 句的英文描述。
  18. - 内容:像乐评人一样描述这首歌。例如:“这首歌以...开始,低音部分使用了...,人声是...风格,营造了...的氛围。”

  19. ## Part 3: Structured Lyrics (结构化歌词)
  20. - 语言:根据用户要求(默认为中文或用户指定语言)。
  21. - 结构标签:必须使用 `[intro]`, `[verse]`, `[chorus]`, `[bridge]`, `[outro]` 等标签包裹。
  22. - 长度:严格控制在 90-120 秒的体量(约 150-200 字左右)。

  23. # Constraints
  24. - 歌词不要过长,确保能在 2 分钟内唱完。
  25. - 如果是器乐曲 (Instrumental),Part 3 则输出 "No lyrics / Instrumental"。
  26. - 保持专业性,使用具体的音乐术语(如 "Slap Bass", "Arpeggiated Synth")。
复制代码


然后等待再次输入你的风格要求,比如伤感民谣,流行舞曲等,等待LLM返回提示词和歌词,分别在WebUI对应的输入框里填上即可。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|前沿AI软件资源站

GMT+8, 2026-2-6 07:06 , Processed in 0.048976 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表