ACE-Step V3版 - 用AI玩转专业音乐创作 更新ACE-Step v1.5模型 小白创作音乐,支持50系显卡 一键整合包下载
ACE-Step V1.5 是一个开源的 AI 音乐生成工具,它能在普通电脑上快速生成高质量的歌曲,功能比很多商业音乐 AI 还强。你只要输入简单的描述,它就能帮你做出完整的音乐作品。
简单的说,它让你的家用电脑(哪怕显卡只有4~8GB显存)也能几秒钟做出接近Suno、Udio那种商用级、带人声+完整结构的AI歌曲,而且完全免费、本地跑、不用联网。你只需要给它一个简单的提示(比如“欢快的电子舞曲”),它就能在几秒钟内生成一首完整的歌,还能附带歌词和描述。如果你想让它更像你自己的风格,只要喂几首你喜欢的歌,它就能学会并模仿。并且支持歌曲翻唱和片段修改,普通小白也能创作出专业的音乐和歌曲。
今天分享的ACE-Step V3版基于最新的ACE-Step v1.5模型制作,在官方WebUI的基础上做了本地化功能和bug修复,自动根据本地设备显存调节参数,最低4G显存即可运行。
相比之前分享的傻瓜AI音乐创作工具,它更像是一个专业的AI音乐创作工具,除了傻瓜式的一键生成,还支持高级参数调教,同样适合专业的音乐创作人。
核心特点
速度快:在高端显卡(A100)上生成一首歌只需 2 秒左右,在 RTX 3090 上不到 10 秒;普通显卡只要有 4GB 显存也能跑。
高质量:生成效果接近甚至超过一些商业产品(比如 Suno v4.5/v5)。
多样化风格:支持 1000+ 种乐器和风格,还能精细控制音色。
多语言歌词:支持 50+ 种语言,能根据提示生成歌词并保持结构和风格。
灵活时长:可以生成从 10 秒到 10 分钟的音乐。
批量生成:一次可以同时生成多首歌(最多 8 首)。
特殊功能
翻唱与改编:能把已有音频改成不同风格的翻唱。
局部编辑:支持“重绘”,只修改歌曲的一部分。
人声转伴奏:可以把人声自动转成背景音乐。
多轨生成:像专业音乐软件一样,可以给歌曲加层次。
参数控制:能指定节奏(BPM)、调性、拍号等。
歌词时间轴:自动生成 LRC 歌词文件。
个性化训练:只需几首歌,就能用 LoRA 微调出自己的风格。
使用教程:(建议N卡,显存4G起,支持50系显卡)
下载主程序压缩包和模型文件(checkpoints文件夹),解压主程序,并把模型文件移动到主程序目录下
支持多种创作模式,简洁模式、自定义模式、翻唱模式、局部编辑模式
简洁模式:输入音乐风格和主体,AI自动一键创作,包含伴奏和歌词及人声演唱。
自定义模式:自定义输入歌曲风格、歌词以及各种高级参数,一键生成自定义歌曲。
翻唱:支持创作的音乐二次翻唱创作,也支持现有歌曲翻唱,保留旋律结构但风格不同。
局部编辑:可选择音乐片段进行修改,比如曲风和歌词。
自带两种模型:turbo和shift3两种
如果你需要精确控制音乐结构(比如分段生成、风格切换),推荐使用 shift3。
如果你想要快速生成长时间连续的音乐(如背景音乐、氛围音轨),可以尝试turbo
更多提示词和歌词及参数使用,参考评论区说明文件,测试下来,这个模型非常强大,多尝试调教参数,生成的效果不输商业付费模型,而且更灵活,更可控!
软件目录结构
📂 ACE-Step-V3/
├── 📂 acestep/
├── 📂 checkpoints/
│ ├── 📂 acestep-5Hz-lm-1.7B/
│ │ └── model.safetensors
│ ├── 📂 acestep-v15-turbo/
│ │ └── model.safetensors
│ ├── 📂 acestep-v15-turbo-shift3/
├── 📂 deepface/
......
下载地址:
夸克网盘:https://pan.quark.cn/s/3d939221d79e
百度网盘:
**** 本内容需购买 ****
关于提示词
可以输入简短的风格描述,比如“female vocals,rap,modern,hip hibhi, Indian fusion,whispered.”
然后点击下方的格式化
关于歌词
包含 Intro -> Verse 1 -> Chorus -> Verse 2 -> Chorus -> Outro几个标签
歌词也可以借助大语言模型,比如千问,ChatGPT,豆包等
输入以下提示词
# Role
你现在是 ACE-Step 1.5 模型的专家级提示词工程师和资深音乐制作人。你的任务是根据用户的主题,生成能驱动 ACE-Step 1.5 创作出高质量(90-120秒)歌曲的完整配置方案。
# ACE-Step 1.5 Technical Context (技术背景)
1. **架构**:该模型使用 LLM 进行结构规划,DiT 进行声音渲染。因此,提示词需要兼顾“逻辑结构”和“声音细节”。
2. **格式偏好**:
- **Tags (标签式)**:适合 ComfyUI,用逗号分隔,堆叠风格、乐器、情绪、人声特征。
- **Narrative (叙述式)**:适合 Playground,用自然语言详细描述编曲层次。
3. **时长控制**:目标生成 90-120 秒。这意味着歌词结构不能太长,通常包含 Intro -> Verse 1 -> Chorus -> Verse 2 -> Chorus -> Outro 即可。
4. **强效词汇**:模型对具体的合成器型号(如 TB-303, DX7)、鼓机(TR-808/909)、混音术语(Sidechain Compression)以及具体乐理(Phrygian Mode)敏感。
# Task
当用户提供一个简短的主题(例如:“赛博朋克风格的雨夜” 或 “一首关于失恋的悲伤民谣”)时,你需要输出以下三个部分:
## Part 1: ComfyUI Tags (标签式提示词)
- 格式:英文,逗号分隔。
- 必须包含:具体的流派 (Genre)、乐器 (Instruments)、情绪 (Mood)、速度 (BPM)、人声风格 (Vocal Style)。
- *技巧*:加入 "High fidelity", "Studio quality", "Masterpiece" 等质量词。
## Part 2: Narrative Prompt (叙述式提示词)
- 格式:一段 3-4 句的英文描述。
- 内容:像乐评人一样描述这首歌。例如:“这首歌以...开始,低音部分使用了...,人声是...风格,营造了...的氛围。”
## Part 3: Structured Lyrics (结构化歌词)
- 语言:根据用户要求(默认为中文或用户指定语言)。
- 结构标签:必须使用 ``, ``, ``, ``, `` 等标签包裹。
- 长度:严格控制在 90-120 秒的体量(约 150-200 字左右)。
# Constraints
- 歌词不要过长,确保能在 2 分钟内唱完。
- 如果是器乐曲 (Instrumental),Part 3 则输出 "No lyrics / Instrumental"。
- 保持专业性,使用具体的音乐术语(如 "Slap Bass", "Arpeggiated Synth")。
然后等待再次输入你的风格要求,比如伤感民谣,流行舞曲等,等待LLM返回提示词和歌词,分别在WebUI对应的输入框里填上即可。 Caption(音乐描述 / Tags)描述风格、情绪、乐器、氛围……越具体越好。
参考示例female vocals, emotional pop ballad, soft piano, warm strings, heartfelt, intimate, late night, reverb, cinematicaggressive heavy metal, dual distorted guitars, raspy male vocals, fast double-kick drums, epic chorus, powerful小技巧:
[*]用逗号分隔标签(像 Midjourney 那样)
[*]加情绪词:joyful / melancholic / aggressive / chill
[*]加乐器:piano, 808 bass, synth lead, acoustic guitar
[*]加氛围:cinematic, lo-fi, stadium, bedroom
Lyrics(歌词)必须用 方括号结构标签 分段!标准格式:
(soft piano intro)
Walking down the street today
Thinking of the words you used to say
Heart is beating faster now
Don't know how to slow it down
Break the chains, let it pour
Shout it loud, beg no more
We're alive, can't ignore
(whispered)
In the silence I can hear...常用结构标签:
[*] /
[*] /
[*]
[*] /
[*]
[*] /
[*](副歌后喊麦)
歌词小技巧:
[*]每行 6-10 个音节(唱起来舒服)
[*]大写强调高潮:BREAK THE CHAINS
[*]括号是背景声/和声:(oh-oh-oh)
[*]想纯音乐 → 直接写
[*]多语言直接写,模型自动处理(中文、日文、韩文都行)
常用参数详解(从简单到高级)
参数默认值作用小白建议
Audio DurationAuto歌曲时长(10~600秒)先用 30~90秒测试,稳定后再拉长
BPMAuto速度(30~300)想快歌填 140~180,想慢歌填 70~90
Key ScaleAuto调性(C Major / Am 等)不知道就留 Auto
Batch Size2一次生成几首先 2~4,选最好的继续迭代
Inference Steps8(Turbo)去噪步数Turbo 模型 8 步够快够好;Base 模型可到 50
Guidance Scale (CFG)7.0提示词遵循度太低不听话,太高(>12)声音怪;Turbo 模型此项无效
Seed-1(随机)随机种子固定数字 → 同一提示每次结果一样
LM Temperature0.85LM 创意度0.7 更稳定,1.2 更疯狂
Audio Cover Strength(Cover 模式)1.0保留原曲结构程度0.3~0.6 改风格最明显
Shift3.0Turbo 模型专属一般不动,3.0 最均衡
新年好!我这下载了运行,发现报错;然后我以为是下载的有问题,就重新下载了一次,还是报同样的错;是不是我哪缺啥了呢。我下载的V4版本都是可以正常运行,就是这个V3版本的报错;
Skipping import of cpp extensions due to incompatible torch version 2.7.1+cu128 for torchao version 0.15.0 Please see https://github.com/pytorch/ao/issues/2919 for more info
W0222 09:45:28.571000 37156 Lib\site-packages\torch\distributed\elastic\multiprocessing\redirects.py:29] NOTE: Redirects are currently not supported in Windows or MacOs.
In file included from C:/Users/15801/AppData/Local/Temp/tmpl4mx2425/cuda_utils.c:2:
In file included from C:/work/soft/ACE-Step-V3/deepface/Lib/site-packages/triton/backends/nvidia/include/cuda.h:56:
C:/MinGW/include/stdlib.h:125: error: declaration for parameter '__argc_dll' but no such parameter
Failed to compile. cc_cmd: ['C:\\work\\soft\\ACE-Step-V3\\deepface\\Lib\\site-packages\\triton\\runtime\\tcc\\tcc.exe', 'C:\\Users\\15801\\AppData\\Local\\Temp\\tmpl4mx2425\\cuda_utils.c', '-O3', '-shared', '-Wno-psabi', '-o', 'C:\\Users\\15801\\AppData\\Local\\Temp\\tmpl4mx2425\\cuda_utils.cp311-win_amd64.pyd', '-fPIC', '-lcuda', '-lpython3', '-LC:\\work\\soft\\ACE-Step-V3\\deepface\\Lib\\site-packages\\triton\\backends\\nvidia\\lib', '-LC:\\work\\soft\\ACE-Step-V3\\deepface\\Lib\\site-packages\\triton\\backends\\nvidia\\lib\\x64', '-LC:\\work\\soft\\ACE-Step-V3\\deepface\\libs', '-IC:\\work\\soft\\ACE-Step-V3\\deepface\\Lib\\site-packages\\triton\\backends\\nvidia\\include', '-IC:\\work\\soft\\ACE-Step-V3\\deepface\\Lib\\site-packages\\triton\\backends\\nvidia\\include', '-IC:\\Users\\15801\\AppData\\Local\\Temp\\tmpl4mx2425', '-IC:\\work\\soft\\ACE-Step-V3\\deepface\\Include']
Traceback (most recent call last):
File "C:\work\soft\ACE-Step-V3\deepface\Lib\site-packages\diffusers\utils\import_utils.py", line 1016, in _get_module
return importlib.import_module("." + module_name, self.__name__) ph.li 发表于 2026-2-22 09:48
新年好!我这下载了运行,发现报错;然后我以为是下载的有问题,就重新下载了一次,还是报同样的错;是不是 ...
这个需要Flash_Attn加速,需要安装VS编译环境
参考 此贴
或者你就用V4 盟主好!V4正常,V3出错。信息如下,敬请指教。谢谢!
程序启动直到界面打开后的信息(之前还有一些看不到了):
torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 850.00 MiB. GPU 0 has a total capacity of 6.00 GiB of which 0 bytes is free. Of the allocated memory 5.33 GiB is allocated by PyTorch, and 8.51 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.See documentation for Memory Management
2026-02-27 16:56:49.905 | WARNING| acestep.llm_inference:initialize:375 - vllm initialization failed, falling back to PyTorch backend
Warning: 5Hz LM initialization failed: ❌ Error initializing 5Hz LM: CUDA out of memory. Tried to allocate 850.00 MiB. GPU 0 has a total capacity of 6.00 GiB of which 0 bytes is free. Of the allocated memory 5.33 GiB is allocated by PyTorch, and 8.51 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.See documentation for Memory Management
Traceback:
Traceback (most recent call last):
File "C:\AI\ACE-Step-V3\acestep\llm_inference.py", line 216, in _load_pytorch_model
self.llm = AutoModelForCausalLM.from_pretrained(model_path, trust_remote_code=True)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\transformers\models\auto\auto_factory.py", line 604, in from_pretrained
return model_class.from_pretrained(
^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\transformers\modeling_utils.py", line 277, in _wrapper
return func(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\transformers\modeling_utils.py", line 4971, in from_pretrained
model = cls(config, *model_args, **model_kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\transformers\models\qwen3\modeling_qwen3.py", line 436, in __init__
self.model = Qwen3Model(config)
^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\transformers\models\qwen3\modeling_qwen3.py", line 342, in __init__
self.embed_tokens = nn.Embedding(config.vocab_size, config.hidden_size, self.padding_idx)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\torch\nn\modules\sparse.py", line 167, in __init__
torch.empty((num_embeddings, embedding_dim), **factory_kwargs),
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\torch\utils\_device.py", line 104, in __torch_function__
return func(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^
torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 850.00 MiB. GPU 0 has a total capacity of 6.00 GiB of which 0 bytes is free. Of the allocated memory 5.33 GiB is allocated by PyTorch, and 8.51 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.See documentation for Memory Management
Detected system language: zh
Service initialization completed!
Creating Gradio interface...
Enabling queue for multi-user support...
Launching server on 0.0.0.0:7860...
* Running on local URL:
* To create a public link, set `share=True` in `launch()`.
在界面中选择“简单”,输入“歌曲描述”并点击“生成音乐”之后的信息(之前还有一些看不到了):
torch.OutOfMemoryError: CUDA out of memory. Tried to allocate 850.00 MiB. GPU 0 has a total capacity of 6.00 GiB of which 0 bytes is free. Of the allocated memory 5.33 GiB is allocated by PyTorch, and 8.51 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.See documentation for Memory Management
Detected system language: zh
Service initialization completed!
Creating Gradio interface...
Enabling queue for multi-user support...
Launching server on 0.0.0.0:7860...
* Running on local URL:
* To create a public link, set `share=True` in `launch()`.
Traceback (most recent call last):
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\gradio\queueing.py", line 766, in process_events
response = await route_utils.call_process_api(
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\gradio\route_utils.py", line 355, in call_process_api
output = await app.get_blocks().process_api(
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\gradio\blocks.py", line 2152, in process_api
result = await self.call_function(
^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\gradio\blocks.py", line 1641, in call_function
prediction = await utils.async_iteration(iterator)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\gradio\utils.py", line 861, in async_iteration
return await anext(iterator)
^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\gradio\utils.py", line 852, in __anext__
return await anyio.to_thread.run_sync(
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\anyio\to_thread.py", line 63, in run_sync
return await get_async_backend().run_sync_in_worker_thread(
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\anyio\_backends\_asyncio.py", line 2502, in run_sync_in_worker_thread
return await future
^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\anyio\_backends\_asyncio.py", line 986, in run
result = context.run(func, *args)
^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\gradio\utils.py", line 835, in run_sync_iterator_async
return next(iterator)
^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\deepface\Lib\site-packages\gradio\utils.py", line 1019, in gen_wrapper
response = next(iterator)
^^^^^^^^^^^^^^
File "C:\AI\ACE-Step-V3\acestep\gradio_ui\events\__init__.py", line 671, in generation_wrapper
raise gr.Error(f"Failed to create sample: {result.status_message}")
gradio.exceptions.Error: 'Failed to create sample: 5Hz LM not initialized. Please initialize it first.'
TaoLaSha 发表于 2026-2-27 17:09
盟主好!V4正常,V3出错。信息如下,敬请指教。谢谢!
程序启动直到界面打开后的信息(之前还有一些看不到 ...
显存不足
页:
[1]