Wan2GP V42版 - 新增MagiHuman 数字人生成模型低配显卡玩转AI绘画/视频生成/音乐语音支持50系显卡一键整合包下载

无言*** · 发表于 2026-4-11 14:26:39

马上注册，下载更多AI资源软件

您需要登录才可以下载或查看，没有账号？立即注册

×

Wan2GP V42版 - 新增MagiHuman 数字人生成模型低配显卡玩转AI绘画/视频生成/音乐语音支持50系显卡一键整 ...

Wan2GP 是一个由DeepBeepMeep开发开源的 “显卡门槛低的全能型 AI 创作工具”，最大的特点是“低显存也能跑”，支持多种模型（视频、图像、语音、音乐），旨在为GPU资源有限的用户提供高质量的视频/绘画生成体验。它囊括了多种绘画/视频生成模型，包括阿里的Wan及其衍生模型、腾讯的Hunyuan Video和LTV Video等主流视频生成和Qwen-Image-Edit、Flux、Z-Image等模型，通过简洁易用的网页界面，用户无需深入了解复杂的模型细节，即可轻松生成想要的绘画/视频内容。

Wan2GP 的问世，让广大低端显卡用户也能玩转高大上的视频生成项目了。就以HunyuanVideo 13B图生视频模型来说，原版需要至少80G显存才能跑得动的模型，现在 Wan2GP 把这个标准降低到10GB，而且生成的视频质量几乎没用任何的损失和降低。但缺点也是有的，生成时间会拉长，同时需要更大的运行内存。
Wan2GP 同时支持各种主流高质量的AI绘画和图像编辑模型以及语音和音乐生成模型，目前支持Flux和Qwen主流图像生成和图像编辑模型、Qwen-TTS和Index-TTS等主流语音模型、Ace-Step等音乐生成模型，涵盖视频生成、图像生成、语音音乐等综合领域All In One。

今天分享的 Wan2GP V42版，基于官方 4月11日的 V11.25 打包。新增 Magi Human，专门用来根据一张照片和文字（或语音）快速生成会说话的真人视频（像数字人、虚拟主播那样）; 新增 Ace 1.5 Turbo XL 音乐创作模型；重启并优化 LTX-2 Ic Lora等。

因后期版本整体做了模块化及大量内部重构，翻译的工作量难度也相应增大，翻译后的版本可能有一些问题，如有影响使用的问题，请评论区回复，会第一时间修复。

在尽量保证功能完整的情况下，进一步对WebUI做了更多的汉化翻译，目前汉化率97%。新增“多开”功能，支持一次开启多个WebUI。
注. 从V6版到V39版，提供两种版本，免费版和付费版。区别为：免费版不再提供中文翻译，原汁原味官方原版，不包含模型；付费版为中文翻译版，包含一些常用的模型，后期会逐步加入更多模型，以及一些优化功能加入。
因个人精力优先，故从V40版起，不再发布任何免费版本的Wan2GP一键包。如需免费版，请移步历史版本。

4月11日更新内容

环境部分：

新增GGUF内核，优化Wan Pytorch 编译器，恢复稳定的环境 torch到2.7；更新 SageAttention；集成Git环境，无需手动安装Git即可实现插件安装配置
因官方已支持 Python 3.11、Pytorch 2.10、Cuda 13组合，对Blackwell架构显卡做了大量优化和性能提升，后期版本考虑单独制作一个基于Blackwell架构（50系显卡）版的Wan2GP。

主要更新内容：

Magi Human：这是一个新的 Talking Head 模型，可以接受自定义音轨，或者可以生成与视频一起的音频语音。
坏消息：它对 VRAM 需求很大（目标 RTX 5090+），并且对分辨率非常挑剔，也就是说输出分辨率必须是 256p 或 1080p（使用两阶段管道进行上采样）。还有一个 540p 版本（也使用上采样器），但它不包括在内，因为我发现它不太实用（如果你的输出不是精确的宽高比，一定会出现重影）。
好消息：现在经过 WanGP 优化后，1080p 下的 101 帧只需要“仅”16GB 的 VRAM。如果你没有那么多 VRAM，我建议仍然选择 1080p，但设置一个 45 帧的滑动窗口（不要太低以避免伪影），因为滑动窗口有时对这个模型效果很好。

LTX-2 Ic Lora 重启：Ic Loras 表现得像控制网络，可以通过应用特定于 Ic Lora 的效果进行视频到视频处理，例如姿态提取、上采样、转移相机运动等。如今越来越多的 Ic Loras 可用。到目前为止，WanGP Ic Lora 的实现基于官方 LTX-2 github 实现（这是一个两阶段过程，其中 Ic Lora 仅在第一阶段低分辨率时应用）。然而，我刚刚发现所有的 Ic Loras 实际上都期望 ComfyUI 实现，这是一个仅在一阶段全分辨率过程中进行的实现。

作为额外福利，我已经调整了 Ic Loras 的滑动窗口，如果你将重叠大小设置为单个帧，在使用 Ic Lora 时，窗口之间的过渡将几乎看不见。
重绘 Ic Lora：如果你选择"Ic Lora 控制视频"选项并启用重绘，这个新的令人印象深刻的 Ic Lora 将自动加载。如果你使用带重绘的滑动窗口，你将能够 Outpaint 一部完整的电影（假设你有足够的 RAM）。
新 Outpainting 自动改变长宽比：提醒一下，WangP 允许你手动定义 Outpainting 应该发生的位置。或者，你现在可以要求 WangP 使用 Outpainting 来改变控制视频的宽度/高度长宽比。例如，你可以通过生成新的细节而不是添加黑边，将任何 16:9 视频转换为 4:3 视频。在这个新模式中的顶部/底部/左侧/右侧滑块将用于定义哪个区域应该优先扩展以满足请求的长宽比。

Ace 1.5 Turbo XL：最好的开源歌曲生成器现在有了 XL 版本的大哥，它提供更好的音频质量和更贴近请求的歌词。

LTX 2 Id Lora：由于巨大的市场需求，我添加了这一个（它是一个新的 Generate Video 选项）。你可以提供语音音频样本、起始图像和文本脚本，它将 LTX 2/2.3 变成会说话的人头。获取这个功能的成本很高，因为 Id Lora 只与 LTX2/2.3 DEV 配合工作。偶然间它似乎只需要 10 个推理步骤就能产生不错的结果。为了获得最佳结果，建议使用前缀标签[VISUAL]、[SPEECH] & [SOUND]。或者你可以使用已经调优过的 WanGP 提示增强器，它已经调整为生成符合这种语法的提示。

LTX 2 NAG：即使你使用蒸馏模型，也可以通过 NAG 支持为 LTX 2 注入负面提示。

LTX2 开发者预设：普通开发者模式和 HQ 模式都有许多可调节的设置。为了使您的生活更轻松，我在设置下拉框中添加了可选的预设

Deepy诸多优化更新...

项目特点

低显存要求：只需 6GB 显存即可运行部分模型，适合“显卡贫民”（老款 NVIDIA RTX 10xx/20xx）。
多模型支持：兼容 Wan 2.1/2.2、Hunyuan Video、Flux、Qwen Image、LTX Video、Kandinsky 等主流开源生成模型。
多模态功能：不仅能生成视频，还支持图像编辑、语音合成（TTS）、音乐生成。
插件生态：内置画廊浏览器、模型管理器、CivitAI 下载器、Upscaler 等工具，方便扩展。
易用性：提供完整的网页界面和命令行模式，支持队列生成和批处理。
优化性能：支持量化（int8、fp8、NV FP4 等），提升速度同时降低显存占用。

应用领域

短视频创作：快速生成 AI 视频，用于社交媒体内容、广告或创意展示。
语音合成与配音：支持情感化 TTS，可生成多角色对话，适合播客、虚拟主播。
音乐生成：内置 Ace Step、Heart Mula 等模型，可自动生成歌曲和歌词。
学术研究与实验：为研究人员提供多模态生成平台，方便测试不同模型。
个性化创作：支持 Lora 微调和控制视频生成参数，满足定制化需求。

使用教程：（建议N卡，显存8G起，内存32G起。支持50系显卡，基于CUDA12.8）

使用和之前发布的Wan2.1以及类似的视频生成软件类似，根据需要，点击最上方的模型列表，切换需要使用的模型，会根据切换的模型自动下载，模型较大，耐心等待下载完成。
注. 模型是通用的，更新新版后，只需要将之前旧版的模型目录（目录下的ckpts）移动到新软件目录下即可，无需重复下载

支持文生视频和图生视频。支持低端显卡运行阿里Wan、腾讯HunyuanVideo以及LTV Video等高精度模型。支持多种Lora类型扩展，请根据页面使用说明将lora模型放入对应的目录手动加载。
启动WebUI后，页面有“指南”选项卡，作者很详细的介绍了不同的模型参数和特点及应用领域、Lora模型的加载及使用以及VACE ControlNet的详细使用说明。UI我也做了大部分汉化，方便大家使用。
基于原版使用文档，我做了详细的翻译，建议大家仔细阅读，作为操作参考。

测试了30-50系显卡，均能正常运行。10-20没做测试，可自行测试

Wan2.2 提示词填写技巧，可以参考官方文档：
https://mp.weixin.qq.com/s/ucHuyomTZ6X2q_tL3wHQQg
https://alidocs.dingtalk.com/i/nodes/jb9Y4gmKWrx9eo4dCql9LlbYJGXn6lpz

软件目录结构：

📂 ckpts/
│ ├── 📂 chinese-wav2vec2-base/
│ │    └── pytorch_model.bin
│ ├── 📂 Qwen2.5-VL-7B-Instruct/
│ │    └── Qwen2.5-VL-7B-Instruct_quanto_bf16_int8.safetensors
│ └── 📂 umt5-xxl/
│       └── models_t5_umt5-xxl-enc-quanto_int8.safetensors
📂 models/
│ ├── 📂 qwen/
│ ├── 📂 wan/
│ ...
📂 deepface/
......

下载地址：
夸克网盘：

🔒付费内容

游客， 上上宾会员 可免费下载该资源，点此开通上上宾 免费下载全站99%的付费资源。或单独支付 99碎银 下载该资源

立即购买

百度网盘：

🔒付费内容

游客， 上上宾会员 可免费下载该资源，点此开通上上宾 免费下载全站99%的付费资源。或单独支付 99碎银 下载该资源

立即购买

ton*** · 发表于 2026-4-14 23:49:18

期待大佬50专属版

asd*** · 发表于 2026-5-18 10:06:53

麻烦问一下，perc_reserved_mem_max的参数在哪里改？

		自动登录	找回密码
密码			立即注册

Wan2GP V42版 - 新增MagiHuman 数字人生成模型低配显卡玩转AI绘画/视频生成/音乐语音支持50系显卡一键整合包下载

马上注册，下载更多AI资源软件

浏览过的版块

宣传达人

灌水之王

突出贡献

荣誉管理

论坛元老

上上宾

Wan2GP V42版 - 新增MagiHuman 数字人生成模型 低配显卡玩转AI绘画/视频生成/音乐语音 支持50系显卡 一键整合包下载

马上注册，下载更多AI资源软件

浏览过的版块

宣传达人

灌水之王

突出贡献

荣誉管理

论坛元老

上上宾

Wan2GP V42版 - 新增MagiHuman 数字人生成模型低配显卡玩转AI绘画/视频生成/音乐语音支持50系显卡一键整合包下载