设为首页收藏本站 劰载中...

 找回密码
 立即注册
查看: 88|回复: 0

Wan2GP V42版 - 新增MagiHuman 数字人生成模型 低配显卡玩转AI绘画/视频生成/音乐语音 支持50系显卡 一键整合包下载

[复制链接]

958

主题

1663

回帖

10万

积分

武林盟主

积分
106887

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 昨天 14:26 | 显示全部楼层 |阅读模式

马上注册,下载更多AI资源软件

您需要 登录 才可以下载或查看,没有账号?立即注册

×

Wan2GP V42版 - 新增MagiHuman 数字人生成模型 低配显卡玩转AI绘画/视频生成/音乐语音 支持50系显卡 一键整 ...

Wan2GP V42版 - 新增MagiHuman 数字人生成模型 低配显卡玩转AI绘画/视频生成/音乐语音 支持50系显卡 一键整 ...

Wan2GP 是一个由DeepBeepMeep开发开源的 “显卡门槛低的全能型 AI 创作工具”,最大的特点是“低显存也能跑”,支持多种模型(视频、图像、语音、音乐),旨在为GPU资源有限的用户提供高质量的 视频/绘画 生成体验。它囊括了多种绘画/视频生成模型,包括阿里的Wan及其衍生模型、腾讯的Hunyuan Video和LTV Video等主流视频生成和Qwen-Image-Edit、Flux、Z-Image等模型,通过简洁易用的网页界面,用户无需深入了解复杂的模型细节,即可轻松生成想要的 绘画/视频内容。

Wan2GP 的问世,让广大低端显卡用户也能玩转高大上的视频生成项目了。就以HunyuanVideo 13B图生视频模型来说,原版需要至少80G显存才能跑得动的模型,现在 Wan2GP 把这个标准降低到10GB,而且生成的视频质量几乎没用任何的损失和降低。但缺点也是有的,生成时间会拉长,同时需要更大的运行内存。
Wan2GP 同时支持各种主流高质量的AI绘画和图像编辑模型以及语音和音乐生成模型,目前支持Flux和Qwen主流图像生成和图像编辑模型、Qwen-TTS和Index-TTS等主流语音模型、Ace-Step等音乐生成模型,涵盖视频生成、图像生成、语音音乐等综合领域All In One。


今天分享的 Wan2GP V42版,基于官方 4月11日的 V11.25 打包。新增 Magi Human门用来根据一张照片和文字(或语音)快速生成会说话的真人视频(像数字人、虚拟主播那样); 新增 Ace 1.5 Turbo XL 音乐创作模型;重启并优化 LTX-2 Ic Lora等。

因后期版本整体做了模块化及大量内部重构,翻译的工作量难度也相应增大,翻译后的版本可能有一些问题, 如有影响使用的问题,请评论区回复,会第一时间修复。

在尽量保证功能完整的情况下,进一步对WebUI做了更多的汉化翻译,目前汉化率97%。新增“多开”功能,支持一次开启多个WebUI。
注. 从V6版到V39版,提供两种版本,免费版和付费版。区别为:免费版不再提供中文翻译,原汁原味官方原版,不包含模型;付费版为中文翻译版,包含一些常用的模型,后期会逐步加入更多模型,以及一些优化功能加入。

因个人精力优先,故从V40版起,不再发布任何免费版本的Wan2GP一键包。如需免费版,请移步历史版本。


4月11日更新内容

环境部分:

新增GGUF内核,优化Wan Pytorch 编译器,恢复稳定的环境 torch到2.7;更新 SageAttention;集成Git环境,无需手动安装Git即可实现插件安装配置

因官方已支持 Python 3.11、Pytorch 2.10、Cuda 13组合,对Blackwell架构显卡做了大量优化和性能提升,后期版本考虑单独制作一个基于Blackwell架构(50系显卡)版的Wan2GP。

主要更新内容:



Magi Human:这是一个新的 Talking Head 模型,可以接受自定义音轨,或者可以生成与视频一起的音频语音。
坏消息:它对 VRAM 需求很大(目标 RTX 5090+),并且对分辨率非常挑剔,也就是说输出分辨率必须是 256p 或 1080p(使用两阶段管道进行上采样)。还有一个 540p 版本(也使用上采样器),但它不包括在内,因为我发现它不太实用(如果你的输出不是精确的宽高比,一定会出现重影)。
好消息:现在经过 WanGP 优化后,1080p 下的 101 帧只需要“仅”16GB 的 VRAM。如果你没有那么多 VRAM,我建议仍然选择 1080p,但设置一个 45 帧的滑动窗口(不要太低以避免伪影),因为滑动窗口有时对这个模型效果很好。


LTX-2 Ic Lora 重启:Ic Loras 表现得像控制网络,可以通过应用特定于 Ic Lora 的效果进行视频到视频处理,例如姿态提取、上采样、转移相机运动等。如今越来越多的 Ic Loras 可用。到目前为止,WanGP Ic Lora 的实现基于官方 LTX-2 github 实现(这是一个两阶段过程,其中 Ic Lora 仅在第一阶段低分辨率时应用)。然而,我刚刚发现所有的 Ic Loras 实际上都期望 ComfyUI 实现,这是一个仅在一阶段全分辨率过程中进行的实现。

作为额外福利,我已经调整了 Ic Loras 的滑动窗口,如果你将重叠大小设置为单个帧,在使用 Ic Lora 时,窗口之间的过渡将几乎看不见。
重绘 Ic Lora:如果你选择"Ic Lora 控制视频"选项并启用 重绘,这个新的令人印象深刻的 Ic Lora 将自动加载。如果你使用带 重绘 的滑动窗口,你将能够 Outpaint 一部完整的电影(假设你有足够的 RAM)。
新 Outpainting 自动改变长宽比:提醒一下,WangP 允许你手动定义 Outpainting 应该发生的位置。或者,你现在可以要求 WangP 使用 Outpainting 来改变控制视频的宽度/高度长宽比。例如,你可以通过生成新的细节而不是添加黑边,将任何 16:9 视频转换为 4:3 视频。在这个新模式中的顶部/底部/左侧/右侧滑块将用于定义哪个区域应该优先扩展以满足请求的长宽比。

Ace 1.5 Turbo XL:最好的开源歌曲生成器现在有了 XL 版本的大哥,它提供更好的音频质量和更贴近请求的歌词。

LTX 2 Id Lora:由于巨大的市场需求,我添加了这一个(它是一个新的 Generate Video 选项)。你可以提供语音音频样本、起始图像和文本脚本,它将 LTX 2/2.3 变成会说话的人头。获取这个功能的成本很高,因为 Id Lora 只与 LTX2/2.3 DEV 配合工作。偶然间它似乎只需要 10 个推理步骤就能产生不错的结果。为了获得最佳结果,建议使用前缀标签[VISUAL]、[SPEECH] & [SOUND]。或者你可以使用已经调优过的 WanGP 提示增强器,它已经调整为生成符合这种语法的提示。

LTX 2 NAG:即使你使用蒸馏模型,也可以通过 NAG 支持为 LTX 2 注入负面提示。

LTX2 开发者预设:普通开发者模式和 HQ 模式都有许多可调节的设置。为了使您的生活更轻松,我在设置下拉框中添加了可选的预设

Deepy诸多优化更新...



项目特点

低显存要求:只需 6GB 显存即可运行部分模型,适合“显卡贫民”(老款 NVIDIA RTX 10xx/20xx,甚至 AMD 显卡也支持)。  
多模型支持:兼容 Wan 2.1/2.2、Hunyuan Video、Flux、Qwen Image、LTX Video、Kandinsky 等主流开源生成模型。  
多模态功能:不仅能生成视频,还支持图像编辑、语音合成(TTS)、音乐生成。  
插件生态:内置画廊浏览器、模型管理器、CivitAI 下载器、Upscaler 等工具,方便扩展。  
易用性:提供完整的网页界面和命令行模式,支持队列生成和批处理。  
优化性能:支持量化(int8、fp8、NV FP4 等),提升速度同时降低显存占用。


应用领域

短视频创作:快速生成 AI 视频,用于社交媒体内容、广告或创意展示。  
语音合成与配音:支持情感化 TTS,可生成多角色对话,适合播客、虚拟主播。  
音乐生成:内置 Ace Step、Heart Mula 等模型,可自动生成歌曲和歌词。  
学术研究与实验:为研究人员提供多模态生成平台,方便测试不同模型。  
个性化创作:支持 Lora 微调和控制视频生成参数,满足定制化需求。



使用教程:(建议N卡,显存8G起,内存32G起。支持50系显卡,基于CUDA12.8)

使用和之前发布的Wan2.1以及类似的视频生成软件类似,根据需要,点击最上方的模型列表,切换需要使用的模型,会根据切换的模型自动下载,模型较大,耐心等待下载完成。
注. 模型是通用的,更新新版后,只需要将之前旧版的模型目录(目录下的ckpts)移动到新软件目录下即可,无需重复下载

支持文生视频和图生视频。支持低端显卡运行阿里Wan、腾讯HunyuanVideo以及LTV Video等高精度模型。支持多种Lora类型扩展,请根据页面使用说明将lora模型放入对应的目录手动加载。
启动WebUI后,页面有“指南”选项卡,作者很详细的介绍了不同的模型参数和特点及应用领域、Lora模型的加载及使用以及VACE ControlNet的详细使用说明。UI我也做了大部分汉化,方便大家使用。
基于原版使用文档,我做了详细的翻译,建议大家仔细阅读,作为操作参考。

测试了30-50系显卡,均能正常运行。10-20没做测试,可自行测试

Wan2.2 提示词填写技巧,可以参考官方文档:
https://mp.weixin.qq.com/s/ucHuyomTZ6X2q_tL3wHQQg
https://alidocs.dingtalk.com/i/nodes/jb9Y4gmKWrx9eo4dCql9LlbYJGXn6lpz


软件目录结构:

📂 ckpts/
│   ├── 📂 chinese-wav2vec2-base/
│   │      └── pytorch_model.bin
│   ├── 📂 Qwen2.5-VL-7B-Instruct/
│   │      └── Qwen2.5-VL-7B-Instruct_quanto_bf16_int8.safetensors
│   └── 📂 umt5-xxl/
│          └── models_t5_umt5-xxl-enc-quanto_int8.safetensors
📂 models/
│   ├── 📂 qwen/
│   ├── 📂 wan/
│    ...
📂 deepface/
......





下载地址:
夸克网盘:
🔒付费内容
游客, 上上宾会员 可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 99碎银 下载该资源


百度网盘:
🔒付费内容
游客, 上上宾会员 可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 99碎银 下载该资源


DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|前沿AI软件资源站

GMT+8, 2026-4-12 04:31 , Processed in 0.038663 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表