马上注册,下载更多AI资源软件
您需要 登录 才可以下载或查看,没有账号?立即注册
×
Wan2GP V38版 - 低配显卡玩转AI绘画/视频生成 新增音乐、语音和绘画模型 支持50系显卡 一键整合包 ... ... ...
Wan2GP 是一个由DeepBeepMeep开发的开源 AI视频生成/绘画 项目,旨在为GPU资源有限的用户提供高质量的 视频/绘画 生成体验。它囊括了多种绘画/视频生成模型,包括阿里的Wan及其衍生模型、腾讯的Hunyuan Video和LTV Video等主流视频生成和Qwen-Image-Edit、Flux、Z-Image等模型,通过简洁易用的网页界面,用户无需深入了解复杂的模型细节,即可轻松生成想要的 绘画/视频内容。
Wan2GP 的问世,让广大低端显卡用户也能玩转高大上的视频生成项目了。就以HunyuanVideo 13B图生视频模型来说,原版需要至少80G显存才能跑得动的模型,现在 Wan2GP 把这个标准降低到10GB,而且生成的视频质量几乎没用任何的损失和降低。但缺点也是有的,生成时间会拉长,同时需要更大的运行内存。
Wan2GP 同时支持各种主流高质量的AI绘画和图像编辑模型,目前支持Flux和Qwen主流图像生成和图像编辑模型,视频生成和图像生成双剑合璧。
今天分享的 Wan2GP V38版,基于官方 1月28日的 V10.55 打包。新增 Heart Mula音乐创作模型;新增 Qwen 3 TTS语音模型;新增 Z-Image Base图像生成模型;支持自定义Lora模型存储路径等。
因这个版本整体做了大量内部重构,翻译的工作量难度也相应增大,翻译后的版本可能有一些问题, 如有影响使用的问题,请评论区回复,会第一时间修复。
在尽量保证功能完整的情况下,进一步对WebUI做了更多的汉化翻译,目前汉化率97%。新增“多开”功能,支持一次开启多个WebUI。
注. 从V6版开始,提供两种版本,免费版和付费版。区别为:免费版不再提供中文翻译,原汁原味官方原版,不包含模型;付费版为中文翻译版,包含一些常用的模型,后期会逐步加入更多模型,以及一些优化功能加入。
1月28日更新内容
环境部分:
优化Wan Pytorch 编译器,恢复稳定的环境 torch到2.7;更新 SageAttention;集成Git环境,无需手动安装Git即可实现插件安装配置
软件部分:
新增 Heart Mula:在本地PC上生成 Suno 品质的带歌词歌曲。您可生成最长4分钟的音乐;
新增 Qwen 3 TTS:支持语音克隆、基于提示词生成自定义声音,或使用预置声音
新增 Z-Image Base图像生成模型
功能更新
提前停止:您可以中止生成,同时保留已生成的内容(仅适用于自回归模型的TTS模型,图像/视频生成等扩散模型无需此功能);
专业提示词增强器:如在 Heart Mula 中输入"一首关于AI生成的歌曲",WanGP 提示词增强器将为您生成相应的杰作。同样,在使用 Qwen3 TTS 或 ChatterBox 时,您可以增强"关于AI生成的演讲"等提示词;
自定义音频输出文件夹:现在可以为音频生成选择不同的输出文件夹;
音频模型默认内存配置:TTS模型如果使用配置4可能会变得非常慢(作为自回归模型,它们需要逐层加载以生成单个音频标记,然后重复此过程)。另一方面,它们不需要太多显存,因此您现在可以设置更激进的配置(例如3+);
Z Image Base:如果您对 Z Image 感兴趣可以尝试,但除非您是研究人员和/或想在此基础上进行微调,否则对您可能无用。该模型需要35到50步(比 Z Image turbo 慢4到6倍)且 cfg > 1(额外慢2倍),并且没有强化学习,因此输出图像质量不会那么好。优点是更高的多样性和原生负面提示词(相对于 Z Image 使用 NAG 的虚拟负面提示词);
注意:Z Image Base 对注意力模式非常敏感:与 Sage 1 不兼容,会产生黑帧。因此我已为 RTX 30xx 系列显卡禁用 Sage。此外,有报告称使用 Sage 2 时会产生一些垂直带状伪影;
可在配置选项卡中设置新的根目录 LoRAs 文件夹。如果您有多个 WanGP 实例或想将 LoRAs 轻松存储在不同硬盘上,此功能很有用;
杂项选项卡中新增"注意力模式覆盖"设置;
实验性功能:允许在生成过程中更改配置
项目特点
低显存要求:Wan2GP对显存的需求较低,某些模型甚至仅需6GB 显存即可运行,这使得更多用户能够体验到视频生成的乐趣。
支持老旧GPU:项目不仅支持最新的GPU,还兼容RTX 10XX、20XX等老旧型号,降低了硬件门槛。
高效快速:在最新GPU上,Wan2GP能够非常快速地生成视频,大大缩短了等待时间。
易用性:提供全网页界面,用户无需安装额外软件即可使用,同时集成了模型自动下载、视频生成工具(如遮罩编辑器、提示增强器)、时空生成等功能,简化了操作流程。
Loras支持:允许用户自定义每个模型,以满足个性化需求。
排队系统:用户可以列出想要生成的视频清单,稍后回来查看结果,提高了效率。
应用领域
创意内容制作:设计师、动画师等创意工作者可以利用Wan2GP快速生成概念视频、动画短片或广告素材。
娱乐与社交:用户可以在社交媒体上分享通过Wan2GP生成的有趣视频,增加互动性和趣味性。
教育与培训:教师可以制作生动的教学视频,帮助学生更好地理解和掌握知识;企业也可以利用该技术进行产品演示或员工培训。
影视后期制作:影视行业从业者可以利用Wan2GP进行特效制作、场景渲染等工作,提高制作效率和质量。
使用教程:(建议N卡,显存8G起,内存32G起。支持50系显卡,基于CUDA12.8)
使用和之前发布的Wan2.1以及类似的视频生成软件类似,根据需要,点击最上方的模型列表,切换需要使用的模型,会根据切换的模型自动下载,模型较大,耐心等待下载完成。
注. 模型是通用的,更新新版后,只需要将之前旧版的模型目录(目录下的ckpts)移动到新软件目录下即可,无需重复下载
支持文生视频和图生视频。支持低端显卡运行阿里Wan、腾讯HunyuanVideo以及LTV Video等高精度模型。支持多种Lora类型扩展,请根据页面使用说明将lora模型放入对应的目录手动加载。
启动WebUI后,页面有“指南”选项卡,作者很详细的介绍了不同的模型参数和特点及应用领域、Lora模型的加载及使用以及VACE ControlNet的详细使用说明。UI我也做了大部分汉化,方便大家使用。
基于原版使用文档,我做了详细的翻译,建议大家仔细阅读,作为操作参考。
测试了30-50系显卡,均能正常运行。10-20没做测试,可自行测试
Wan2.2 提示词填写技巧,可以参考官方文档:
https://mp.weixin.qq.com/s/ucHuyomTZ6X2q_tL3wHQQg
https://alidocs.dingtalk.com/i/nodes/jb9Y4gmKWrx9eo4dCql9LlbYJGXn6lpz
软件目录结构:
📂 ckpts/
│ ├── 📂 chinese-wav2vec2-base/
│ │ └── pytorch_model.bin
│ ├── 📂 Qwen2.5-VL-7B-Instruct/
│ │ └── Qwen2.5-VL-7B-Instruct_quanto_bf16_int8.safetensors
│ └── 📂 umt5-xxl/
│ └── models_t5_umt5-xxl-enc-quanto_int8.safetensors
📂 models/
│ ├── 📂 qwen/
│ ├── 📂 wan/
│ ...
📂 deepface/
......
下载地址:
迅雷云盘:上传中
夸克网盘:
游客, 上上宾会员可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 99碎银 下载该资源 立即购买
百度网盘:
游客, 上上宾会员可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 99碎银 下载该资源 立即购买
|