设为首页收藏本站 劰载中...

 找回密码
 立即注册
查看: 62|回复: 1

Wan2GP V45版 - 多个模型及功能更新 低配显卡玩转AI绘画/视频生成/音乐语音 支持50系显卡 一键整合包下载

[复制链接]

1023

主题

1815

回帖

12万

积分

武林盟主

积分
129371

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 昨天 16:49 | 显示全部楼层 |阅读模式

马上注册,下载更多AI资源软件

您需要 登录 才可以下载或查看,没有账号?立即注册

×

Wan2GP V45版 - 多个模型及功能更新 低配显卡玩转AI绘画/视频生成/音乐语音 支持50系显卡 一键整合包下载 . ...

Wan2GP V45版 - 多个模型及功能更新 低配显卡玩转AI绘画/视频生成/音乐语音 支持50系显卡 一键整合包下载 . ...

Wan2GP 是一个由DeepBeepMeep开发开源的 “显卡门槛低的全能型 AI 创作工具”,最大的特点是“低显存也能跑”,支持多种模型(视频、图像、语音、音乐),旨在为GPU资源有限的用户提供高质量的 视频/绘画 生成体验。它囊括了多种绘画/视频生成模型,包括阿里的Wan及其衍生模型、腾讯的Hunyuan Video和LTV Video等主流视频生成和Qwen-Image-Edit、Flux、Z-Image等模型,通过简洁易用的网页界面,用户无需深入了解复杂的模型细节,即可轻松生成想要的 绘画/视频内容。

Wan2GP 的问世,让广大低端显卡用户也能玩转高大上的视频生成项目了。就以HunyuanVideo 13B图生视频模型来说,原版需要至少80G显存才能跑得动的模型,现在 Wan2GP 把这个标准降低到10GB,而且生成的视频质量几乎没用任何的损失和降低。但缺点也是有的,生成时间会拉长,同时需要更大的运行内存。
Wan2GP 同时支持各种主流高质量的AI绘画和图像编辑模型以及语音和音乐生成模型,目前支持Flux和Qwen主流图像生成和图像编辑模型、Qwen-TTS和Index-TTS等主流语音模型、Ace-Step等音乐生成模型,涵盖视频生成、图像生成、语音音乐等综合领域All In One。


今天分享的 Wan2GP V45版,基于官方 6月29日的 V12.288 打包。新增 Scail 2、JoyAI-Echo、Bernini等视频生成模型; 新增 KREA-2、Ideograms 等图像模型;新增 Stable Audio 3、PrismAudio等音频模型;以及多个LTX周边模型及插件更新。

因后期版本整体做了模块化及大量内部重构,翻译的工作量难度也相应增大,翻译后的版本可能有一些问题, 如有影响使用的问题,请评论区回复,会第一时间修复。

在尽量保证功能完整的情况下,进一步对WebUI做了更多的汉化翻译,目前汉化率97%。新增“多开”功能,支持一次开启多个WebUI。
注. 从V6版到V39版,提供两种版本,免费版和付费版。区别为:免费版不再提供中文翻译,原汁原味官方原版,不包含模型;付费版为中文翻译版,包含一些常用的模型,后期会逐步加入更多模型,以及一些优化功能加入。

因个人精力优先,故从V40版起,不再发布任何免费版本的Wan2GP一键包。如需免费版,请移步历史版本


6月29日更新内容

环境部分:

新增GGUF内核,优化Wan Pytorch 编译器,恢复稳定的环境 torch到2.7;更新 SageAttention;集成Git环境,无需手动安装Git即可实现插件安装配置

因官方已支持 Python 3.11、Pytorch 2.10、Cuda 13组合,对Blackwell架构显卡做了大量优化和性能提升,后期版本考虑单独制作一个基于Blackwell架构(50系显卡)版的Wan2GP。

主要更新内容:


KREA-2:新的图像生成器模型,号称是最美观的开源图像模型。

Scail 2:最好的视频角色动画师之一的续集,也是 Wan 2.2 Animate 的一个非常好的替代品。您可以通过提供起始图像和包含运动的控制视频来为最多 5 个人制作动画,也可以替换现有控制视频中的一个人。得益于新的参考图像输入,动画模式可以很好地保留身份,最重要的是,它支持滑动窗口以实现不间断的舞蹈!

LTX-2.3 多主题参考:这是使用 LTX 2.3 时添加参考图像的另一种方法。这种微调结合了 Distilled 1.1 和 LiconStudio 的新 LoRA。只需提供2至5张参考图片即可;首先是背景,然后是主体和客体。请注意,嵌入的 lora 非常喜欢白色背景的字符表。

Bernini 14B:从Wan 2.2导出的视频模型真是不可思议。您可以要求它修改现有视频的内容或生成具有任意数量的参考图像的新视频。它确实有效。不过,这是有代价的:要生成 81 帧,您将需要 12 GB VRAM(用于 v2v)/ 16 GB(用于 v2v + 参考帧)。 v2v 与 Lora 加速器(例如闪电 4 步)配合得很好。但一旦包含参考系,您就必须在没有 lora 加速器的情况下在指导下完成至少 15 个步骤。你不能抱怨,这个模型被宣传为可以在 H100 上运行,并且感谢 WangGP 的魔力,你可以在家里运行它。

Stable Audio 3: WanGP 文本转语音 (TTS) 模型集合现已完成,模型可以生成声音、背景音乐或特效。

Ideograms v4:这个图像生成器声称是最好的开源图像生成器。它使用 WanGP PromptEnhancer 可以为您生成的特殊 Json 提示格式。但有一个障碍:有时,即使是无害的提示也可能会触发安全过滤器。没有办法解决这个问题,因为它是硬编码在模型权重中的。

PiD:Nvidia 推出的新型高品质 x4 图像空间上采样器。它应该仅适用于 Flux/Flux2 兼容模型,因为它需要直接插入 VAE 解码器。然而,由于一个简单的技巧,它随处可用。如果您要求非常高的输出分辨率,可能会触发一些自动平铺。 WanGP 版本像往常一样进行了超优化,即使不使用平铺,也需要很少的 VRAM。

JoyAI-Echo:这款新的 LTX-2.3 型号是您在开源世界中可能找到的最接近 SeeDance 2 的型号。它是一个用于连接多窗口故事的音视频模型。 JoyAI-Echo 在窗口之间保留紧凑的记忆,因此以后的镜头可以重复使用角色、声音、物体和地点。 JoyAI-Echo 的 WanGP 实现远远超出了原始实现。

媒体流插件:完整视频处理现在被命名为媒体流,因为它可以处理图像和视频。更好的是,新的批处理模式可以处理任意数量的文件:例如,为 Media Flow 提供包含蝴蝶图片集的文件夹的路径,所有相应的图像将一键上采样!

PrismAudio:这是一个视频到音频处理器,是 MMaudio 的替代品,非常适合为现有视频添加声音。它需要提示。它不是用来生成口语单词的。



项目特点

低显存要求:只需 6GB 显存即可运行部分模型,适合“显卡贫民”(老款 NVIDIA RTX 10xx/20xx)。  
多模型支持:兼容 Wan 2.1/2.2、Hunyuan Video、Flux、Qwen Image、LTX Video、Kandinsky 等主流开源生成模型。  
多模态功能:不仅能生成视频,还支持图像编辑、语音合成(TTS)、音乐生成。  
插件生态:内置画廊浏览器、模型管理器、CivitAI 下载器、Upscaler 等工具,方便扩展。  
易用性:提供完整的网页界面和命令行模式,支持队列生成和批处理。  
优化性能:支持量化(int8、fp8、NV FP4 等),提升速度同时降低显存占用。



应用领域

短视频创作:快速生成 AI 视频,用于社交媒体内容、广告或创意展示。  
语音合成与配音:支持情感化 TTS,可生成多角色对话,适合播客、虚拟主播。  
音乐生成:内置 Ace Step、Heart Mula 等模型,可自动生成歌曲和歌词。  
学术研究与实验:为研究人员提供多模态生成平台,方便测试不同模型。  
个性化创作:支持 Lora 微调和控制视频生成参数,满足定制化需求。



使用教程:(建议N卡,显存8G起,内存32G起。支持50系显卡,基于CUDA12.8)

使用和之前发布的Wan2.1以及类似的视频生成软件类似,根据需要,点击最上方的模型列表,切换需要使用的模型,会根据切换的模型自动下载,模型较大,耐心等待下载完成。
注. 模型是通用的,更新新版后,只需要将之前旧版的模型目录(目录下的ckpts)移动到新软件目录下即可,无需重复下载

支持文生视频和图生视频。支持低端显卡运行阿里Wan、腾讯HunyuanVideo以及LTV Video等高精度模型。支持多种Lora类型扩展,请根据页面使用说明将lora模型放入对应的目录手动加载。
启动WebUI后,页面有“指南”选项卡,作者很详细的介绍了不同的模型参数和特点及应用领域、Lora模型的加载及使用以及VACE ControlNet的详细使用说明。UI我也做了大部分汉化,方便大家使用。
基于原版使用文档,我做了详细的翻译,建议大家仔细阅读,作为操作参考。

测试了30-50系显卡,均能正常运行。10-20没做测试,可自行测试

Wan2.2 提示词填写技巧,可以参考官方文档:
https://mp.weixin.qq.com/s/ucHuyomTZ6X2q_tL3wHQQg
https://alidocs.dingtalk.com/i/nodes/jb9Y4gmKWrx9eo4dCql9LlbYJGXn6lpz


软件目录结构:

📂 ckpts/
│   ├── 📂 chinese-wav2vec2-base/
│   │      └── pytorch_model.bin
│   ├── 📂 Qwen2.5-VL-7B-Instruct/
│   │      └── Qwen2.5-VL-7B-Instruct_quanto_bf16_int8.safetensors
│   └── 📂 umt5-xxl/
│          └── models_t5_umt5-xxl-enc-quanto_int8.safetensors
📂 models/
│   ├── 📂 qwen/
│   ├── 📂 wan/

│    ...
📂 loras/
📂 deepface/
......




下载地址:
夸克网盘:

🔒付费内容
游客, 上上宾会员 可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 99碎银 下载该资源


百度网盘:
🔒付费内容
游客, 上上宾会员 可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 99碎银 下载该资源


DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

0

主题

18

回帖

143

积分

上上宾

积分
143

突出贡献上上宾

发表于 昨天 20:19 | 显示全部楼层
坛主辛苦,终于等到了,WAN2GP yyds,功能最丰富的工作台,有这一个,其它基本都不需要了
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|前沿AI软件资源站

GMT+8, 2026-6-30 02:07 , Processed in 0.032587 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表