设为首页收藏本站 劰载中...

 找回密码
 立即注册
查看: 17|回复: 1

Wan2GP V43版 - 多个模型及功能更新 低配显卡玩转AI绘画/视频生成/音乐语音 支持50系显卡 一键整合包下载

[复制链接]

995

主题

1748

回帖

12万

积分

武林盟主

积分
121136

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 昨天 23:38 | 显示全部楼层 |阅读模式

马上注册,下载更多AI资源软件

您需要 登录 才可以下载或查看,没有账号?立即注册

×

Wan2GP V43版 - 更多LTX2.3扩展更新 低配显卡玩转AI绘画/视频生成/音乐语音 支持50系显卡 一键整合包下载 ...

Wan2GP V43版 -  更多LTX2.3扩展更新 低配显卡玩转AI绘画/视频生成/音乐语音 支持50系显卡 一键整合包下载  ...

Wan2GP 是一个由DeepBeepMeep开发开源的 “显卡门槛低的全能型 AI 创作工具”,最大的特点是“低显存也能跑”,支持多种模型(视频、图像、语音、音乐),旨在为GPU资源有限的用户提供高质量的 视频/绘画 生成体验。它囊括了多种绘画/视频生成模型,包括阿里的Wan及其衍生模型、腾讯的Hunyuan Video和LTV Video等主流视频生成和Qwen-Image-Edit、Flux、Z-Image等模型,通过简洁易用的网页界面,用户无需深入了解复杂的模型细节,即可轻松生成想要的 绘画/视频内容。

Wan2GP 的问世,让广大低端显卡用户也能玩转高大上的视频生成项目了。就以HunyuanVideo 13B图生视频模型来说,原版需要至少80G显存才能跑得动的模型,现在 Wan2GP 把这个标准降低到10GB,而且生成的视频质量几乎没用任何的损失和降低。但缺点也是有的,生成时间会拉长,同时需要更大的运行内存。
Wan2GP 同时支持各种主流高质量的AI绘画和图像编辑模型以及语音和音乐生成模型,目前支持Flux和Qwen主流图像生成和图像编辑模型、Qwen-TTS和Index-TTS等主流语音模型、Ace-Step等音乐生成模型,涵盖视频生成、图像生成、语音音乐等综合领域All In One。


今天分享的 Wan2GP V43版,基于官方 5月28日的 V11.86 打包。新增 LTX2.3多个扩展更新; 新增 LongCat 1.5 Avatar数字人说话视频生成模型;新增 DramaBox 、Omnivoice、 ScenemeAI等语音模型;新增 Vista 4D 多视角动态摄像机场景;新增 HiDreamO1 画图模型等。

因后期版本整体做了模块化及大量内部重构,翻译的工作量难度也相应增大,翻译后的版本可能有一些问题, 如有影响使用的问题,请评论区回复,会第一时间修复。

在尽量保证功能完整的情况下,进一步对WebUI做了更多的汉化翻译,目前汉化率97%。新增“多开”功能,支持一次开启多个WebUI。
注. 从V6版到V39版,提供两种版本,免费版和付费版。区别为:免费版不再提供中文翻译,原汁原味官方原版,不包含模型;付费版为中文翻译版,包含一些常用的模型,后期会逐步加入更多模型,以及一些优化功能加入。

因个人精力优先,故从V40版起,不再发布任何免费版本的Wan2GP一键包。如需免费版,请移步历史版本。


5月28日更新内容

环境部分:

新增GGUF内核,优化Wan Pytorch 编译器,恢复稳定的环境 torch到2.7;更新 SageAttention;集成Git环境,无需手动安装Git即可实现插件安装配置

因官方已支持 Python 3.11、Pytorch 2.10、Cuda 13组合,对Blackwell架构显卡做了大量优化和性能提升,后期版本考虑单独制作一个基于Blackwell架构(50系显卡)版的Wan2GP。

主要更新内容:


在视频模型中直接实现语音克隆:利用任何视频模型实现语音克隆:如果你已经创建了出色的 LTX2/Ovi/Multitalk 等模型,但却因为该模型不支持语音克隆功能而感到遗憾?那么请使用全新的 SeedVC 音频后处理功能吧。该功能可以替换你选定的任意两个声音。无论使用哪种视频模型,这一功能都能完美发挥作用。你可以在“音频”选项卡的“高级设置”中找到该功能,或者将其视为音频/视频的“后期处理”功能。WanGP 独家的“双音语音克隆”功能还能自动识别正在说话的人,并在正确的音频位置进行声音替换

LongCat 1.5 虚拟形象:有了这个全新的“说话头像”模型,你终于可以成为 LongCat 的忠实粉丝了。该模型的处理速度极快(只需 8 步即可完成处理),同时还能通过“滑动窗口”技术生成高质量的内容,几乎不受限制

SeedVC v2:该版本支持语音克隆功能,同时能保留背景噪音/音乐;还支持唱歌功能。你可以在“配置/扩展”选项中启用 SeedVC v2,从而获得更高质量的语音克隆效果(不过,SeedVC v2 不支持唱歌功能)
DramaBox:和 ScenemeAI 一样,DramaBox 也利用 LTX2.3 技术来生成生动的音频效果。相比 ScenemeAI,DramaBox 的表现更为出色(不过处理速度稍慢)。当然,和往常一样,DramaBox 也具备开箱即用的对话模式
ScenemeAI:这是一种基于 LTX2.3 开发的文本转语音技术,它充分利用了 LTX-2 所具备的丰富知识库。由于用户可以通过描述说话者的行为或所说的话来控制音频的输出,因此 ScenemeAI 能够生成极其逼真的音频效果。该系统还支持多个说话者之间的对话功能(前两个说话者还可以进行声音克隆处理)。在生成英语对话时,各个说话者之间的过渡尤为自然流畅。ScenemeAI 属于常见的文本转语音模型之一,不过需要注意的是,由于该系统使用了 LTX2 引擎,因此默认情况下会使用视频内存模式来处理数据。建议使用 WanGP Prompt Enhancer 来帮助生成更生动的对话内容

LTX2.3 Id Lora Distilled、LTX2.3 EditAnything、LTX2 Prompt Relay等多个扩展功能更新

HiDreamO1:进行了新的 2604 次微调,应该能有效减少该模型带来的烦人“遮挡效应”。我还重新生成了所有的 quant8 格式文件(这些文件的体积现在大了 20%,但这是为了获得更好的质量而必须付出的代价)。请注意,该模型更适用于分辨率不低于 1080p 的图像

Omnivoice:这款文本转语音模型速度很快,而且支持 100 种语言的语音合成功能。WanGP 还额外提供了实验性的对话模式(不过这个模式并不理想,因为很难预测 Omnivoice 何时才能完成语音合成)

“魔法遮罩”功能:现在,创建视频遮罩或图像遮罩变得前所未有的简单快捷。无需进入“视频遮罩生成器”选项卡,只需点击“遮罩”字段旁边的“魔术棒”图标,然后在右侧输入诸如“蓝色汽车”或“女士”之类的关键词即可。由 SAM3 技术生成的遮罩质量极高。您一定会欣赏到 SAM3 所带来的出色效果

支持 SAM3 的视频遮罩生成工具:如果您仍然需要生成复杂的遮罩效果,可以将传统的点选式遮罩与 SAM3/Magic Mask 功能结合起来使用。您需要在“配置/扩展”选项卡中启用此功能



项目特点

低显存要求:只需 6GB 显存即可运行部分模型,适合“显卡贫民”(老款 NVIDIA RTX 10xx/20xx)。  
多模型支持:兼容 Wan 2.1/2.2、Hunyuan Video、Flux、Qwen Image、LTX Video、Kandinsky 等主流开源生成模型。  
多模态功能:不仅能生成视频,还支持图像编辑、语音合成(TTS)、音乐生成。  
插件生态:内置画廊浏览器、模型管理器、CivitAI 下载器、Upscaler 等工具,方便扩展。  
易用性:提供完整的网页界面和命令行模式,支持队列生成和批处理。  
优化性能:支持量化(int8、fp8、NV FP4 等),提升速度同时降低显存占用。



应用领域

短视频创作:快速生成 AI 视频,用于社交媒体内容、广告或创意展示。  
语音合成与配音:支持情感化 TTS,可生成多角色对话,适合播客、虚拟主播。  
音乐生成:内置 Ace Step、Heart Mula 等模型,可自动生成歌曲和歌词。  
学术研究与实验:为研究人员提供多模态生成平台,方便测试不同模型。  
个性化创作:支持 Lora 微调和控制视频生成参数,满足定制化需求。



使用教程:(建议N卡,显存8G起,内存32G起。支持50系显卡,基于CUDA12.8)

使用和之前发布的Wan2.1以及类似的视频生成软件类似,根据需要,点击最上方的模型列表,切换需要使用的模型,会根据切换的模型自动下载,模型较大,耐心等待下载完成。
注. 模型是通用的,更新新版后,只需要将之前旧版的模型目录(目录下的ckpts)移动到新软件目录下即可,无需重复下载

支持文生视频和图生视频。支持低端显卡运行阿里Wan、腾讯HunyuanVideo以及LTV Video等高精度模型。支持多种Lora类型扩展,请根据页面使用说明将lora模型放入对应的目录手动加载。
启动WebUI后,页面有“指南”选项卡,作者很详细的介绍了不同的模型参数和特点及应用领域、Lora模型的加载及使用以及VACE ControlNet的详细使用说明。UI我也做了大部分汉化,方便大家使用。
基于原版使用文档,我做了详细的翻译,建议大家仔细阅读,作为操作参考。

测试了30-50系显卡,均能正常运行。10-20没做测试,可自行测试

Wan2.2 提示词填写技巧,可以参考官方文档:
https://mp.weixin.qq.com/s/ucHuyomTZ6X2q_tL3wHQQg
https://alidocs.dingtalk.com/i/nodes/jb9Y4gmKWrx9eo4dCql9LlbYJGXn6lpz


软件目录结构:

📂 ckpts/
│   ├── 📂 chinese-wav2vec2-base/
│   │      └── pytorch_model.bin
│   ├── 📂 Qwen2.5-VL-7B-Instruct/
│   │      └── Qwen2.5-VL-7B-Instruct_quanto_bf16_int8.safetensors
│   └── 📂 umt5-xxl/
│          └── models_t5_umt5-xxl-enc-quanto_int8.safetensors
📂 models/
│   ├── 📂 qwen/
│   ├── 📂 wan/
│    ...
📂 deepface/
......





下载地址:
一键包在路上...

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

0

主题

6

回帖

20

积分

初入江湖

积分
20
发表于 1 小时前 | 显示全部楼层
等大佬一键包中...
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|前沿AI软件资源站

GMT+8, 2026-5-30 01:43 , Processed in 0.031412 second(s), 3 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表