找回密码
 立即注册
查看: 2941|回复: 65

CogVideoX-5B - 智谱最新开源的质量更高、视觉效果更好视频生成模型,最低6G显存可玩 本地一键整合包

[复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

605

主题

724

回帖

4万

积分

武林盟主

积分
48015

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-9-5 09:26:01 | 显示全部楼层 |阅读模式

CogVideoX是智谱AI推出的视频生成模型。CogVideoX开源模型包含多个不同尺寸大小的模型。


2024年8月6日,智谱开源视频生成模型CogVideoX。

2024年8月28日,智谱 AI 开源了 CogVideoX-5B 视频生成模型,相比此前开源的 CogVideoX-2B,官方称其视频生成质量更高,视觉效果更好。


官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早期显卡运行 CogVideoX-2B(2B模型最低6G显存可玩) ,在 RTX 3060 等桌面端“甜品卡”运行 CogVideoX-5B 模型。


CogVideoX-5B - 智谱最新开源的质量更高、视觉效果更好视频生成模型,6G显存可玩 本地一键整合包 ... ... . ...

CogVideoX-5B - 智谱最新开源的质量更高、视觉效果更好视频生成模型,6G显存可玩 本地一键整合包 ... ... . ...


测试效果:

RTX3060 12G显存,提示词 “An Asian woman sitting by the window watching the stars” 50步生成6秒视频耗时800秒,所以视频生成对硬件的要求还是很高。

CogVideoX.mp4 (126.05 KB, 下载次数: 119)



功能特点

文本到视频的生成能力:CogVideo能够将输入的文本描述转换为相应的视频内容。这一功能是基于预训练的文本-图像生成模型CogView2实现的,使得CogVideo能够理解和解析文本信息,并生成与之匹配的视频帧。

多帧率分层训练策略:CogVideo采用了多帧率分层训练策略,这有助于更好地对齐文本和视频剪辑。通过这一策略,模型能够更准确地理解文本描述与视频内容之间的关系,从而生成更符合文本描述的视频。

双向注意力模型插帧:CogVideo使用双向注意力模型对生成的初始几帧图像进行插帧,以增加视频的帧率并生成更完整的视频。这种插帧方法使得生成的视频更加流畅,提高了观看体验。

灵活性和可扩展性:CogVideo的框架设计灵活,易于扩展和集成新的数据集和任务。这使得CogVideo能够适应不同的应用场景和需求,为研究者和开发者提供了更多的可能性。

开源和易用性:CogVideo是一个开源项目,采用Python实现,并提供了详细的文档和教程。这使得研究者和开发者能够方便地使用和定制CogVideo,进一步推动文本到视频生成技术的发展。


应用场景

新闻报道自动生成:根据文本描述快速生成相关新闻视频,提高报道效率。

电影和游戏预览:利用剧本或设计文档生成动态场景和角色预览。

教育培训:创建模拟视频来展示复杂的操作或过程,辅助学习和理解。

建筑可视化:根据建筑师的设计文本生成3D建筑环境和动画。

虚拟现实:为VR应用创造逼真的3D环境和互动体验。

内容营销:为品牌和产品制作引人入胜的视频内容,增强用户参与度。

个性化视频制作:根据用户的个人喜好和需求定制视频内容。


使用教程:

操作很简单,输入提示词,生成即可

这里说下两个模型包,一个是2B模型,另一个是5B模型。

2B模型适用于20系和30系老卡,小显存比如6-10G的也可以用2B模型体验;

另一个5B模型,建议显卡好的体验,比如最新的40系,4080,4090等

下载一键包和对应的模型包,解压即可。


下载地址:(因模型较大,近20个G。所以分为两部分打包,一键包和模型包。先下载解压一键包,模型包下载后,拷贝到一键包根目录,解压到当前文件夹即可)

游客,如果您要查看本帖隐藏内容请回复

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

2

回帖

8

积分

初入江湖

积分
8
发表于 2024-9-5 10:01:57 | 显示全部楼层
坐等大佬分享

该用户从未签到

1

主题

13

回帖

161

积分

上上宾

积分
161

上上宾

发表于 2024-9-5 13:36:20 | 显示全部楼层
哈哈感谢大佬分享

该用户从未签到

0

主题

31

回帖

189

积分

无名之辈

积分
189
发表于 2024-9-5 14:32:29 | 显示全部楼层
这可以啊

该用户从未签到

0

主题

34

回帖

111

积分

无名之辈

积分
111
发表于 2024-9-5 15:11:17 来自手机 | 显示全部楼层
看来只有A100这种几万元的显卡才能愉快的玩,几千元的显卡生成的速度太慢了

该用户从未签到

0

主题

103

回帖

130

积分

无名之辈

积分
130
发表于 2024-9-5 15:54:21 | 显示全部楼层
本帖最后由 szfjm 于 2024-9-5 15:55 编辑

这个相当不错,谢谢分享

该用户从未签到

0

主题

63

回帖

403

积分

上上宾

积分
403

上上宾

发表于 2024-9-5 16:59:56 | 显示全部楼层
2080 ti 22g,可以玩吗

签到天数: 18 天

[LV.4]偶尔看看III

605

主题

724

回帖

4万

积分

武林盟主

积分
48015

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2024-9-5 17:35:35 | 显示全部楼层
maya2024 发表于 2024-9-5 16:59
2080 ti 22g,可以玩吗

你可以试试,应该可以。不行就用2B模型

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

5

回帖

93

积分

无名之辈

积分
93
发表于 2024-9-5 18:47:53 | 显示全部楼层
感谢楼主分享,学习

该用户从未签到

0

主题

63

回帖

403

积分

上上宾

积分
403

上上宾

发表于 2024-9-5 19:37:44 | 显示全部楼层
跑完以后,几秒的视频什么都没有,
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-17 17:59 , Processed in 0.099796 second(s), 10 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表