找回密码
 立即注册
查看: 2078|回复: 42

Pyramid Flow - 快手联合北大、北邮开发的文生视频AI模型 最高 10 秒 768P@24fps 本地一键整合包下载

[复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-10-14 07:49:36 | 显示全部楼层 |阅读模式

Pyramid Flow - 快手联合北大、北邮开发的文生视频AI模型 最高 10 秒 768P@24fps 本地一键整合包下载 ... . ...

Pyramid Flow - 快手联合北大、北邮开发的文生视频AI模型 最高 10 秒 768P@24fps 本地一键整合包下载 ... . ...

10月12日上午,快手和北京大学及北京邮电大学的研究团队共同开源了Pyramid-Flow的超高清视频生成模型。目前支持两种分辨率模型生成,一种640x384,另一种1280x768。

用户在输入文本之后,即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。主要面向开发者、艺术家和创作者。目前,该模型已经在Hugging Face平台上线,并完全开源。
相比之前的 CogVideoX ,Pyramid Flow的生成速度更快,资源占用更低。
项目地址:https://pyramid-flow.github.io/

项目优势:
高效生成:Pyramid Flow 采用新技术,通过统一 AI 模型分阶段生成视频,大多数阶段为低分辨率,只有最后阶段为全分辨率。这种“金字塔流匹配”方法保持了视频的高视觉质量前提下,大幅降低了计算成本,tokens 数量是传统 diffusion 模型的四分之一。
快速推理:在推理过程中,该模型可以在 56 秒内生成一个 5 秒、384p 的视频,速度媲美许多全序列 diffusion 模型,甚至更快。
开源和商业使用:Pyramid-Flow 在 MIT 许可证下发布,允许广泛的使用,包括商业应用、修改和再分发,吸引了希望将模型集成到专有系统中的开发者和公司。

生成案例:






使用教程:目前只支持N卡,建议显存12G起,作者放出预告,下个版本支持CPU卸载,8G显存可以流畅运行(测试了CPU卸载,速度太慢了,所以低于12G显存的卡就别尝试了)
引导系数: 参数控制视觉质量。我们建议在文本到视频生成期间对 768p 模型使用 [7, 9] ,对 384p模型使用 7 中。
视频引导系数:参数控制运动。较大的值会增加动态程度并减轻自回归生成降级,而较小的值可稳定视频。

对于 10 秒视频生成,我们建议使用引导系数 7 和 视频引导系数 5。


下载地址:
夸克网盘:

https://pan.quark.cn/s/e86a1f9fdfc3

百度网盘:
游客,如果您要查看本帖隐藏内容请回复

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

63

回帖

403

积分

上上宾

积分
403

上上宾

发表于 2024-10-14 10:52:04 | 显示全部楼层
希望我的22g显卡可以用了

该用户从未签到

0

主题

63

回帖

403

积分

上上宾

积分
403

上上宾

发表于 2024-10-15 08:24:21 | 显示全部楼层
大佬看你一下怎么办
屏幕截图 2024-10-15 082246.png

该用户从未签到

0

主题

63

回帖

403

积分

上上宾

积分
403

上上宾

发表于 2024-10-15 08:26:23 | 显示全部楼层
好像是:当前CUDA设备不支持bfloat16。请将dtype切换为float16。

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2024-10-15 08:32:34 | 显示全部楼层
maya2024 发表于 2024-10-15 08:26
好像是:当前CUDA设备不支持bfloat16。请将dtype切换为float16。

官方模型不支持fp16,20系魔改卡估计用不了
你试试更新显卡驱动到最新,或者升级Cuda试试,参考我之前的文章,多cuda共存那篇

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2024-10-15 08:35:34 | 显示全部楼层
maya2024 发表于 2024-10-15 08:24
大佬看你一下怎么办

软件目录下app.py文件,右键记事本打开
第20行左右,model_dtype = "bf16" 把这类的bf16改成 fp32
还是不行的话,就玩不了

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

63

回帖

403

积分

上上宾

积分
403

上上宾

发表于 2024-10-15 08:42:34 | 显示全部楼层
都要改吗?

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2024-10-15 08:46:22 | 显示全部楼层

先按6楼改,运行试试

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

63

回帖

403

积分

上上宾

积分
403

上上宾

发表于 2024-10-15 09:10:12 | 显示全部楼层
已经在运行了,好慢啊
屏幕截图 2024-10-15 082246.png

该用户从未签到

0

主题

63

回帖

403

积分

上上宾

积分
403

上上宾

发表于 2024-10-15 09:19:06 | 显示全部楼层
太慢了啊
屏幕截图 2024-10-15 091813.png
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-19 20:37 , Processed in 0.087874 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表