找回密码
 立即注册
查看: 2716|回复: 14

Hallo2 - 复旦、百度联手推出全新AI数字人模型 可生成4K超高清+1小时超长视频 本地一键整合包下载

[复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-10-21 13:26:28 | 显示全部楼层 |阅读模式

Hallo2 - 复旦、百度联手推出全新AI数字人模型 可生成4K超高清+1小时超长视频 本地一键整合包下载 ... ... ...

Hallo2 - 复旦、百度联手推出全新AI数字人模型 可生成4K超高清+1小时超长视频 本地一键整合包下载 ... ...  ...


Hallo2是复旦大学和百度联合开发的一款全新 AI数字人模型,该模型可以生成长达数小时的 4K 分辨率人物动画,现已在 GitHub 发布开源,项目地址:https://github.com/fudan-generative-vision/hallo2

Hallo2 模型建立在 latent diffusion models 的基础上,相比上一代 Hallo 模型的效果更好,支持了长视频生成,通过引入数据增强方法如 patch-drop 和高斯噪声,有效提高了长时间视频的视觉一致性和时间连贯性。

Hallo2 还结合了向量量化生成对抗网络和时间对齐技术,保证了高分辨率视频的质量和流畅性。  此外,Hallo2 将可调整的语义文本标签的肖像表情作为条件输入。这超出了传统的音频提示,可以提高可控性并增加所生成内容的多样性。

项目页面介绍称,Hallo2 是第一种实现 4K 分辨率并生成长达 1 小时的音频驱动的人像图像动画的方法,并通过文本提示进行增强。



使用教程:(只支持N卡,推荐显存12G起)
素材要求(对于源图像):它应该被裁剪成方块;面部应该是主要焦点,占图像的 50%-70%;面部应面向前方,旋转角度小于 30°(无侧面轮廓)。
素材要求(对于驱动音频):它必须是 WAV 格式;它必须是 WAV 格式。它必须是英文的,因为我们的训练数据集只使用这种语言;确保人声清晰;背景音乐是可以接受的。


下载地址:
夸克网盘:
https://pan.quark.cn/s/fb6f8630e139
百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 30碎银 下载该资源立即购买

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

6

回帖

12

积分

初入江湖

积分
12

突出贡献

发表于 2024-10-21 13:33:35 | 显示全部楼层
刚买的LivePortrait V4版还没下载好就出来新的了啊

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2024-10-21 14:02:02 | 显示全部楼层
liuhao1207 发表于 2024-10-21 13:33
刚买的LivePortrait V4版还没下载好就出来新的了啊

这俩用途区别还是很大的

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

6

回帖

12

积分

初入江湖

积分
12

突出贡献

发表于 2024-10-21 14:20:49 | 显示全部楼层
无言以对 发表于 2024-10-21 14:02
这俩用途区别还是很大的

我买了那个后才发现买错了,我主要是想弄AI数字人介绍产品的视频,带语音的那种。那个好像不太行。

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2024-10-21 14:22:31 | 显示全部楼层
liuhao1207 发表于 2024-10-21 14:20
我买了那个后才发现买错了,我主要是想弄AI数字人介绍产品的视频,带语音的那种。那个好像不太行。 ...

用 MuseTalk 这个

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

6

回帖

12

积分

初入江湖

积分
12

突出贡献

发表于 2024-10-21 14:34:05 | 显示全部楼层

好的,我去看看

该用户从未签到

0

主题

158

回帖

244

积分

江湖少侠

积分
244
发表于 2024-10-22 10:15:22 | 显示全部楼层
下载试试先,谢谢

签到天数: 21 天

[LV.4]偶尔看看III

0

主题

26

回帖

227

积分

江湖少侠

积分
227

突出贡献

发表于 2024-10-22 12:50:27 | 显示全部楼层
如何收藏帖子啊

该用户从未签到

0

主题

3

回帖

10

积分

初入江湖

积分
10
发表于 2024-10-22 19:58:24 | 显示全部楼层
这个和MuseTalk差不多啊,一个视频改变口型需要语音文件。这个是一张照片改口型,最后得出的东西都差不多啊,有做过对比哪个效果好吗?

签到天数: 5 天

[LV.2]偶尔看看I

0

主题

24

回帖

57

积分

无名之辈

积分
57
发表于 2024-10-22 21:52:23 | 显示全部楼层
我一直报这个错,有没有大神可以教教我怎么解决啊,谢谢大家

RuntimeError: C:\a\_work\1\s\onnxruntime\python\onnxruntime_pybind_state.cc:866 onnxruntime::python::CreateExecutionProviderInstance CUDA_PATH is set but CUDA wasnt able to be loaded. Please install the correct version of CUDA andcuDNN as mentioned in the GPU requirements page,  make sure they're in the PATH, and that your GPU is supported.
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-19 08:05 , Processed in 0.093233 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表