找回密码
 立即注册
查看: 1085|回复: 12

LatentSync V5版 - 字节开源最强AI数字人项目,音频驱动视频生成数字人说话视频 本地一键整合包下载

[复制链接]

签到天数: 17 天

[LV.4]偶尔看看III

599

主题

714

回帖

4万

积分

武林盟主

积分
47020

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2025-3-16 23:32:54 | 显示全部楼层 |阅读模式

LatentSync V5版 - 字节开源最强AI数字人项目,音频驱动视频生成数字人说话视频 本地一键整合包下载 ... .. ...

LatentSync V5版 - 字节开源最强AI数字人项目,音频驱动视频生成数字人说话视频 本地一键整合包下载 ... .. ...


LatentSync‌ 是由字节跳动与北京交通大学联合提出的一种基于音频条件的潜在扩散模型的端到端唇同步框架。该框架无需任何中间运动表示,直接利用Stable Diffusion的强大能力,建模复杂的音频与视觉之间的关系,实现视频中人物唇部动作与音频的精准同步‌。
LatentSync‌ 是基于音频条件的端到端唇形同步框架,其核心目标是通过音频输入生成高分辨率、动态逼真的唇形同步视频,解决传统方法中时间一致性差、硬件要求高等问题。可广泛用于音频驱动数字人项目中,测试下来,应该是目前开源综合效果最好的数字人项目。


今天分享的 LatentSync V5版,基于官方最新的 LatentSync1.5版,新版主要更新以下内容:
1、修正上个版本唇形同步不一致的问题,提升生成口型同步一致性;
2、提高了中文视频性能,新版模型加入大量中文训练数据集,中文合成效果大幅度提升;
3、加载模型后,清除CUDA缓存,减少资源占用,提升显卡执行效率。


应用场景‌ ‌
影视与广告制作‌:用于后期配音同步、虚拟角色口型调整,提升视频真实感‌。 ‌
教育与企业服务‌:生成虚拟教师或客服的唇形同步视频,增强教学与服务的互动性‌。 ‌
游戏与虚拟人开发‌:为游戏角色或数字人赋予动态口型,实现实时语音交互‌。 ‌
直播与短视频创作‌:支持虚拟主播口型实时匹配音频,降低多语言内容制作成本‌。


使用教程:(建议N卡,显存6G起。基于CUDA12.1)
上传驱动音频和视频,设置相关参数,生成即可。
注意事项:上传参考音频和视频时间长度最好一致,如果音频长度大于视频长度,则默认按照视频时长长度生成。如果视频长度大于音频长度,默认按照音频时长长度生成。
视频教程:https://www.toutiao.com/video/7482596043629969971/

下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOLWb0SBDnSMZAEyr7TrU-XXA1?pwd=di7a
百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 99碎银 下载该资源立即购买


解压密码:https://deepface.cc/ 复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

157

回帖

243

积分

江湖少侠

积分
243
发表于 2025-3-16 23:41:11 | 显示全部楼层
如果是优化过的,这个真是很期待,现在在用的比较占资源,效果也不是很好,期待中,谢谢

该用户从未签到

0

主题

37

回帖

40

积分

初入江湖

积分
40
发表于 2025-3-17 04:34:47 | 显示全部楼层
Хорошо бы  оптимизировать для видео карт 4G

签到天数: 6 天

[LV.2]偶尔看看I

7

主题

47

回帖

268

积分

超级版主

积分
268
发表于 2025-3-17 15:20:16 | 显示全部楼层
字节最近很猛啊,接连不断的王炸产品

该用户从未签到

0

主题

1

回帖

7

积分

初入江湖

积分
7
发表于 2025-3-17 16:58:09 | 显示全部楼层
真不错 厉害

该用户从未签到

0

主题

4

回帖

11

积分

初入江湖

积分
11

突出贡献

发表于 2025-3-20 18:03:02 | 显示全部楼层
请问LatentSync V5版的解压密码

签到天数: 17 天

[LV.4]偶尔看看III

599

主题

714

回帖

4万

积分

武林盟主

积分
47020

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-3-20 18:12:48 | 显示全部楼层
小妮子 发表于 2025-3-20 18:03
请问LatentSync V5版的解压密码

帖子里那么大的字都看不到吗?

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

4

回帖

11

积分

初入江湖

积分
11

突出贡献

发表于 2025-3-20 18:18:44 | 显示全部楼层
解压报错

该用户从未签到

0

主题

4

回帖

11

积分

初入江湖

积分
11

突出贡献

发表于 2025-3-20 18:22:56 | 显示全部楼层
无言以对 发表于 2025-3-20 18:12
帖子里那么大的字都看不到吗?

https://deepface.cc/,报错

签到天数: 17 天

[LV.4]偶尔看看III

599

主题

714

回帖

4万

积分

武林盟主

积分
47020

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-3-20 18:23:08 | 显示全部楼层

https://deepface.cc/thread-302-1-1.html

其他问题没时间回复,请量力而行。

111.webp


各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-11 04:16 , Processed in 0.096507 second(s), 9 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表