找回密码
 立即注册
查看: 1176|回复: 14

LatentSync - 字节开源最强AI数字人项目,精准控制唇形同步模型 本地一键整合包下载

[复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2025-1-8 22:44:12 | 显示全部楼层 |阅读模式

LatentSync - 字节开源的数字人项目,精准控制唇形同步模型 本地一键整合包下载 ... ... ... ... ... ... . ...

LatentSync - 字节开源的数字人项目,精准控制唇形同步模型 本地一键整合包下载 ... ... ... ... ... ... . ...

LatentSync‌ 是由字节跳动与北京交通大学联合提出的一种基于音频条件的潜在扩散模型的端到端唇同步框架。该框架无需任何中间运动表示,直接利用Stable Diffusion的强大能力,建模复杂的音频与视觉之间的关系,实现视频中人物唇部动作与音频的精准同步‌。

LatentSync‌ 可广泛用于音频驱动数字人项目中,测试下来,应该是目前开源效果最好的数字人项目,但它同样有个类似项目共同的缺点,对中文适配效果稍差。

应用场景
LatentSync 可以应用于配音、虚拟头像、AI数字人生成等场景,通过输入音频生成与之匹配的唇部运动,实现高度逼真的口型同步效果‌

项目优势
此外,该模型对硬件要求适中,仅需 6.5 GB的显存即可运行,适合大多数开发者和研究人员使用‌


使用教程:(建议N卡,显存6G起)
上传驱动音频和视频,生成即可。

下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOG8pEKF1jhYzSNrHuwvLp4iA1?pwd=qjsd

夸克网盘:https://pan.quark.cn/s/6a3dab2d9469
百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源立即购买


解压密码:https://deepface.cc/

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

158

回帖

244

积分

江湖少侠

积分
244
发表于 2025-1-8 23:36:54 | 显示全部楼层
这个速度快,生成效果不错的,期待中

签到天数: 5 天

[LV.2]偶尔看看I

0

主题

24

回帖

57

积分

无名之辈

积分
57
发表于 2025-1-9 08:46:05 | 显示全部楼层
大佬,什么时候可以上这个整合包啊,谢谢大佬
STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-1-9 12:29:14 | 显示全部楼层
AlexXu 发表于 2025-1-9 08:46
大佬,什么时候可以上这个整合包啊,谢谢大佬
STAR: Spatial-Temporal Augmentation with Text-to-Video Mo ...

是这个吗 https://github.com/NJU-PCALab/STAR
在关注,等官方webui发布了就整合

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

4

回帖

147

积分

上上宾

积分
147

上上宾

发表于 2025-1-9 14:17:34 | 显示全部楼层
这个和muse talk,哪个效果好?

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-1-9 14:23:19 | 显示全部楼层
yangliu 发表于 2025-1-9 14:17
这个和muse talk,哪个效果好?

你可以对比下,我没做对比,这个英文效果更好,尤其是唇形同步更逼真。中文效果差一些

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

63

回帖

403

积分

上上宾

积分
403

上上宾

发表于 2025-1-9 15:28:15 | 显示全部楼层
只有八秒长度?

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-1-9 15:40:58 | 显示全部楼层
maya2024 发表于 2025-1-9 15:28
只有八秒长度?

以你的音频长度为准

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

63

回帖

403

积分

上上宾

积分
403

上上宾

发表于 2025-1-9 15:59:18 | 显示全部楼层
无言以对 发表于 2025-1-9 15:40
以你的音频长度为准

我的音长20秒左右

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-1-9 16:29:02 | 显示全部楼层
maya2024 发表于 2025-1-9 15:59
我的音长20秒左右

我测试过一个10s的,20s是不是太长了,你看报错了没

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-19 07:57 , Processed in 0.096696 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表