找回密码
 立即注册
查看: 9957|回复: 173

让照片说话 - SadTalker 语音驱动数字人一键整合包

 火.. [复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

603

主题

722

回帖

4万

积分

武林盟主

积分
47957

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-4-19 21:26:04 | 显示全部楼层 |阅读模式

让照片说话 - SadTalker 语音驱动数字人 一键整合包

让照片说话 - SadTalker 语音驱动数字人 一键整合包




随着数字人概念的火爆、生成技术的不断发展,让照片里的人物跟随音频的输入动起来也不再是难题。

不过目前「通过人脸图像和一段语音音频来生成会说话的人物头像视频」仍然存在诸多问题,比如头部运动不自然、面部表情扭曲、视频和图片中的人物面部差异过大等问题。

最近来自西安交通大学等的研究人员提出了SadTalker模型,在三维运动场中进行学习从音频中生成3DMM的3D运动系数(头部姿势、表情),并使用一个全新的3D面部渲染器来生成头部运动。

项目地址:https://github.com/OpenTalker/SadTalker

如果你想要体验更好的效果,目前开源里效果最好的数字人,也只有腾讯的MuseTalk了,点此进入


这里简单说下几个参数:

1、姿势样式:设置不同的数值,可以调整说话时不同的头部转动姿势。可以逐个增加这个数值测试效果;

2、人脸模型分辨率:分为256和512,512生成的人脸清晰度比256要好,但512好像会失真,且速度比256慢,如果头像不是很大,256就够了;

3、预处理:简单说就是处理人头和身体的衔接,具体哪种方式,可以自行测试,可以配合“姿势样式”这个参数来设置;

4、静止模式:就是说话人头不会晃动;

5、批处理大小:数值越大,处理速度越快,需要的显存也越大。根据自己显卡设置,显卡差的不要随便改,容易爆显存。

同为音频驱动图像生成数字人项目,和本站分享的另一个项目 SadTalker-Video-Lip-Sync 类似,具体两者对比,我没做过测试,有兴趣的朋友可以自行测试。

下载解压后,再下载附件,下载后拷贝到软件目录下,然后手动配置FFMPEG,配置教程 点此进入 再运行一键启动。


下载地址:

夸克网盘:https://pan.quark.cn/s/678e0b225507  解压密码:[email protected]

百度网盘:

游客,如果您要查看本帖隐藏内容请回复

requirements.txt

298 Bytes, 下载次数: 357

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

1

回帖

6

积分

初入江湖

积分
6
发表于 2024-4-21 20:07:22 | 显示全部楼层
nihhIHIHiH

评分

参与人数 1碎银 -2 收起 理由
无言*** -2 恶意灌水

查看全部评分

该用户从未签到

0

主题

2

回帖

19

积分

初入江湖

积分
19
发表于 2024-4-22 09:24:03 | 显示全部楼层
一键整合包

该用户从未签到

0

主题

6

回帖

13

积分

初入江湖

积分
13
发表于 2024-4-22 16:13:17 | 显示全部楼层
感谢分享

该用户从未签到

0

主题

6

回帖

13

积分

初入江湖

积分
13
发表于 2024-4-22 16:30:40 | 显示全部楼层
楼主,我这个按任意键就自己关闭了,没了
微信图片_20240422162917.png

点评

已更新,下载附件,拷贝到软件目录下即可  发表于 2024-4-22 22:19
少打包一个文件,我晚点发一个补丁  发表于 2024-4-22 16:39

该用户从未签到

0

主题

6

回帖

13

积分

初入江湖

积分
13
发表于 2024-4-22 18:13:12 | 显示全部楼层
anny9931 发表于 2024-4-22 16:30
楼主,我这个按任意键就自己关闭了,没了

我加了一个redulrements.txt 文件,可以用,但是生成出来提示Erro,找到生成的文件夹里面有生成的视频,不过没声音,。

签到天数: 3 天

[LV.2]偶尔看看I

0

主题

5

回帖

340

积分

江湖少侠

积分
340
发表于 2024-4-23 12:36:08 | 显示全部楼层
感谢分享!

该用户从未签到

0

主题

1

回帖

8

积分

初入江湖

积分
8
发表于 2024-4-23 23:01:48 | 显示全部楼层
感谢楼主分享!

该用户从未签到

0

主题

2

回帖

9

积分

初入江湖

积分
9
发表于 2024-4-25 09:37:44 | 显示全部楼层
语音驱动数字人一键整合包

该用户从未签到

0

主题

1

回帖

8

积分

初入江湖

积分
8
发表于 2024-4-25 11:07:40 | 显示全部楼层
感谢分享 下载试试
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-16 19:39 , Processed in 0.158543 second(s), 8 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表