找回密码
 立即注册
查看: 5556|回复: 34

EchoMimic - 一张照片生成说话视频,可用于AI数字人生成,阿里最新开源 本地一键整合包下载

[复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-7-11 20:47:34 | 显示全部楼层 |阅读模式

EchoMimic - 一张照片生成说话视频,可用于AI数字人生成,阿里最新开源 本地一键整合包下载 ... ... ... .. ...

EchoMimic - 一张照片生成说话视频,可用于AI数字人生成,阿里最新开源 本地一键整合包下载 ... ... ... .. ...


EchoMimic是蚂蚁集团推出的一个AI驱动的口型同步技术项目。这项技术能够通过给定的音频和一张或多张人物的面部照片,生成一个看起来像是在说话的视频,其中的人物口型动作与音频中的语音完美匹配。这种技术在娱乐、教育、虚拟现实、在线会议等领域有广泛的应用前景,可以用于创建更加真实和互动的视频内容。


与快手的 LivePortrait 不同, EchoMimic不仅能通过参考表情生成视频,还能够通过音频匹配对应口型,还支持将两者混用,即通过音频控制口型,通过 landmarks 来控制姿势和表情。


EchoMimic - 一张照片生成说话视频,可用于AI数字人生成,阿里最新开源 本地一键整合包下载 ... ... ... .. ...

EchoMimic - 一张照片生成说话视频,可用于AI数字人生成,阿里最新开源 本地一键整合包下载 ... ... ... .. ...


想象一下,你的声音和面部动作,能被完美复制到视频中,就像照镜子一样自然。

以往,我们生成视频动画要么依赖音频信号,要么依赖面部标志点,但这两种方法都有各自的局限性。音频驱动的方法容易不稳定,而面部关键点驱动的又缺乏自然感。EchoMimic横空出世,一举解决了这两个问题。它能够结合音频和面部标志点,让生成的视频既稳定又自然。



EchoMimic的稳定性和自然度是它的两大杀手锏。通过融合音频和面部标志点的特征,它生成的面部动画更加符合真实的面部运动和表情变化。无论是微小的嘴角上扬,还是眼神的微妙流转,EchoMimic都能精准捕捉,让动画效果如真人般逼真。

面部标志点,听起来很高大上,其实它们就是面部图像上的一些特定点,用来表示面部的关键特征和结构。这些点通常位于眼睛、鼻子、嘴巴等关键部位,帮助计算机视觉算法更好地理解和分析面部表情和动作。




EchoMimic的功能强大到令人惊叹。它可以单独使用音频或面部标志点生成肖像视频,也可以将两者结合,创造出更加逼真的动画。更厉害的是,它还支持多语言和多风格,无论是普通话、英语还是歌唱,EchoMimic都能轻松应对。

EchoMimic的应用前景无限广阔。无论是面部识别、表情识别,还是面部动画、增强现实,甚至是医学成像,EchoMimic都能大展身手。它的出现,无疑将为这些领域带来革命性的变革。


总而言之,EchoMimic这项技术不仅仅是一项创新,它更是一次对传统视频生成技术的颠覆。随着技术的不断进步和完善,我们有理由相信,未来EchoMimic将在更多领域大放异彩,为我们带来更加丰富和逼真的视觉体验。


项目地址:https://github.com/BadToBest/EchoMimic

注:只支持N卡,建议显存8-10G起使用

如遇报错,请跟帖贴出报错信息,看到会回复。


使用教程:

1、下载一键包,解压出来,双击“一键启动”等待自动跳转到WebUI界面

2、上传一张用于生成视频的“参考图” (参考图最好是清晰的正脸大头照,人脸太小可能检测不到)和驱动图片说话的“驱动音频”,如下图

2.jpg

3、高级参数可以默认,也可以自由调节,比如生成视频的宽度、高度,以及视频帧率、步数等参数,如下图

3.jpg

4、所有参数设置完成后,点击下方的“Submit”提交即可。

5、等待生成完成后,在“生成的视频”可以预览生成后的效果,也可以点击下方的“Flag”按钮,将生成的视频和参数保存到本地,保存路径为软件目录下的“flagged”目录。


这个生成速度比较慢,但是效果还是很棒的,感觉这个项目很有前景。测试一段10秒左右的视频生成512x512大概用时10分钟左右,显卡不好的,可以调低参数,比如视频帧率,步数、宽度和高度等。希望后期的版本能对此做优化。


下载地址:(下载前,请先阅读 使用说明 再下载,避免不必要的问题和纠纷)

游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源立即购买

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

11

回帖

59

积分

无名之辈

积分
59
发表于 2024-7-12 05:41:55 | 显示全部楼层
果断前排支持~就让我小小滴期待一下

该用户从未签到

0

主题

3

回帖

12

积分

初入江湖

积分
12
发表于 2024-7-15 14:25:21 | 显示全部楼层
让我小小滴期待一下

该用户从未签到

0

主题

5

回帖

13

积分

初入江湖

积分
13
发表于 2024-7-15 21:16:30 | 显示全部楼层
前排支持~

该用户从未签到

0

主题

1

回帖

8

积分

初入江湖

积分
8
发表于 2024-7-16 21:37:41 | 显示全部楼层
哎又要碎银

该用户从未签到

0

主题

12

回帖

28

积分

初入江湖

积分
28
发表于 2024-7-17 08:17:26 来自手机 | 显示全部楼层
最近正在学习数字人,新技术眼花缭乱啊。
有没有comfy ui的版本?

该用户从未签到

0

主题

5

回帖

14

积分

初入江湖

积分
14
发表于 2024-7-17 12:00:56 | 显示全部楼层
好多东西

该用户从未签到

0

主题

1

回帖

41

积分

座上宾

积分
41
发表于 2024-7-25 18:14:26 | 显示全部楼层
按任意键继续,一按就什么也没有了

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2024-7-25 18:51:50 来自手机 | 显示全部楼层
spc3922110 发表于 2024-7-25 18:14
按任意键继续,一按就什么也没有了

先看看显卡是否符合要求,检查下存放路径不要有中文,都没问题。,就把
黑色窗口信息贴出来

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

17

回帖

34

积分

初入江湖

积分
34
发表于 2024-7-27 21:40:19 | 显示全部楼层
支持你,功德无量。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-19 08:04 , Processed in 0.096915 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表