EchoMimic V2 - 一张照片一段音频生成半身数字人说话视频支持手势动作本地一键整合包下载 - AI数字人 - 前沿AI软件资源站

无言以对 发表于 2024-11-22 23:20:19

EchoMimic V2 - 一张照片一段音频生成半身数字人说话视频支持手势动作本地一键整合包下载

EchoMimic是蚂蚁集团推出的一个AI驱动的口型同步技术项目。这项技术能够通过给定的音频和一张或多张人物的面部照片，生成一个看起来像是在说话的视频，其中的人物口型动作与音频中的语音完美匹配。这种技术在娱乐、教育、虚拟现实、在线会议等领域有广泛的应用前景，可以用于创建更加真实和互动的视频内容。

与快手的 LivePortrait 不同, EchoMimic不仅能通过参考表情生成视频，还能够通过音频匹配对应口型，还支持将两者混用，即通过音频控制口型，通过 landmarks 来控制姿势和表情。

今天分享的 EchoMimic V2 版最大的更新是由原来的“数字人脸”升级为 "半身数字人"，即现在只需要一张照片，一段音频和一段手势动作，就可以生成上半身数字人形象了。
EchoMimic V2 使用了全新算法和模型，提升了显存利用，相比之前的V1版，显存利用大幅度降低，且生成效果大幅度提升。

使用教程：（只支持N卡，建议显存12G起，8G也可以玩，需开启内存回退策略）
上传半身参考图，一段驱动音频，生成即可。
参数可以参考右边的建议值，也可以根据需要自行调整。

下载地址：（下载前，请先阅读使用说明再下载，避免不必要的问题和纠纷）
夸克网盘：https://pan.quark.cn/s/1af2b762a7ed
百度网盘：
**** 本内容需购买 ****

ffgyooo 发表于 2024-11-23 01:47:08

这是个好东西，需要多少G

dbshark 发表于 2024-11-23 03:09:41

加油大佬，只有你有百度网盘:$

wxwk168 发表于 2024-11-23 18:27:14

速度快吗？

haidai 发表于 2024-11-24 17:53:53

夸克下载不了没有会员 :'(

mcc123456 发表于 2024-11-27 20:49:36

免费且有盘:handshake

williamr 发表于 2024-12-5 13:44:25

真好楼主真的太厉害了，能够讲这些软件都制作出来

a957846476 发表于 2024-12-9 10:12:37

加油大佬，我没夸克会员

Archer 发表于 2024-12-13 01:51:42

老师我想请教下这个问题怎么处理呀，感恩！

无言以对 发表于 2024-12-13 09:00:18

Archer 发表于 2024-12-13 01:51
老师我想请教下这个问题怎么处理呀，感恩！

不影响使用

页: [1] 2

前沿AI软件资源站's Archiver

EchoMimic V2 - 一张照片一段音频生成半身数字人说话视频 支持手势动作 本地一键整合包下载

EchoMimic V2 - 一张照片一段音频生成半身数字人说话视频支持手势动作本地一键整合包下载