EchoMimic V2 - 一张照片一段音频生成半身数字人说话视频 支持手势动作 本地一键整合包下载
EchoMimic是蚂蚁集团推出的一个AI驱动的口型同步技术项目。这项技术能够通过给定的音频和一张或多张人物的面部照片,生成一个看起来像是在说话的视频,其中的人物口型动作与音频中的语音完美匹配。这种技术在娱乐、教育、虚拟现实、在线会议等领域有广泛的应用前景,可以用于创建更加真实和互动的视频内容。
与快手的 LivePortrait 不同, EchoMimic不仅能通过参考表情生成视频,还能够通过音频匹配对应口型,还支持将两者混用,即通过音频控制口型,通过 landmarks 来控制姿势和表情。
今天分享的 EchoMimic V2 版最大的更新是由原来的“数字人脸”升级为 "半身数字人",即现在只需要一张照片,一段音频和一段手势动作,就可以生成上半身数字人形象了。
EchoMimic V2 使用了全新算法和模型,提升了显存利用,相比之前的V1版,显存利用大幅度降低,且生成效果大幅度提升。
使用教程:(只支持N卡,建议显存12G起,8G也可以玩,需开启内存回退策略)
上传半身参考图,一段驱动音频,生成即可。
参数可以参考右边的建议值,也可以根据需要自行调整。
下载地址:(下载前,请先阅读 使用说明 再下载,避免不必要的问题和纠纷)
夸克网盘:https://pan.quark.cn/s/1af2b762a7ed
百度网盘:
**** 本内容需购买 ****
这是个好东西,需要多少G 加油大佬,只有你有百度网盘:$ 速度快吗? 夸克下载不了 没有会员 :'( 免费且有盘:handshake 真好 楼主真的太厉害了,能够讲这些软件都制作出来 加油大佬,我没夸克会员 老师我想请教下这个问题怎么处理呀,感恩! Archer 发表于 2024-12-13 01:51
老师我想请教下这个问题怎么处理呀,感恩!
不影响使用
页:
[1]
2