无言以对 发表于 2025-1-24 17:11:16

LipSick - 快速、高质量、低资源的AI数字人生成工具,音频驱动视频生成数字人 本地一键整合包下载


LipSick 是一个快速、高质量、低资源的唇形生成工具,只需要上传一段驱动音频和一段视频,即可生成任意AI数字人说话视频。该项目具备体积小巧,资源占用低,生成质量高等特点,多种参考可控,可选多种面部追踪器,可自定义参考帧作为推理对象,提升生成效果。

使用教程:(建议N卡,显存8G起)
上传一段参考视频和一段驱动音频
展开高级参数设置
启动自动蒙版,面部追踪器可多次尝试,选择效果最好的一个
勾选“激活自定义参考帧”,按照页面文字说明,填写帧序号,然后点击生成参考帧
选择一帧或多帧作为参考帧
如果生成结果下巴抖动,可手动设置裁切半径,这个选项是可选的。
最后生成。
如果视频分辨率太高,生成嘴巴部分模糊,可以用超分软件,比如站内的几款增强软件超分增强下。


下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOHMp9IZue_B4WS5UAvmCkwDA1?pwd=iwxp
夸克网盘:**** 本内容需购买 ****
百度网盘:**** 本内容需购买 ****

解压密码:https://deepface.cc/

[email protected] 发表于 2025-1-24 20:21:15

太需要了,谢谢分享

[email protected] 发表于 2025-1-24 20:23:18

太需要了,谢谢分享

kk7144931 发表于 2025-1-25 00:21:33

太需要了,谢谢分享

nsctt 发表于 2025-1-25 10:16:55

这个下载试下效果,希望效果能好点,谢谢分享

leon5hongxuan 发表于 2025-3-12 02:54:15

要不是嘴部模糊,这玩意效率上绝对吊打ls,mus,mic
页: [1]
查看完整版本: LipSick - 快速、高质量、低资源的AI数字人生成工具,音频驱动视频生成数字人 本地一键整合包下载