马上注册,下载更多AI资源软件
您需要 登录 才可以下载或查看,没有账号?立即注册
×
InfiniteTalk V3版 - 一键生成自然对口型数字人 图片说话/图片唱歌 支持50系显卡 ComfyUI+WebUI 一键整合包 ...
InfiniteTalk 是一个由 MeiGen-AI 开发的开源项目,它能把音频驱动的图像或视频转换成“会说话”的视频,支持无限时长生成,并且不仅仅是嘴型同步,还能让头部、身体和表情与声音自然匹配。它的特点是高精度的口型对齐、稳定的动作表现,以及从单张图片生成动态视频的能力,非常适合需要虚拟人或视频配音的场景。
今天分享的 InfiniteTalk V3版基于最新的发布的InfiniteTalk 模型打包制作,目前支持单人图像加音频驱动生成,新版模型比上个版本的无论是生成速度,还是生成质量,都有较大提升。包含适合新手小白使用的WebUI和专业选手扩展的ComfyUI两种模式。
包含两个版本,UC网盘只支持单次生成;夸克和百度网盘支持单次和批量生成,支持自动自动对齐视频帧数,即无需手动设置帧数,根据上传视频长度自动对齐。
InfiniteTalk V3版 - 一键生成自然对口型数字人视频 图片说话/图片唱歌 支持50系显卡 ComfyUI+WebUI 一键整 ...
主要特点
真正无限长
很多工具一到5–10分钟就开始脸崩、动作怪、身份跑偏,它号称可以做几十分钟甚至几小时,质量下降很慢。
不只是嘴动,全身都在“演”
普通工具大多只管嘴巴,这个连脖子转动、肩膀微耸、身体轻微摇晃、手势小动作都会跟着音频情绪走,感觉更像真人在表演。
身份保持很稳
长时间说下来,脸不会慢慢变成另一个人,背景、衣服、发型也比较稳(传统方法越长越容易“鬼畜”)。
唇形同步做得比较准
目前唇形同步最好的一款AI模型
应用场景
虚拟主播、AI数字人直播(长时间不卡顿)
短视频/抖音/小红书配音(用AI头像讲故事)
外语教学视频(老师照片+外语音频自动生成口型)
影视后期批量配音(尤其是需要情绪的旁白、纪录片解说)
做音乐MV幕后、vlog、播客可视化
企业培训、产品讲解视频(老板/讲师只录音频就行)
给不会露脸的创作者做“出镜”内容
使用教程:(建议N卡,显存12G起,运存32G起,支持50系显卡)
整合包包含所需所有节点,下载主程序和模型(ComfyUI文件夹即为模型),解压主程序一键包,将ComfyUI文件夹移动到主程序目录下即可。
WebUI模式
双击启动WebUI,进入页面后,上传需要生成的人物图像和音频文件,设置相关参数,生成即可。WebUI最大支持15秒视频生成。
ComfyUI模式
双击启动ComfyUI,进入页面后,点击左侧的 工作流,选择对应的工作流,上传需要生成的人物图片和音频文件,设置相关参数,运行即可。ComfyUI模式,建议专业人士使用,小白可以使用下面的WebUI模式。
ComfyUI理论上支持无限时长生成,需要自行按照页面说明扩展节点。
软件目录结构:
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── Wan2_1-I2V-14B-480p_fp8_e4m3fn_scaled_KJ.safetensors
│ ├── 📂 model_patches/
│ │ └── wan2.1_infiniteTalk_single_fp16.safetensors
│ └── 📂 vae/
│ └── Wan2_1_VAE_bf16.safetensors
📂 deepface/
......
下载地址:
UC网盘:https://drive.uc.cn/s/3c729b8604424
夸克网盘:
游客, 上上宾会员可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源 立即购买
百度网盘:
游客, 上上宾会员可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源 立即购买
|