无言以对 发表于 2026-2-2 23:13:18

InfiniteTalk V3版 - 一键生成自然对口型数字人视频 图片说话/图片唱歌 支持50系显卡 ComfyUI+WebUI 一键整合包下载


InfiniteTalk 是一个由 MeiGen-AI 开发的开源项目,它能把音频驱动的图像或视频转换成“会说话”的视频,支持无限时长生成,并且不仅仅是嘴型同步,还能让头部、身体和表情与声音自然匹配。它的特点是高精度的口型对齐、稳定的动作表现,以及从单张图片生成动态视频的能力,非常适合需要虚拟人或视频配音的场景。

今天分享的 InfiniteTalk V3版基于最新的发布的InfiniteTalk 模型打包制作,目前支持单人图像加音频驱动生成,新版模型比上个版本的无论是生成速度,还是生成质量,都有较大提升。包含适合新手小白使用的WebUI和专业选手扩展的ComfyUI两种模式。
包含两个版本,UC网盘只支持单次生成;夸克和百度网盘支持单次和批量生成,支持自动自动对齐视频帧数,即无需手动设置帧数,根据上传视频长度自动对齐。






主要特点

真正无限长
很多工具一到5–10分钟就开始脸崩、动作怪、身份跑偏,它号称可以做几十分钟甚至几小时,质量下降很慢。

不只是嘴动,全身都在“演”
普通工具大多只管嘴巴,这个连脖子转动、肩膀微耸、身体轻微摇晃、手势小动作都会跟着音频情绪走,感觉更像真人在表演。

身份保持很稳
长时间说下来,脸不会慢慢变成另一个人,背景、衣服、发型也比较稳(传统方法越长越容易“鬼畜”)。

唇形同步做得比较准
目前唇形同步最好的一款AI模型




应用场景

虚拟主播、AI数字人直播(长时间不卡顿)
短视频/抖音/小红书配音(用AI头像讲故事)
外语教学视频(老师照片+外语音频自动生成口型)
影视后期批量配音(尤其是需要情绪的旁白、纪录片解说)
做音乐MV幕后、vlog、播客可视化
企业培训、产品讲解视频(老板/讲师只录音频就行)
给不会露脸的创作者做“出镜”内容



使用教程:(建议N卡,显存12G起,运存32G起,支持50系显卡)

整合包包含所需所有节点,下载主程序和模型(ComfyUI文件夹即为模型),解压主程序一键包,将ComfyUI文件夹移动到主程序目录下即可。

WebUI模式
双击启动WebUI,进入页面后,上传需要生成的人物图像和音频文件,设置相关参数,生成即可。WebUI最大支持15秒视频生成。

ComfyUI模式
双击启动ComfyUI,进入页面后,点击左侧的 工作流,选择对应的工作流,上传需要生成的人物图片和音频文件,设置相关参数,运行即可。ComfyUI模式,建议专业人士使用,小白可以使用下面的WebUI模式。
ComfyUI理论上支持无限时长生成,需要自行按照页面说明扩展节点。


软件目录结构:

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │      └── Wan2_1-I2V-14B-480p_fp8_e4m3fn_scaled_KJ.safetensors
│   ├── 📂 model_patches/
│   │      └── wan2.1_infiniteTalk_single_fp16.safetensors
│   └── 📂 vae/
│          └── Wan2_1_VAE_bf16.safetensors
📂 deepface/
......




下载地址:
UC网盘:https://drive.uc.cn/s/3c729b8604424

夸克网盘:
**** 本内容需购买 ****

百度网盘:
**** 本内容需购买 ****

xu87032040 发表于 2026-2-3 11:38:12

蹲蹲蹲蹲

xu87032040 发表于 2026-2-3 18:28:47

本帖最后由 xu87032040 于 2026-2-3 18:32 编辑

我试了下,很好用

xu87032040 发表于 2026-2-3 18:38:30

ComfyUI模式在哪启动啊

无言以对 发表于 2026-2-4 10:25:36

xu87032040 发表于 2026-2-3 18:38
ComfyUI模式在哪启动啊

命令行窗口有说明,复制8188那个端口的地址就是

dtdhjunge 发表于 2026-2-5 09:56:00

本帖最后由 dtdhjunge 于 2026-2-5 09:57 编辑

用这个整合包生成视频时间太长了,生成到%73用时1050秒,什么原因如何解决请版主指教。

无言以对 发表于 2026-2-5 10:03:10

dtdhjunge 发表于 2026-2-5 09:56
用这个整合包生成视频时间太长了,生成到%73用时1050秒,什么原因如何解决请版主指教。 ...

你看看控制台是不是报错了。
如果没有报错,可能就是你的显卡不行

大力点 发表于 2026-2-7 03:23:19

比KJ好很多

来日方长 发表于 2026-2-8 21:43:38

口型很自然,比KJ版更快

stgg2019 发表于 2026-2-11 09:08:20

怎么生成的视频时间更长一些,怎么生成的全是7秒的。:handshake
页: [1] 2
查看完整版本: InfiniteTalk V3版 - 一键生成自然对口型数字人视频 图片说话/图片唱歌 支持50系显卡 ComfyUI+WebUI 一键整合包下载