InfiniteTalk V3版 - 一键生成自然对口型数字人视频图片说话/图片唱歌支持50系显卡 ComfyUI+WebUI 一键整合包下载 - AI数字人 - 前沿AI软件资源站

无言以对 发表于 2026-2-2 23:13:18

InfiniteTalk V3版 - 一键生成自然对口型数字人视频图片说话/图片唱歌支持50系显卡 ComfyUI+WebUI 一键整合包下载

InfiniteTalk 是一个由 MeiGen-AI 开发的开源项目，它能把音频驱动的图像或视频转换成“会说话”的视频，支持无限时长生成，并且不仅仅是嘴型同步，还能让头部、身体和表情与声音自然匹配。它的特点是高精度的口型对齐、稳定的动作表现，以及从单张图片生成动态视频的能力，非常适合需要虚拟人或视频配音的场景。

今天分享的 InfiniteTalk V3版基于最新的发布的InfiniteTalk 模型打包制作，目前支持单人图像加音频驱动生成，新版模型比上个版本的无论是生成速度，还是生成质量，都有较大提升。包含适合新手小白使用的WebUI和专业选手扩展的ComfyUI两种模式。
包含两个版本，UC网盘只支持单次生成；夸克和百度网盘支持单次和批量生成，支持自动自动对齐视频帧数，即无需手动设置帧数，根据上传视频长度自动对齐。

主要特点

真正无限长
很多工具一到5–10分钟就开始脸崩、动作怪、身份跑偏，它号称可以做几十分钟甚至几小时，质量下降很慢。

不只是嘴动，全身都在“演”
普通工具大多只管嘴巴，这个连脖子转动、肩膀微耸、身体轻微摇晃、手势小动作都会跟着音频情绪走，感觉更像真人在表演。

身份保持很稳
长时间说下来，脸不会慢慢变成另一个人，背景、衣服、发型也比较稳（传统方法越长越容易“鬼畜”）。

唇形同步做得比较准
目前唇形同步最好的一款AI模型

应用场景

虚拟主播、AI数字人直播（长时间不卡顿）
短视频/抖音/小红书配音（用AI头像讲故事）
外语教学视频（老师照片+外语音频自动生成口型）
影视后期批量配音（尤其是需要情绪的旁白、纪录片解说）
做音乐MV幕后、vlog、播客可视化
企业培训、产品讲解视频（老板/讲师只录音频就行）
给不会露脸的创作者做“出镜”内容

使用教程：（建议N卡，显存12G起，运存32G起，支持50系显卡）

整合包包含所需所有节点，下载主程序和模型（ComfyUI文件夹即为模型），解压主程序一键包，将ComfyUI文件夹移动到主程序目录下即可。

WebUI模式
双击启动WebUI，进入页面后，上传需要生成的人物图像和音频文件，设置相关参数，生成即可。WebUI最大支持15秒视频生成。

ComfyUI模式
双击启动ComfyUI，进入页面后，点击左侧的工作流，选择对应的工作流，上传需要生成的人物图片和音频文件，设置相关参数，运行即可。ComfyUI模式，建议专业人士使用，小白可以使用下面的WebUI模式。
ComfyUI理论上支持无限时长生成，需要自行按照页面说明扩展节点。

软件目录结构：

📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │    └── Wan2_1-I2V-14B-480p_fp8_e4m3fn_scaled_KJ.safetensors
│ ├── 📂 model_patches/
│ │    └── wan2.1_infiniteTalk_single_fp16.safetensors
│ └── 📂 vae/
│       └── Wan2_1_VAE_bf16.safetensors
📂 deepface/
......

下载地址：
UC网盘：https://drive.uc.cn/s/3c729b8604424

夸克网盘：
**** 本内容需购买 ****

百度网盘：
**** 本内容需购买 ****

xu87032040 发表于 2026-2-3 11:38:12

蹲蹲蹲蹲

xu87032040 发表于 2026-2-3 18:28:47

本帖最后由 xu87032040 于 2026-2-3 18:32 编辑

我试了下，很好用

xu87032040 发表于 2026-2-3 18:38:30

ComfyUI模式在哪启动啊

无言以对 发表于 2026-2-4 10:25:36

xu87032040 发表于 2026-2-3 18:38
ComfyUI模式在哪启动啊

命令行窗口有说明，复制8188那个端口的地址就是

dtdhjunge 发表于 2026-2-5 09:56:00

本帖最后由 dtdhjunge 于 2026-2-5 09:57 编辑

用这个整合包生成视频时间太长了，生成到%73用时1050秒，什么原因如何解决请版主指教。

无言以对 发表于 2026-2-5 10:03:10

dtdhjunge 发表于 2026-2-5 09:56
用这个整合包生成视频时间太长了，生成到%73用时1050秒，什么原因如何解决请版主指教。 ...

你看看控制台是不是报错了。
如果没有报错，可能就是你的显卡不行

大力点 发表于 2026-2-7 03:23:19

比KJ好很多

来日方长 发表于 2026-2-8 21:43:38

口型很自然，比KJ版更快

stgg2019 发表于 2026-2-11 09:08:20

怎么生成的视频时间更长一些，怎么生成的全是7秒的。:handshake

页: [1] 2 3

前沿AI软件资源站's Archiver

InfiniteTalk V3版 - 一键生成自然对口型数字人视频 图片说话/图片唱歌 支持50系显卡 ComfyUI+WebUI 一键整合包下载

InfiniteTalk V3版 - 一键生成自然对口型数字人视频图片说话/图片唱歌支持50系显卡 ComfyUI+WebUI 一键整合包下载