设为首页收藏本站 劰载中...

 找回密码
 立即注册
楼主: 无言***

InfiniteTalk V2版 - 声音驱动图片生成高度逼真的说话/唱歌视频 支持50系显卡 ComfyUI+WebUI 一键整合包下载

[复制链接]

834

主题

1359

回帖

8万

积分

武林盟主

积分
80771

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-11-28 11:47:13 | 显示全部楼层
DFC 发表于 2025-11-27 00:42
出错了:

loaded completely 16277.1994140625 1208.09814453125 True

webui模式?你是不是模型选错了?

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

12

主题

120

回帖

2068

积分

超级版主

积分
2068

突出贡献

发表于 2025-11-28 12:21:56 | 显示全部楼层
2523797596 发表于 2025-11-28 11:24
CUDA Compute Capability: 8.6
Detected model in_channels: 36
Model cross attention type: i2v, num_hea ...

我猜你把wan大模型和InfiniteTalk 模型选错了
你用默认的试试

12

主题

120

回帖

2068

积分

超级版主

积分
2068

突出贡献

发表于 2025-11-28 12:24:09 | 显示全部楼层
DFC 发表于 2025-11-27 00:42
出错了:

loaded completely 16277.1994140625 1208.09814453125 True

参数不要改,默认的试试,你和楼下的一样,应该是选错了模型
我刚还生成了几个,都没问题

ComfyUI found: E:\ComfyUI_InfiniteTalk_V2\ComfyUI
T5Encoder: 100%|███████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 51.40it/s]
T5Encoder: 100%|█████████████████████████████████████████████████████████████████████| 24/24 [00:00<00:00, 1354.48it/s]
CUDA Compute Capability: 12.0
Detected model in_channels: 36
Model cross attention type: i2v, num_heads: 40, num_layers: 40
Model variant detected: i2v_480
InfiniteTalk detected, patching model...
model_type FLOW
Loading LoRA: Wan21_I2V_14B_lightx2v_cfg_step_distill_lora_rank64 with strength: 1
Requested to load CLIPVisionModelProjection
loaded completely 12107.0744140625 1208.09814453125 True
Clip embeds shape: torch.Size([1, 257, 1280]), dtype: torch.float32
Combined clip embeds shape: torch.Size([1, 257, 1280])
The local file (ComfyUI\models\torch\hub\torchaudio\models\hdemucs_high_trained.pt) exists. Skipping the download.
[MultiTalk] --- Raw speaker lengths (samples) ---
  speaker 1: 192000 samples (shape: torch.Size([1, 1, 192000]))
[MultiTalk] total raw duration = 12.000s
[MultiTalk] multi_audio_type=para | final waveform shape=torch.Size([1, 1, 192000]) | length=192000 samples | seconds=12.000s (expected max of raw)
Using GGUF to load and assign model weights to device...
Loading transformer parameters to cuda:0: 100%|█████████████████████████████████| 1633/1633 [00:00<00:00, 37113.91it/s]
------- Scheduler info -------
Total timesteps: tensor([999, 970, 916, 785], device='cuda:0')
Using timesteps: tensor([999, 970, 916, 785], device='cuda:0')
Using sigmas: tensor([1.0000, 0.9706, 0.9167, 0.7857, 0.0000])
------------------------------
sigmas: tensor([1.0000, 0.9706, 0.9167, 0.7857, 0.0000])
Multitalk audio features shapes (per speaker): [(300, 12, 768)]
Multitalk mode: infinitetalk
Sampling 300 frames in 8 windows, at 480x640 with 4 steps
Sampling audio indices 0-49: 100%|███████████████████████████████████████████████████████| 4/4 [00:54<00:00, 13.71s/it]
Sampling audio indices 42-91: 100%|██████████████████████████████████████████████████████| 4/4 [00:51<00:00, 12.95s/it]
Sampling audio indices 84-133: 100%|█████████████████████████████████████████████████████| 4/4 [00:51<00:00, 12.94s/it]
Sampling audio indices 126-175: 100%|████████████████████████████████████████████████████| 4/4 [00:51<00:00, 12.98s/it]
Sampling audio indices 168-217: 100%|████████████████████████████████████████████████████| 4/4 [00:51<00:00, 12.96s/it]
Sampling audio indices 210-259: 100%|████████████████████████████████████████████████████| 4/4 [00:57<00:00, 14.48s/it]
Audio embedding for subject 0 not long enough: 300, need 301, padding...
Padding length: 4
Sampling audio indices 252-301: 100%|████████████████████████████████████████████████████| 4/4 [00:51<00:00, 12.97s/it]
Allocated memory: memory=0.232 GB
Max allocated memory: max_memory=9.531 GB
Max reserved memory: max_reserved=12.090 GB
ComfyUI found: E:\ComfyUI_InfiniteTalk_V2\ComfyUI

0

主题

7

回帖

12

积分

初入江湖

积分
12
发表于 2025-11-28 22:45:06 | 显示全部楼层
无言以对 发表于 2025-11-28 11:47
webui模式?你是不是模型选错了?

用的webui模式,各个模型组合过了

0

主题

7

回帖

12

积分

初入江湖

积分
12
发表于 2025-11-28 22:47:14 | 显示全部楼层
来日方长 发表于 2025-11-28 12:24
参数不要改,默认的试试,你和楼下的一样,应该是选错了模型
我刚还生成了几个,都没问题

你用的默认组合?多大显存的?

834

主题

1359

回帖

8万

积分

武林盟主

积分
80771

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 7 天前 | 显示全部楼层
DFC 发表于 2025-11-28 22:45
用的webui模式,各个模型组合过了

wan和InfiniteTalk不是一回事,不要乱切换。wan只能用wan开头的模型,InfiniteTalk只能用InfiniteTalk开头的,你的问题就是模型乱切换导致的不匹配问题

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化及功能定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

0

主题

3

回帖

8

积分

初入江湖

积分
8
发表于 7 天前 | 显示全部楼层
无言以对 发表于 2025-11-28 11:47
webui模式?模型是不是选错了

webui模式没跳报错,但是一直卡在70那里

0

主题

3

回帖

8

积分

初入江湖

积分
8
发表于 7 天前 | 显示全部楼层
无言以对 发表于 2025-11-28 11:47
webui模式?模型是不是选错了

可以几个QQ或者微信请教一下吗,2523797596    /     q2523797596

0

主题

7

回帖

12

积分

初入江湖

积分
12
发表于 7 天前 | 显示全部楼层
无言以对 发表于 2025-11-29 09:56
wan和InfiniteTalk不是一回事,不要乱切换。wan只能用wan开头的模型,InfiniteTalk只能用InfiniteTalk开 ...

Sampling audio indices 0-49:   0%|                                                               | 0/4 [00:03<?, ?it/s]
ComfyUI found: Q:\UC-ND\ComfyUI_InfiniteTalk_V2——暂时删除了ComfyUI的model,29.3G\ComfyUI

前面的加载都正常,是不是内存不足?我的32G
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|前沿AI软件资源站

GMT+8, 2025-12-6 08:56 , Processed in 0.114987 second(s), 3 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表