Heygem V4版 - 零成本本地AI数字人制作软件数字人口播视频制作支持50系显卡一键整合包下载 - AI数字人 - 前沿AI软件资源站

无言以对 发表于 2026-4-28 12:14:39

Heygem V4版 - 零成本本地AI数字人制作软件数字人口播视频制作支持50系显卡一键整合包下载

Heygem 是一个开源的数字人生成项目。简单来说，它能让你用自己的视频“克隆”出一个高度逼真的AI数字人，然后用文字或语音驱动它说话、生成视频，整个过程可以完全在本地电脑上离线运行，不用联网，也不用担心隐私泄露。

以前要做一个能说话的“数字人”（比如虚拟主播、虚拟老师），往往要花几十万甚至上百万请专业团队。现在用Heygem，只需要提供一段真人视频（据说几秒到十几秒就够），它就能学会你的长相（脸型、五官、表情）和声音，之后输入文字，它就能自动生成你“本人”在说话的视频，口型同步、自然流畅，成本直接降到几千块甚至接近零成本（主要就是你的电脑硬件）。

Heygem 是目前最容易上手、真正本地离线、成本极低的开源数字人工具，把以前只有大公司才能玩的“AI虚拟人”技术，平民化到了普通有好一点显卡的电脑就能用的程度。适合想自己玩数字人、做内容或降低视频制作成本的个人和中小企业。

今天分享的 Heygem V4版在上个版本的基础上做了部分功能新增和优化：新增角色管理功能，可以手动自定义创建角色，方便下次直接加载使用；新增“超分”开关选项，上个版本默认开启，有人反馈超分开启导致人物失真，这个版本独立出来供大家自由开启；新增多人驱动模式，多人视频模式下，可指定人物对口型，自由控制参考视频说话人；新增处理模式选项，方便不同硬件配置用户选择。

主要特点

高度克隆：外貌和声音都克隆得很像，能捕捉细微的表情和声调。
文字/语音驱动：你打字它就说话，你录一段语音它也能跟着模仿动作和口型。
多语言支持：一次性支持中文、英文、日语、韩语、法语、德语、阿拉伯语、西班牙语等8种语言，口型都能对得上。
完全离线：所有处理都在你自己电脑上跑，数据不上传云端，隐私安全。
高质量输出：生成的视频唇同步自然，适合制作较长的说话视频。

应用领域

内容创作：快速批量生成讲解视频、短视频、YouTube/TikTok内容，省掉真人出镜的麻烦。
教育培训：做虚拟老师、在线课程、公司内部培训视频（一个数字人可以讲多语言课程）。
营销客服：品牌宣传片、产品介绍、自动化客服视频。
专业领域：法律、医疗、财经等需要标准话术但又想显得亲切的场景（虚拟顾问）。
个人用途：数字永生（留存自己或亲人的形象和声音）、个人虚拟分身、趣味视频制作等。

使用教程：（建议N卡，显存4G起，支持50系显卡）

支持单次和批量生成两种模式
上传驱动音频和参考视频，生成即可。
批量模式按照顺序对应上传需要生成的驱动音频和参考视频，生成即可。
生成的结果保存在 results 目录下

支持参考视频中指定人物对口型，输入驱动人脸序号
驱动人脸序号(0=最左侧脸,1=次左侧脸,-1=所有脸)，默认从左到右，从上到下。

两种处理模式：顺序模式和Ping-Pong模式
顺序模式：内存受限用户选择，长视频（>10秒），推荐顺序模式，避免内存溢出
Ping-Pong模式：内存充足用户选择，短视频（<10秒），推荐Ping-Pong模式，性能更好

下载地址：
夸克网盘：
**** 本内容需购买 ****

百度网盘：

**** 本内容需购买 ****

minggouwa 发表于 2026-4-30 09:41:29

大佬，功能写错了吧，保存角色应该是保存视频形象，现在保存的是音频文件，音频文件按理说是每次克隆的时候自己上传的，现在选择角色加载出来的是音频没加载出来视频

无言以对 发表于 2026-4-30 09:53:49

minggouwa 发表于 2026-4-30 09:41
大佬，功能写错了吧，保存角色应该是保存视频形象，现在保存的是音频文件，音频文件按理说是每次克隆的时候 ...

下个版本加，估计得过段时间了，最近手上项目较多，短期内不会重复更新
很多做短视频矩阵的，都是一个产品介绍，用不同的形象，所以没有什么对错，只是个人需求不同

minggouwa 发表于 2026-4-30 09:57:01

无言以对发表于 2026-4-30 09:53
下个版本加，估计得过段时间了，最近手上项目较多，短期内不会重复更新
很多做短视频矩阵的，都是一个产 ...

奥奥，明白

爱上你 发表于 2026-5-9 15:59:38

大佬，我想咨询下，我使用heygem做实时对口型功能，音频特征提取和推理容易报错如下；第二个问题：我又启动了indextts2进行语音生成，当语音生成时，推理的速度骤降，这个是显卡性能有问题吗？我是4060TI显卡。
ffmpeg-info: encoder : Lavc60.16.100 rawvideo
E:\AI\heygem-win-50\wenet\compute_ctc_att_bnf.py:116: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
with autocast(enabled=(fp16 and device == 'cuda')):
Exception in thread Thread-13 (_script_loop):
Traceback (most recent call last):
File "E:\AI\heygem-win-50\env\Lib\threading.py", line 1016, in _bootstrap_inner
self.run()
File "E:\AI\heygem-win-50\env\Lib\threading.py", line 953, in run
self._target(*self._args, **self._kwargs)
File "E:\AI\heygem-win-50\service\live_manager.py", line 257, in _script_loop
self.video_streamer.add_audio_to_queue(script)
File "E:\AI\heygem-win-50\service\trans_dh_service.py", line 268, in add_audio_to_queue
audio_wenet_feature = get_aud_feat1(wav_fragment=audio_path, fps=fps, wenet_model=self.wenet_model)
File "E:\AI\heygem-win-50\service\trans_dh_service.py", line 88, in get_aud_feat1
return feature_extraction_wenet(wav_fragment, fps, wenet_model)
File "E:\AI\heygem-win-50\service\trans_dh_service.py", line 51, in feature_extraction_wenet
f_wenet_all = get_weget(audio_file, wenet_model, section)# shape (T, D)
File "E:\AI\heygem-win-50\wenet\compute_ctc_att_bnf.py", line 172, in get_weget
return _compute_internal(wav_arr, wenet_model_and_configs, section, fp16)
File "E:\AI\heygem-win-50\wenet\compute_ctc_att_bnf.py", line 142, in _compute_internal
bnf = ppg_model(wav_tensor, wav_length)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\module.py", line 1739, in _wrapped_call_impl
return self._call_impl(*args, **kwargs)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\module.py", line 1750, in _call_impl
return forward_call(*args, **kwargs)
File "E:\AI\heygem-win-50\wenet\compute_ctc_att_bnf.py", line 57, in forward
encoder_out, _ = self.encoder(feats, feats_lengths)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\module.py", line 1739, in _wrapped_call_impl
return self._call_impl(*args, **kwargs)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\module.py", line 1750, in _call_impl
return forward_call(*args, **kwargs)
File "E:\AI\heygem-win-50\wenet\transformer\encoder.py", line 118, in forward
(xs, pos_emb, masks) = self.embed(xs, masks)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\module.py", line 1739, in _wrapped_call_impl
return self._call_impl(*args, **kwargs)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\module.py", line 1750, in _call_impl
return forward_call(*args, **kwargs)
File "E:\work\heygem-win-50\wenet\transformer\subsampling.py", line 118, in forward
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\module.py", line 1739, in _wrapped_call_impl
return self._call_impl(*args, **kwargs)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\module.py", line 1750, in _call_impl
return forward_call(*args, **kwargs)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\container.py", line 250, in forward
input = module(input)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\module.py", line 1739, in _wrapped_call_impl
return self._call_impl(*args, **kwargs)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\module.py", line 1750, in _call_impl
return forward_call(*args, **kwargs)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\conv.py", line 554, in forward
return self._conv_forward(input, self.weight, self.bias)
File "E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\modules\conv.py", line 549, in _conv_forward
return F.conv2d(
RuntimeError: CUDA error: operation not permitted when stream is capturing
CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1
Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.

E:\work\heygem-win-50\landmark2face_wy\digitalhuman_interface.py:295: UserWarning: Creating a tensor from a list of numpy.ndarrays is extremely slow. Please consider converting the list to a single numpy.ndarray with numpy.array() before converting to a tensor. (Triggered internally at C:\actions-runner\_work\pytorch\pytorch\pytorch\torch\csrc\utils\tensor_new.cpp:257.)
E:\AI\heygem-win-50\env\Lib\site-packages\torch\nn\functional.py:5015: UserWarning: Default grid_sample and affine_grid behavior has changed to align_corners=False since 1.3.0. Please specify align_corners=True if the old behavior is desired. See the documentation of grid_sample for details.
warnings.warn(
显示帧率: 1 fps

qstqstqst 发表于 2026-6-3 23:06:57

在互联网电脑上可以运行，但是在本地电脑上离线无法运行，黑色命令行窗口报错退出，是什么原因？是需要改什么配置吗？

无言以对 发表于 2026-6-4 08:12:54

qstqstqst 发表于 2026-6-3 23:06
在互联网电脑上可以运行，但是在本地电脑上离线无法运行，黑色命令行窗口报错退出，是什么原因？是需要改什 ...

报错代码贴出来，正常是不需要联网的

CBZ109 发表于 2026-7-4 22:52:34

软件真不错，但这个硬件要求确实有点高哦

nursoft 发表于 2026-7-8 00:51:05

这次是否模型也优化？

Jason007 发表于 2026-7-8 22:47:28

亲，这个版本是py源码吗？能否修改？

页: [1] 2

前沿AI软件资源站's Archiver

Heygem V4版 - 零成本本地AI数字人制作软件 数字人口播视频制作 支持50系显卡 一键整合包下载

Heygem V4版 - 零成本本地AI数字人制作软件数字人口播视频制作支持50系显卡一键整合包下载