找回密码
 立即注册
查看: 2143|回复: 10

Sonic - 腾讯浙大开源语音驱动图片生成唱歌/说话数字人模型 本地一键整合包下载

[复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

603

主题

722

回帖

4万

积分

武林盟主

积分
47957

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2025-1-17 11:48:43 | 显示全部楼层 |阅读模式

Sonic - 腾讯浙大开源语音驱动图片生成唱歌/说话数字人模型 本地一键整合包下载 ... ... ... ... ... ... ...

Sonic - 腾讯浙大开源语音驱动图片生成唱歌/说话数字人模型 本地一键整合包下载 ... ... ... ... ... ... ...


Sonic 是腾讯联合浙江大学共同开源的基于全局音频感知的肖像动画技术,支持提供一张图片和一段音频驱动图片生成说话/唱歌数字人视频。
Sonic 利用音频信息来控制面部表情和头部运动,从而生成自然流畅的动画视频。Sonic 的核心技术包括上下文增强音频学习、运动解耦控制器和时间感知位置移位融合模块。这些技术使得 Sonic 能够在不同风格的图像和各种类型的音频输入下,生成稳定且逼真的长视频。
Sonic 支持各种风格的人像生成,比如真人、风格化及卡通人物,且很好地适应了非真实人类案例或多分辨率比率的泛化。在长视频生成领域,也能保持稳定和生成效果,突出了我们的时间感知位置偏移融合技术的有效性和独创性。

项目优势

上下文增强音频学习:提取长时间片段的音频知识,提供面部表情和唇部运动的先验信息。
运动解耦控制器:独立控制头部和表情运动,实现更自然的动画效果。
时间感知位置移位融合:融合全局音频信息,生成长时间稳定的视频。
多样化视频生成:支持不同风格的图像和多种分辨率的视频生成。
与开源和闭源方法的对比:展示 Sonic 在表情丰富度和头部运动自然度上的优势。

使用教程:(建议N卡,显存12G起,需要开启内存回退策略,最好16G显存)
上传一张参考图和一段驱动音频,音频时长建议不超过10秒,一键生成即可。
实测rtx3060开启内存回退策略,生成10s音频耗时5分钟左右。


下载地址:
夸克网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 50碎银 下载该资源立即购买

百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源立即购买



DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 19 天

[LV.4]偶尔看看III

0

主题

68

回帖

79

积分

无名之辈

积分
79
发表于 2025-1-17 18:17:14 | 显示全部楼层
正好66碎银,这么的就没了

该用户从未签到

0

主题

158

回帖

244

积分

江湖少侠

积分
244
发表于 2025-1-17 21:01:52 | 显示全部楼层
这个好像不错喔。谢谢分享

该用户从未签到

0

主题

1

回帖

18

积分

初入江湖

积分
18

突出贡献

发表于 2025-1-18 00:59:29 | 显示全部楼层
用样片生成十多秒,开始报错了。

return _VF.meshgrid(tensors, **kwargs) # type: ignore【attr-defined】

{'face_num': 1, 'crop_bbox': 【2, 0, 512, 510】}

LLVM ERROR: Symbol not found: __svml_cosf8_ha

签到天数: 18 天

[LV.4]偶尔看看III

603

主题

722

回帖

4万

积分

武林盟主

积分
47957

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-1-18 01:22:17 | 显示全部楼层
xxxq 发表于 2025-1-18 00:59
用样片生成十多秒,开始报错了。

return _VF.meshgrid(tensors, **kwargs) # type: ignore【attr-defined ...

报 LLVM ERROR: Symbol not found: __svml_cosf8_ha 错误,这个是系统缺少svml_dispmd.dll这个动态链接库,到这里 https://www.dll-files.com/svml_dispmd.dll.html 下载这个文件,复制到 C:\Windows\System32中即可

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

1

回帖

17

积分

初入江湖

积分
17

突出贡献

发表于 2025-1-18 21:00:22 | 显示全部楼层
本帖最后由 slmonker 于 2025-1-18 21:01 编辑

下载一下感受感受

该用户从未签到

0

主题

1

回帖

8

积分

初入江湖

积分
8
发表于 2025-1-19 01:31:35 | 显示全部楼层
照片不想被裁切要怎么设置

签到天数: 18 天

[LV.4]偶尔看看III

603

主题

722

回帖

4万

积分

武林盟主

积分
47957

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-1-19 09:30:56 | 显示全部楼层
songjiaqi 发表于 2025-1-19 01:31
照片不想被裁切要怎么设置

这个主要是驱动头部的,且是固定比例,合成后可以再用其他软件和原始人物比如全身人再合并。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 1 天

[LV.1]初来乍到

0

主题

82

回帖

102

积分

无名之辈

积分
102
发表于 2025-3-11 17:11:02 | 显示全部楼层
钱太难赚了

评分

参与人数 1碎银 -2 收起 理由
无言*** -2 恶意灌水

查看全部评分

该用户从未签到

0

主题

1

回帖

7

积分

初入江湖

积分
7
发表于 2025-3-14 14:27:30 | 显示全部楼层
要是有不裁剪的就好了,现在貌似都是要二次拼接的。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-16 19:30 , Processed in 0.094330 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表