找回密码
 立即注册
查看: 8320|回复: 105

Linly-Dubbing - 智能视频多语言AI配音/翻译工具 支持一键视频翻译并配音 本地一键整合包下载

 火.. [复制链接]

签到天数: 11 天

[LV.3]偶尔看看II

595

主题

691

回帖

4万

积分

武林盟主

积分
46429

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-9-2 09:52:42 | 显示全部楼层 |阅读模式

Linly-Dubbing - 一键智能视频多语言AI配音/翻译工具

Linly-Dubbing - 一键智能视频多语言AI配音/翻译工具

Linly-Dubbing 是一个智能视频多语言AI配音和翻译工具,它融合了YouDub-webui的灵感,并在此基础上进行了拓展和优化。我们致力于提供更加多样化和高质量的配音选择,通过集成 Linly-Talker 的数字人对口型技术,为用户带来更加自然的多语言视频体验。
通过整合最新的AI技术,Linly-Dubbing 在多语言配音的自然性和准确性方面达到了新的高度,适用于国际教育、全球娱乐内容本地化等多种场景,帮助团队将优质内容传播到全球各地。

大致工作流程是:下载视频,人声分离,语音识别,字幕翻译,语音合成,视频合成
跟之前提供的一款翻译软件 pyvideotrans 工作原理类似,pyvideotrans集成GUI,但界面略复杂。

Linly大佬还集成过一个对口型的项目,效果还不错。之前准备打包的,但操作太复杂,集成的东西太多了,很多人估计都操作不了,所以一直没发,后期看看可行性。

今天主要说下他的新项目,Linly-Dubbing,先看下两段演示视频

原视频

1_20249294928.mp4 (1.07 MB, 下载次数: 247)

处理后的视频

2_20249294754.mp4 (1.11 MB, 下载次数: 217)


主要特点包括:

多语言支持: 支持中文及多种其他语言的配音和字幕翻译,满足国际化需求。
AI 智能语音识别:  使用先进的AI技术进行语音识别,提供精确的语音到文本转换和说话者识别。
大型语言模型翻译:  结合领先的本地化大型语言模型(如GPT),快速且准确地进行翻译,确保专业性和自然性。
AI 声音克隆:  利用尖端的声音克隆技术,生成与原视频配音高度相似的语音,保持情感和语调的连贯性。
数字人对口型技术:  通过对口型技术,使配音与视频画面高度契合,提升真实性和互动性。
灵活上传与翻译:  用户可以上传视频,自主选择翻译语言和标准,确保个性化和灵活性。
定期更新:  持续引入最新模型,保持配音和翻译的领先地位。

使用教程:

1.jpg


只针对一些可能出错的几个参数做下说明,其他的可以根据字面意思理解。大部分默认即可。
视频URL:这个模块使用的是开源的 yt-dlp ,目前支持国内外主流的视频媒体,比如国内的B站,国外的油管等。国外媒体需要科学上网才能下载。
计算设备:可以默认,如果没有显卡,也不建议用了,使用CPU很慢。
ASR模型选择:默认是openai的whisper,这个对英文支持效果好,阿里的FunASR也不错,都可以尝试下。如果选择whisper模型,WhisperX模型大小这个选项可以根据自己的显卡来选择,large识别效果好,但显存占用大,如果显存小,可以选择small、base或者Tiny
分离多个说话人:如果是多人说话,根据说话人数选择,如果一个人,就默认none


2.jpg

翻译方式:官方默认LLM,这个容易报错,保险起见,我把默认的翻译改成了微软的Bing Translate,这个国内可以正常使用。openai需要手动申请api填入,google的需要科学上网。
如果使用openai翻译,需要打开根目录下的.env,右键记事本打开,填写openai的key和密钥。

AI语音生成方法:三种可选,可以自行测试

3.jpg
这里的分辨率可以根据自己的视频设置,其他默认即可。

所有参数设置完成,点Submit提交即可。最终生成的视频默认保存在软件根目录下的video文件里。


下载地址:
夸克网盘:https://pan.quark.cn/s/3a8de67e9649
百度网盘:
游客,如果您要查看本帖隐藏内容请回复

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 2 天

[LV.1]初来乍到

0

主题

44

回帖

106

积分

无名之辈

积分
106
发表于 2024-9-2 21:10:19 | 显示全部楼层
这个好  效率太高了

该用户从未签到

0

主题

52

回帖

167

积分

无名之辈

积分
167
发表于 2024-9-3 06:58:26 | 显示全部楼层
感谢分享

该用户从未签到

0

主题

1

回帖

5

积分

初入江湖

积分
5
发表于 2024-9-3 15:25:07 | 显示全部楼层
666666666666

评分

参与人数 1碎银 -2 收起 理由
无言*** -2 恶意灌水

查看全部评分

该用户从未签到

0

主题

6

回帖

12

积分

初入江湖

积分
12
发表于 2024-9-3 18:31:12 | 显示全部楼层
看看如何,看是否成熟的产品

该用户从未签到

0

主题

1

回帖

7

积分

初入江湖

积分
7
发表于 2024-9-3 20:04:21 | 显示全部楼层
感谢分享

该用户从未签到

0

主题

12

回帖

46

积分

初入江湖

积分
46
发表于 2024-9-3 23:45:05 | 显示全部楼层
效率飞起

该用户从未签到

0

主题

98

回帖

435

积分

上上宾

积分
435

上上宾

发表于 2024-9-4 03:05:26 | 显示全部楼层
感谢分享,一键式操作,用yt下视频,然后提取音频,推理克隆语音,转写字幕文件,生成推理语音AI配音,然后在音视频合并

该用户从未签到

0

主题

11

回帖

19

积分

初入江湖

积分
19
发表于 2024-9-4 06:50:30 | 显示全部楼层
顶一下,谢谢楼主分享

该用户从未签到

0

主题

103

回帖

130

积分

无名之辈

积分
130
发表于 2024-9-4 07:57:56 | 显示全部楼层
谢谢分享,试用一下
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-5 02:30 , Processed in 0.088673 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表