pyvideotrans - 多功能AI视频翻译配音工具 本地一键整合包下载
这是一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。并支持API调用 语音识别支持 faster-whisper和openai-whisper本地离线模型 及 OpenAI SpeechToText API GoogleSpeech 阿里中文语音识别模型和豆包模型,并支持自定义语音识别api. 文字翻译支持 微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|字节火山|离线翻译OTT 文字合成语音支持 Microsoft Edge tts Google tts Azure AI TTS Openai TTS Elevenlabs TTS 自定义TTS服务器api GPT-SoVITS clone-voice ChatTTS-ui Fish TTS CosyVoice 允许保留背景伴奏音乐等(基于uvr5) 支持的语言:中文简繁、英语、韩语、日语、俄语、法语、德语、意大利语、西班牙语、葡萄牙语、越南语、泰国语、阿拉伯语、土耳其语、匈牙利语、印度语、乌克兰语、哈萨克语、印尼语、马来语、捷克语、波兰语、荷兰语、瑞典语
主要用途和功能
【自动翻译视频并配音】将视频中的声音翻译为另一种语言的配音,并嵌入该语言字幕 【语音识别/将音频视频转为字幕】可批量将音频、视频文件中的人类说话声,识别为文字并导出为srt字幕文件 【语音合成/字幕配音】根据本地已有的srt字幕文件创建配音,支持单个或批量字幕 【翻译字幕文件】将一个或多个srt字幕文件翻译为其他语言的字幕文件 【合并视频和音频】批量将视频文件和音频文件一一对应合并 【合并视频和srt字幕】批量将视频文件srt字幕文件一一对应合并 【为视频添加图片水印】批量将视频文件中嵌入图片水印 【从视频中提取音频】从视频中分离为音频文件和无声视频 【音频视频格式转换】批量将音频视频进行格式转换 【字幕编辑并导出多格式】支持导入srt、vtt、ass格式字幕,编辑后可设置字体样式、色彩等导出对应格式字幕 【字幕格式转换】批量将字幕文件进行 srt/ass/vtt 格式互转 【下载油管视频】可从youtube上下载视频 【人声背景乐分离】 【API调用】支持 语音合成、语言识别、字幕翻译、视频翻译接口调用
因为模型太大,所以将一键包和模型包分开,先下载一键包,然后根据需要下载whisper模型包,根据自己的显卡来,large是最好的,显存建议12G起,8G左右建议用medium和large v1,模型包越大,效果越好。 faster-whisper 模型下载,适用于 stt 项目 和 “pyvideotrans视频翻译配音”项目的faster-whisper模式使用,openai-whisper模型请往下拉
下载后解压,将压缩包内的"models--Systran--faster-xx"文件夹复制到models目录内,解压复制后 models 目录下文件夹列表如下
正确放置后的 models 目录下的文件夹列表如下图:
openai-whisper模型下载,仅适用于“pyvideotrans视频翻译配音软件”的 openai-whisper模式模型 下载使用
下载后将pt文件放到软件目录下的models文件夹内
下载地址: 百度网盘: |