Kokoro V2版 - 最近很火的速度超快的轻量级文本转语音模型 本地一键整合包下载
Kokoro 是一个前沿的 TTS(文本转语音) 模型,其大小为 8200 万个参数(文本输入/音频输出)。
Kokoro 仅拥有 82M 参数的高效 TTS 模型,只需轻轻一点,就能在几秒钟内生成几分钟的高质量语音。不需要昂贵的设备,也不需要复杂的配置。
Kokoro 无需专业的显卡,只需要CPU即可轻松运行,而且模型小巧,仅300M的模型体积。这意味着,你可以在几秒钟内生成几分钟的高质量语音,而无需高端硬件的支持。 这一性能表现,使得 Kokoro TTS 在 TTS 排行榜中冲至第一,成为业界的新宠。
今天分享的V2版,修复了上个版本生成报错的问题。
新增多语音类型生成,可用于多人对话语音生成。
新增srt配音,支持自定义上传字幕文件,并一键为字幕文件配音。
新增语音混合,支持多种音色生成新音色。
核心亮点
参数小,性能强:Kokoro TTS 拥有仅 82M 参数,与其他需要庞大资源的模型相比,它显得格外高效。
多语言支持:支持中文、韩语、日语、法语、英语等五种语言。
多人物音色支持:提供了多达18种男女人物音色。
实时语音生成:在普通CPU上,Kokoro TTS可以近乎实时生成语音,而在GPU上,生成速度更是快到了令人难以置信的50倍实时速度。
自然的语音合成:Kokoro TTS 生成的语音自然流畅,接近人类语音。无论是用于语音助手、有声读物,还是角色配音,均能提供高质量的语音体验。
使用教程:(CPU可运行,V2版支持N卡加速生成)
解压一键包,安装 Espeak,点击下载 (双击,一路下一步即可,不要更改路径)
输入需要合成的文本(当前一键包仅支持英文,后续同步官方会开放中文支持)
选择预设音色,合成音频格式,最后合成即可
下载地址:
夸克网盘:https://pan.quark.cn/s/29001fc5431d
百度网盘:**** 本内容需购买 ****
解压密码:https://deepface.cc/ 复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可
新年都更新这么频繁,辛苦了,谢谢 感谢楼主分享~ Error: An error happened while trying to locate the file on the Hub and we cannot find the requested files in the local cache. Please check your connection and try again or make sure your Internet connection is on.
页:
[1]