Kokoro - 最近很火的速度超快的轻量级文本转语音模型 本地一键整合包下载
Kokoro 是一个前沿的 TTS(文本转语音) 模型,其大小为 8200 万个参数(文本输入/音频输出)。
Kokoro 仅拥有 82M 参数的高效 TTS 模型,只需轻轻一点,就能在几秒钟内生成几分钟的高质量语音。不需要昂贵的设备,也不需要复杂的配置。
Kokoro 无需专业的显卡,只需要CPU即可轻松运行,而且模型小巧,仅300M的模型体积。这意味着,你可以在几秒钟内生成几分钟的高质量语音,而无需高端硬件的支持。 这一性能表现,使得 Kokoro TTS 在 TTS 排行榜中冲至第一,成为业界的新宠。
核心亮点
参数小,性能强:Kokoro TTS 拥有仅 82M 参数,与其他需要庞大资源的模型相比,它显得格外高效。
多语言支持:支持中文、韩语、日语、法语、英语等五种语言。
多人物音色支持:提供了多达18种男女人物音色。
实时语音生成:在普通CPU上,Kokoro TTS可以近乎实时生成语音,而在GPU上,生成速度更是快到了令人难以置信的50倍实时速度。
自然的语音合成:Kokoro TTS 生成的语音自然流畅,接近人类语音。无论是用于语音助手、有声读物,还是角色配音,均能提供高质量的语音体验。
使用教程:(CPU可运行,无需显卡)
解压一键包,安装 Espeak,点击下载 (双击,一路下一步即可,不要更改路径)
输入需要合成的文本(当前一键包仅支持英文,后续同步官方会开放中文支持)
选择预设音色,合成音频格式,最后合成即可
下载地址:
夸克网盘:https://pan.quark.cn/s/1daede487dd4
百度网盘:**** 本内容需购买 ****
这个不错。不过不能中文 。不然就更完美了,谢谢 期待中文支持
页:
[1]