无言以对 发表于 6 天前

MOSS-TTS-Nano - 轻量级多语言实时语音生成模型,CPU 即可实时运行 一键整合包下载


MOSS-TTS-Nano 是一个轻量级的开源多语言语音生成模型,特点是体积小(仅 0.1B 参数)、可在普通 CPU 上实时运行,无需 GPU,特别适合想在普通设备上快速落地语音功能(即时语音交互)的开发者或个人用户。它支持中文、英文等 20 种语言,能进行语音克隆和长文本朗读,应用场景涵盖智能产品、网页服务和语音交互。

今天分享的 MOSS-TTS-Nano ,应该是目前市面上能在 CPU 上流畅运行、支持中文且效果最好的开源TTS模型,同时具备资源占用低、生成速度快、支持流式生成等特点,非常适合实时语音生成的场景。


主要特点

极致轻便:模型小、占用资源少,适合手机、嵌入式设备或普通电脑本地运行。
实时流式输出:生成语音速度快,第一句音频出来很快,能边生成边播放,几乎没有卡顿。
音质实用:输出48kHz立体声(双声道),质量够好,适合日常产品使用(不是实验室顶级音质,但“够用且自然”)。
多语言支持:目前支持 20 种语言,包括中文、英文、日语、韩语、德语、西班牙语等。
长文本支持:自动分段处理长文章,不会轻易出问题。



应用领域

本地AI助手:像私人语音机器人、离线阅读助手(手机或电脑上读文章、聊天)。
轻量级产品集成:智能音箱、APP配音、游戏NPC对话、教育软件等,不想依赖云服务的场景。
网页/边缘设备演示:快速做语音Demo、客服机器人原型。
开发者与爱好者:本地测试语音克隆、多语言内容生成,资源有限的环境下特别实用。
隐私敏感场合:所有数据都在本地跑,不用上传到云端。



使用教程:(无需显卡,纯CPU运行)

可以使用自带音色生成,也支持手动添加参考音频
选择音色或上传参考音频,输入目标文件,点击生成即可
支持流失实时生成语音,速度快,纯CPU即可流畅运行,支持长文本生成



下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOqGfUe8dR04neKW-I1xniymA1?pwd=i486

夸克网盘:
**** 本内容需购买 ****

百度网盘:
**** 本内容需购买 ****

页: [1]
查看完整版本: MOSS-TTS-Nano - 轻量级多语言实时语音生成模型,CPU 即可实时运行 一键整合包下载