- ChatTTS改良版 - 新增分角色朗读功能、音色抽卡功能以及生成长音频 (107篇回复)
- FireRedASR - 小红书开源自动语音识别模型 语音识别、语音转写、语音转字幕 本地一键整合包下载 (15篇回复)
- DMOSpeech 2 - 轻量快速的零样本文本转语音 语音克隆工具 支持50系显卡 一键整合包下载 (6篇回复)
- Higgs Audio V2 - 一个强大的语音模型,支持文本转语音、语音克隆、多人对话生成等 支持50系显卡 一键整合包下载 (1篇回复)
- SongGeneration V4版 - AI一键生成歌曲,人人皆可创作音乐 支持50系显卡 一键整合包下载 (5篇回复)
- ClearerVoice-Studio - 通义语音处理技术,集成语音增强、语音分离和音视频说话人提取等功能,本地一键整合包下载 (12篇回复)
- SongGeneration V3版 - AI一键生成歌曲,人人皆可创作音乐 支持50系显卡 一键整合包下载 (3篇回复)
- IndexTTS V3版 - 更新最强大的1.5版模型 B站开源可控零样本文本转语音/语音克隆系统 本地一键整合包下载 (16篇回复)
- FunASR - 阿里开源语音识别模型 支持语音转文本/语音转字幕/视频转字幕等 本地一键整合包下载 (32篇回复)
- Voxtral - 企业级音频模型,支持超长语音一键识别转文本 支持50系显卡 一键整合包下载 (1篇回复)
- MSST V1.2.1 - 一个好用的AI提取人声、去和声混响的人声分离工具 本地一键整合包下载 (44篇回复)
- Fish Speech:免训练一键文本转语音工具 一键包下载 (51篇回复)
- InspireMusic - 阿里通义实验室开源音乐生成框架 支持音乐、歌曲、音频生成 本地一键整合包下载 (5篇回复)
- SongGeneration V2版 - AI一键生成歌曲,人人皆可创作音乐。支持50系显卡 一键整合包下载 (4篇回复)
- MOSS-TTSD V2版 - 文本到语音对话生成 支持零样本多人语音克隆 一键整合包下载 (4篇回复)
- ThinkSound V2版 - 一键给无声视频配音,为AI视频生成匹配音效 支持50系显卡 一键整合包下载 (4篇回复)
- OpenAudio S1 - 媲美专业配音演员的AI语音生成软件 支持50系显卡 语音克隆、文本转语音 本地一键整合包下载 (16篇回复)
- ACE-Step V2版 - 20秒生成4分钟完整歌曲,8G显存可用,小白玩转音乐创作,支持50系显卡 本地一键整合包下载 (7篇回复)
- AudioX - 一个AI音频生成工具,支持文本生成音频/音乐、视频配音/配乐 本地一键整合包下载 (3篇回复)
- MOSS-TTSD - 文本到语音对话生成 支持零样本多人语音克隆 支持50系显卡 一键整合包下载 (5篇回复)