- TIGER - 一个轻量高效的语音分离模型,支持人声伴奏分离、音频说话人分离等 支持50系显卡 本地一键整合包下载 (4篇回复)
- IndexTTS2 - 宇宙最强开源语音克隆模型,实现语音时长与情感精准控制 支持50系显卡 一键整合包下载 (15篇回复)
- 基于GPT-SoVITS界面精简的语音克隆工具 Mars-SoVITS (29篇回复)
- VibeVoice - 文本到语音对话生成 可生成90分钟4人聊天语音 支持50系显卡 一键整合包下载 (22篇回复)
- HunyuanVideo-Foley - AI视频配音 根据视频和文本描述生成逼真的音频 支持50系显卡 一键整合包下载 (0篇回复)
- Seed-VC V5版 - 全新V2模型 支持50系显卡 零样本语音转换 、实时语音转换、唱歌语音转换 本地一键整合包下载 (11篇回复)
- MOSS-TTSD V3版 - 文本到语音对话生成 支持零样本多人语音克隆 支持50系显卡 一键整合包下载 (11篇回复)
- CosyVoice V3版 - 阿里最新开源语音克隆、文本转语音项目 新增音色融合、字幕同步,本地一键整合包下载 (125篇回复)
- ChatTTS改良版 - 新增分角色朗读功能、音色抽卡功能以及生成长音频 (107篇回复)
- DMOSpeech 2 - 轻量快速的零样本文本转语音 语音克隆工具 支持50系显卡 一键整合包下载 (6篇回复)
- Higgs Audio V2 - 一个强大的语音模型,支持文本转语音、语音克隆、多人对话生成等 支持50系显卡 一键整合包下载 (1篇回复)
- ClearerVoice-Studio - 通义语音处理技术,集成语音增强、语音分离和音视频说话人提取等功能,本地一键整合包下载 (12篇回复)
- IndexTTS V3版 - 更新最强大的1.5版模型 B站开源可控零样本文本转语音/语音克隆系统 本地一键整合包下载 (16篇回复)
- Voxtral - 企业级音频模型,支持超长语音一键识别转文本 支持50系显卡 一键整合包下载 (1篇回复)
- MSST V1.2.1 - 一个好用的AI提取人声、去和声混响的人声分离工具 本地一键整合包下载 (44篇回复)
- Fish Speech:免训练一键文本转语音工具 一键包下载 (51篇回复)
- InspireMusic - 阿里通义实验室开源音乐生成框架 支持音乐、歌曲、音频生成 本地一键整合包下载 (5篇回复)
- SongGeneration V2版 - AI一键生成歌曲,人人皆可创作音乐。支持50系显卡 一键整合包下载 (4篇回复)
- MOSS-TTSD V2版 - 文本到语音对话生成 支持零样本多人语音克隆 一键整合包下载 (4篇回复)
- OpenAudio S1 - 媲美专业配音演员的AI语音生成软件 支持50系显卡 语音克隆、文本转语音 本地一键整合包下载 (16篇回复)