<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
  <channel>
    <title>前沿AI软件资源站 - AI语音</title>
    <link>https://deepface.cc/forum-20-1.html</link>
    <description>Latest 20 threads of AI语音</description>
    <copyright>Copyright(C) 前沿AI软件资源站</copyright>
    <generator>Discuz! Board by Comsenz Inc.</generator>
    <lastBuildDate>Mon, 20 Apr 2026 02:48:34 +0000</lastBuildDate>
    <ttl>60</ttl>
    <image>
      <url>https://deepface.cc/static/image/common/logo_88_31.gif</url>
      <title>前沿AI软件资源站</title>
      <link>https://deepface.cc/</link>
    </image>
    <item>
      <title>Fun-CineForge - 用AI一键给电影电视剧自动配音，零样本超自然效果 一键整合包下载</title>
      <link>https://deepface.cc/thread-1005-1-1.html</link>
      <description><![CDATA[FunCineForge 是一个开源的 AI 电影、电视剧配音项目，专门用来解决电影和电视剧自动配音的问题。它能让 AI 在各种复杂的影视场景里，实现“零样本”的高质量配音。能处理不同类型的影视场景（独白、旁白、对话、多角色场景），在音质、口型同步和声音风格切换方面效果 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Fri, 17 Apr 2026 05:23:29 +0000</pubDate>
    </item>
    <item>
      <title>Woosh - 文字、视频一键生成逼真音效 AI音效生成/视频配音 一键整合包下载</title>
      <link>https://deepface.cc/thread-1004-1-1.html</link>
      <description><![CDATA[Woosh 是 Sony AI 开发的一套「音效生成模型」，它能根据文字或视频自动生成音效，帮助创作者快速获得高质量的声音素材。简单说，就是用 AI 根据文字描述或视频画面自动生成真实、自然的音效。
Woosh 就像配音师一样，可以“看文字画声音”或“看视频配声音”。比如， ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Thu, 16 Apr 2026 14:21:38 +0000</pubDate>
    </item>
    <item>
      <title>MOSS-TTS-Nano - 轻量级多语言实时语音生成模型，CPU 即可实时运行 一键整合包下载</title>
      <link>https://deepface.cc/thread-1002-1-1.html</link>
      <description><![CDATA[MOSS-TTS-Nano 是一个轻量级的开源多语言语音生成模型，特点是体积小（仅 0.1B 参数）、可在普通 CPU 上实时运行，无需 GPU，特别适合想在普通设备上快速落地语音功能（即时语音交互）的开发者或个人用户。它支持中文、英文等 20 种语言，能进行语音克隆和长文本朗读， ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Tue, 14 Apr 2026 11:04:02 +0000</pubDate>
    </item>
    <item>
      <title>MOSS-TTS - 全能语音生成神器 高保真度、高表现力和复杂现实场景设计 一键整合包下载</title>
      <link>https://deepface.cc/thread-1001-1-1.html</link>
      <description><![CDATA[MOSS-TTS 是一个开源的语音与声音生成模型家族，特点是高保真、强表现力，并且能应对复杂的真实场景，如长篇语音、多角色对话、实时语音合成和环境音效生成。它不仅能“读出来”，还能“设计声音”，适合从语音助手到影视游戏的多种应用。


主要特点

声音特别真实、 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Mon, 13 Apr 2026 09:16:17 +0000</pubDate>
    </item>
    <item>
      <title>VoxCPM V3版 - 更新VoxCPM2，真人级多语言声音克隆 自然语言设计声音 一键整合包下载</title>
      <link>https://deepface.cc/thread-996-1-1.html</link>
      <description><![CDATA[VoxCPM 是一个开源的文本转语音（TTS）系统，它的最大特点是“无分词器”设计，可以直接从文字生成连续的语音信号，实现更自然的语音合成和逼真的声音克隆。它支持多语言，能在实时场景下运行，并且只需一段短音频就能模仿说话者的声音。

简单说就是：你输入文字，它 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Wed, 08 Apr 2026 23:57:41 +0000</pubDate>
    </item>
    <item>
      <title>ACE-Step V5版 - 用AI创作音乐歌曲 10秒生成完整歌曲 一键整合包下载</title>
      <link>https://deepface.cc/thread-995-1-1.html</link>
      <description><![CDATA[ACE-Step 是一个超级强大的本地AI音乐生成模型，即使是不懂音乐的小白，也可以让你在自己电脑上直接创作完整歌曲，生成音乐质量能超过大部分商业付费音乐AI（如接近或超越Suno v4.5水平），而且完全免费开源。

它就像一个“本地版Suno/Udio”，你输入一段文字描述（比 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Wed, 08 Apr 2026 02:20:27 +0000</pubDate>
    </item>
    <item>
      <title>OmniVoice - 支持600+语言的语音克隆和语音设计，超快自然配音神器 一键整合包下载</title>
      <link>https://deepface.cc/thread-992-1-1.html</link>
      <description><![CDATA[OmniVoice 是一个支持 600+ 种语言的先进语音合成（TTS）工具，最大的亮点是可以“零样本”克隆声音或设计全新声音，生成效果逼真且速度极快。它支持多种方言，生成速度快，还支持精细的情感控制，适合需要多语言语音生成的场景，比如教育、游戏、虚拟助手和内容创作。 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Sun, 05 Apr 2026 01:01:24 +0000</pubDate>
    </item>
    <item>
      <title>LongCat-AudioDiT - 美团开源超强语音克隆神器，文字秒变逼真语音 支持50系显卡 一键整合包下载</title>
      <link>https://deepface.cc/thread-988-1-1.html</link>
      <description><![CDATA[LongCat-AudioDiT 是美团开源的一款最新的文本转语音（TTS）模型，它直接在语音波形的“潜在空间”中工作，不再依赖传统的声谱图，从而让语音生成更简单、更高效，并且在声音克隆（模仿说话者声音）方面达到了业界领先水平。它让“用文字生成像真人一样的声音”这件事 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Wed, 01 Apr 2026 08:59:28 +0000</pubDate>
    </item>
    <item>
      <title>MMAudio V4版(NSFW版) - 无声视频一键变“会说话”，AI同步配音超自然 支持50系显卡 一键整合包下载</title>
      <link>https://deepface.cc/thread-986-1-1.html</link>
      <description><![CDATA[MMAudio 是一个 AI视频配音模型，能根据视频（或者加上文字描述）自动生成同步、高质量的音频。它就像给无声视频“配音”一样，让画面里的动作、场景自然发出对应的声音，比如人走路脚步声、物体碰撞声、环境背景音等。

今天分享的 MMAudio V4版，即 NSFW特别版，可以 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Mon, 30 Mar 2026 14:55:47 +0000</pubDate>
    </item>
    <item>
      <title>Voice Simalirity Analizer - 声音相似度检查器 一键检测两个声音相似度 一键整合包下载</title>
      <link>https://deepface.cc/thread-983-1-1.html</link>
      <description><![CDATA[Voice Simalirity Analizer 是一个能快速检查“这个声音是不是同一个人”的任何人的使用小工具。如果你对TTS工具音色相似度有要求，想检测某个TTS模型克隆生成的语音相似度，也可以使用它来一件检测。同样，如果你有两段语音想比对，直接去页面上传试试就行（注意音频 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Fri, 27 Mar 2026 14:13:25 +0000</pubDate>
    </item>
    <item>
      <title>Faster Qwen3-TTS - 实时语音合成加速引擎，实时流式，语音克隆、设计 支持50系显卡 一键整合包下载</title>
      <link>https://deepface.cc/thread-975-1-1.html</link>
      <description><![CDATA[Faster Qwen3-TTS 是一个专门为实时语音合成优化的开源工具，它能在普通显卡上实现比原版 Qwen3-TTS 快数倍的推理速度，并支持语音克隆、定制声音和流式生成。它的特点是低延迟、高效率，适合需要即时语音输出的场景。





项目特点 

实时性能优化：利用 CUDA Graph  ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Wed, 18 Mar 2026 03:27:38 +0000</pubDate>
    </item>
    <item>
      <title>SongGeneration 2 - 用AI创作音乐 人人都是音乐家 输入歌词生成歌曲 支持50系显卡 一键整合包下载</title>
      <link>https://deepface.cc/thread-971-1-1.html</link>
      <description><![CDATA[SongGeneration 2 是腾讯 AI Lab 开源的高质量歌曲生成模型，它能生成带人声和伴奏的完整歌曲，支持多语言歌词，并且在音乐性和歌词准确度上达到商业级水准。
SongGeneration 2 是目前开源模型里最能打的“AI写歌+唱歌”工具之一，中文特别友好，整体质量已经非常接近 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Fri, 13 Mar 2026 11:00:59 +0000</pubDate>
    </item>
    <item>
      <title>Audio_separator - 音乐（歌曲）人声/乐器分离工具 轻量小巧 支持50系显卡 一键整合包下载</title>
      <link>https://deepface.cc/thread-958-1-1.html</link>
      <description><![CDATA[Audio_separator 是一个音频人声/乐器分离工具，用来把音频文件里的 人声 和 伴奏/背景音乐 分离出来。

Audio_separator 就是一个“音频拆分器”，帮你把歌曲里的唱歌声和背景音乐分开，通常我们要提取一首歌的伴奏（伴奏带）或者只想要歌手清唱的声音（干声），传统 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Fri, 27 Feb 2026 09:15:27 +0000</pubDate>
    </item>
    <item>
      <title>Ming-omni-tts - 语音克隆+情感控制+BGM音效，多场景声音生成，播客短视频神器 支持50系显卡 一键整合包下载</title>
      <link>https://deepface.cc/thread-957-1-1.html</link>
      <description><![CDATA[Ming-omni-tts 是一个由 蚂蚁集团 与 inclusionAI 开发的统一音频生成模型，目标是高效、精准地生成语音、音乐和环境音。它的核心亮点在于 统一的音频语言模型 和 精细化控制能力，同时兼顾推理效率与自然度。
Ming-omni-tts 是一个“会说话、会唱歌、还能制造环境音” ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Thu, 26 Feb 2026 00:57:57 +0000</pubDate>
    </item>
    <item>
      <title>LuxTTS - 轻量、快速、高音质文字转语音与声音克隆工具 支持50系显卡 一键整合包下载</title>
      <link>https://deepface.cc/thread-950-1-1.html</link>
      <description><![CDATA[LuxTTS 是一个轻量小巧的文字转语音（Text-to-Speech, TTS）工具，它的最大亮点是能快速、清晰地把文字变成声音，还能“克隆”某个人的声音。更是支持CPU实时转换，简单来说，你只需要提供一段文字和一小段参考音频，它就能生成听起来几乎一模一样的语音。即使没有显卡 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Wed, 18 Feb 2026 14:10:06 +0000</pubDate>
    </item>
    <item>
      <title>SoulX-Singer - AI唱歌神器，任意声音翻唱任何歌曲 支持50系显卡 一键整合包下载</title>
      <link>https://deepface.cc/thread-946-1-1.html</link>
      <description><![CDATA[SoulX-Singer 是一个由 Soul AI Lab 开发的AI翻唱模型，它能让 AI 用任何人的声音来唱歌，而且不需要提前针对那个人专门训练。它的特别之处在于：即使没有专门训练过某个歌手的声音，也能在“零样本”情况下模仿出新的歌声。
想象一下，你随便找一段周杰伦、Taylor Swi ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Thu, 12 Feb 2026 04:45:18 +0000</pubDate>
    </item>
    <item>
      <title>ACE-Step V4版 - 用AI创作音乐歌曲 4G显存可玩 支持50系显卡 WebUI+ComfyUI双模式 一键整合包下载</title>
      <link>https://deepface.cc/thread-941-1-1.html</link>
      <description><![CDATA[ACE-Step V1.5 是一个开源的 AI 音乐生成工具，它能在普通电脑上快速生成高质量的歌曲，功能比很多商业音乐 AI 还强。你只要输入简单的描述，它就能帮你做出完整的音乐作品。

简单的说，它让你的家用电脑（哪怕显卡只有4～8GB显存）也能几秒钟做出接近Suno、Udio那种 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Fri, 06 Feb 2026 06:51:12 +0000</pubDate>
    </item>
    <item>
      <title>ACE-Step V3版 - 用AI玩转专业音乐创作 更新ACE-Step v1.5模型 小白创作音乐，支持50系显卡 一键整合包下载</title>
      <link>https://deepface.cc/thread-940-1-1.html</link>
      <description><![CDATA[ACE-Step V1.5 是一个开源的 AI 音乐生成工具，它能在普通电脑上快速生成高质量的歌曲，功能比很多商业音乐 AI 还强。你只要输入简单的描述，它就能帮你做出完整的音乐作品。

简单的说，它让你的家用电脑（哪怕显卡只有4～8GB显存）也能几秒钟做出接近Suno、Udio那种 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Thu, 05 Feb 2026 08:23:06 +0000</pubDate>
    </item>
    <item>
      <title>Qwen3-ASR - 支持52种语言方言的语音识别神器 语音转文字/语音转写 支持50系显卡 一键整合包下载</title>
      <link>https://deepface.cc/thread-935-1-1.html</link>
      <description><![CDATA[Qwen3-ASR 是阿里通义千问团队开源的语音识别（ASR）模型，简单来说就是把人说话的声音转成文字的超级工具。它能将语音快速准确地转成文字，最多支持52国语言/方言识别转写，甚至在低音、噪音等环境下精准识别。适合在不同场景下使用，如实时语音转写、语音助手、字幕 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Sun, 01 Feb 2026 02:09:38 +0000</pubDate>
    </item>
    <item>
      <title>HeartMuLa V2版 - 用AI创作歌曲 输入歌词即可创作音乐 新增GUI界面版 支持50系显卡 一键整合包下载</title>
      <link>https://deepface.cc/thread-931-1-1.html</link>
      <description><![CDATA[HeartMuLa 是一个开源的“音乐大模型工具库”，它能把歌词和标签转化为完整的音乐作品，还能做歌词转录、音乐编码和跨模态检索。它的特点是多语言支持（中、英、日、韩、西班牙语等）、高保真音频生成，以及和文字描述的紧密结合。应用领域包括音乐创作、歌词转录、音 ...]]></description>
      <category>AI语音</category>
      <author>无言以对</author>
      <pubDate>Tue, 27 Jan 2026 10:42:35 +0000</pubDate>
    </item>
  </channel>
</rss>