无言以对 发表于 2026-1-24 11:42:12

Qwen3-TTS - 一句话指挥AI配音 自由定制你的专属声音 十种语言随心说 支持50系显卡 一键整合包下载


Qwen3-TTS 是阿里云团队推出的一个开源语音合成(Text-to-Speech, TTS)工具,它能把文字快速、自然地转成语音,还能定制声音风格、克隆声音,甚至支持实时对话场景。

Qwen3-TTS 把“做语音”这件事从专业配音员的活儿,变成了“会打字就会做”的程度,而且效果已经非常接近专业水准了,它的特点是声音逼真、可控、支持多语言,并且延迟极低,支持仅用 3 秒音频就能生动克隆声音、通过自然语言一句话 自由设计/控制音色情绪风格、超低延迟(最快 97ms)流式实时生成,支持 10 种语言 + 多方言,整体实现稳定、自然、富有表现力的语音合成。


语音设计效果试听:
提示词:用难以置信的语气说话,但语气中要开始流露出一丝恐慌。





核心亮点

一句话就能自定义声音风格(自然语言控制)
你可以直接写:“用温柔的御姐音,语速稍慢,带一点撒娇的感觉读这段话” AI就能尽量按你的描述来念,真的很像在跟AI导演配音。

3秒就能克隆你的声音(超快语音克隆)
只给你3秒音频,它就能模仿你的声音说话,克隆效果生动、自然,不像以前那种机器人感很重。

可以凭空“捏”一个新声音(自由语音设计)
不需要参考音频,你直接描述:“20岁元气少女声,带一点台湾腔”或者“低沉磁性大叔音,像Morgan Freeman那种感觉”,它就能试着生成。

延迟超低,能边想边说(流式生成)
最快97毫秒就能出声,非常适合做实时对话的AI助手、直播念评论、实时翻译配音等场景。

支持10种语言 + 很多方言
中、英、日、韩、德、法、西、俄、葡、意等。中文还包含普通话+粤语+闽南语+四川话+东北话+天津话等很多地方口音 音色超级丰富 官方自带几十种高质量预设音色(男女老少、不同性格、不同语言组合都有),直接挑着用就很好听。



应用领域

智能客服与语音助手   在客服系统或智能音箱中,提供自然流畅的语音回复,提升用户体验。
教育与培训   用于在线课程、语言学习软件,生成多语言讲解或练习音频。
内容创作与配音   视频博主、播客制作者可以快速生成不同风格的配音,无需真人录音。
游戏与虚拟角色   为游戏角色或虚拟人提供个性化声音,支持情绪化表达,让角色更真实。
无障碍应用   帮助视障人士通过文字转语音获取信息,提升信息可达性。
实时互动场景   如直播、在线会议、虚拟客服,利用低延迟语音生成实现即时交流。




使用教程:(建议N卡,显存4G起,支持50系显卡)

包含三种语音场景
1、语音设计:可以根据文字描述设计声音,比如“温柔女声”“年轻男声”,甚至能创造全新的声音角色
2、语音克隆:只需几秒钟的音频样本,就能快速复制某个人的声音,用来生成新的语音内容
3、语音定制:多种预设音色的文本转语音,支持定制情感

注:包含0.6B和1.7B两个参数的模型,0.6B只需要4G显存,1.7B建议6G显存起,效果1.7B好于0.6B


关于声音描述:比如目标文本 “哥哥,你回来啦,人家等了你好久好久了,要抱抱!”
提示词可以借助大模型,写出你要表达的情感,比如下面的描述:“体现撒娇稚嫩的萝莉女声,音调偏高且起伏明显,营造出黏人、做作又刻意卖萌的听觉效果”
你也可以填写更多描述细节,比如男声女声,年龄等信息。


关于第三个“TTS(语音定制)”标签,可以使用预置音色,议使用每位说话者的母语,以获得最佳质量。当然,每个说话者都可以说模型支持的任何语言。
以下是预置的几种音色介绍,大家可以根据需要选择:


Vivian    明亮、略带锋芒的年轻女性声音    中文
Serena   温暖、温柔的年轻女性声音             中文
Uncle_Fu   经验丰富的男性嗓音,音色低沉柔和   中文
Dylan   年轻的北京男性嗓音,音色清晰自然   汉语(北京方言)
Eric   活泼的成都男声,带着一丝沙哑明亮   中文(四川话)
Ryan   充满活力的男性声音,节奏感强劲   英语
Aiden   阳光的美国男声,中音清晰   英语

Ono_Anna   活泼的日本女性声音,音色轻盈灵巧   日语
Sohee   温暖的韩国女性声音,情感丰富   朝鲜语



下载地址:
夸克网盘:https://pan.quark.cn/s/3811805e3fd7
下载主程序压缩包和模型(modesl文件夹),解压主程序,并把modesl文件夹移动到主程序目录下即可。

百度网盘:
**** 本内容需购买 ****


tswcb 发表于 2026-1-26 08:27:46

感谢老大

学习ai 发表于 2026-1-26 10:50:46


运行出现这些是什么问题



Error: OSError: No space left on device Traceback (most recent call last):   File "<frozen app>", line 82, in get_model   File "D:\Qwen3-TTS\qwen_tts\inference\qwen3_tts_model.py", line 112, in from_pretrained   model = AutoModel.from_pretrained(pretrained_model_name_or_path, **kwargs)             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\models\auto\auto_factory.py", line 604, in from_pretrained   return model_class.from_pretrained(            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\qwen_tts\core\models\modeling_qwen3_tts.py", line 1833, in from_pretrained   model = super().from_pretrained(             ^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\modeling_utils.py", line 277, in _wrapper   return func(*args, **kwargs)            ^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\modeling_utils.py", line 4900, in from_pretrained   checkpoint_files, sharded_metadata = _get_resolved_checkpoint_files(                                          ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\modeling_utils.py", line 1037, in _get_resolved_checkpoint_files   resolved_archive_file = cached_file(pretrained_model_name_or_path, filename, **cached_file_kwargs)                           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\utils\hub.py", line 322, in cached_file   file = cached_files(path_or_repo_id=path_or_repo_id, filenames=, **kwargs)            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\utils\hub.py", line 567, in cached_files   raise e   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\utils\hub.py", line 479, in cached_files   hf_hub_download(   File "D:\Qwen3-TTS\deepface\Lib\site-packages\huggingface_hub\utils\_validators.py", line 114, in _inner_fn   return fn(*args, **kwargs)            ^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\huggingface_hub\file_download.py", line 1007, in hf_hub_download   return _hf_hub_download_to_cache_dir(            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\huggingface_hub\file_download.py", line 1168, in _hf_hub_download_to_cache_dir   _download_to_tmp_and_move(   File "D:\Qwen3-TTS\deepface\Lib\site-packages\huggingface_hub\file_download.py", line 1735, in _download_to_tmp_and_move   http_get(   File "D:\Qwen3-TTS\deepface\Lib\site-packages\huggingface_hub\file_download.py", line 496, in http_get   temp_file.write(chunk) OSError: No space left on deviceDuring handling of the above exception, another exception occurred:Traceback (most recent call last):   File "<frozen app>", line 178, in generate_voice_design   File "<frozen app>", line 89, in get_model   File "D:\Qwen3-TTS\qwen_tts\inference\qwen3_tts_model.py", line 112, in from_pretrained   model = AutoModel.from_pretrained(pretrained_model_name_or_path, **kwargs)             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\models\auto\auto_factory.py", line 604, in from_pretrained   return model_class.from_pretrained(            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\qwen_tts\core\models\modeling_qwen3_tts.py", line 1833, in from_pretrained   model = super().from_pretrained(             ^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\modeling_utils.py", line 277, in _wrapper   return func(*args, **kwargs)            ^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\modeling_utils.py", line 4900, in from_pretrained   checkpoint_files, sharded_metadata = _get_resolved_checkpoint_files(                                          ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\modeling_utils.py", line 1037, in _get_resolved_checkpoint_files   resolved_archive_file = cached_file(pretrained_model_name_or_path, filename, **cached_file_kwargs)                           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\utils\hub.py", line 322, in cached_file   file = cached_files(path_or_repo_id=path_or_repo_id, filenames=, **kwargs)            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\utils\hub.py", line 567, in cached_files   raise e   File "D:\Qwen3-TTS\deepface\Lib\site-packages\transformers\utils\hub.py", line 479, in cached_files   hf_hub_download(   File "D:\Qwen3-TTS\deepface\Lib\site-packages\huggingface_hub\utils\_validators.py", line 114, in _inner_fn   return fn(*args, **kwargs)            ^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\huggingface_hub\file_download.py", line 1007, in hf_hub_download   return _hf_hub_download_to_cache_dir(            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^   File "D:\Qwen3-TTS\deepface\Lib\site-packages\huggingface_hub\file_download.py", line 1168, in _hf_hub_download_to_cache_dir   _download_to_tmp_and_move(   File "D:\Qwen3-TTS\deepface\Lib\site-packages\huggingface_hub\file_download.py", line 1735, in _download_to_tmp_and_move   http_get(   File "D:\Qwen3-TTS\deepface\Lib\site-packages\huggingface_hub\file_download.py", line 496, in http_get   temp_file.write(chunk) OSError: No space left on device

无言以对 发表于 2026-1-26 11:08:31

学习ai 发表于 2026-1-26 10:50
运行出现这些是什么问题




第一句报错就很明显了,自己找翻译软件翻译下

15152544000 发表于 2026-2-23 14:48:13

这个有时常限制吗?或者说最长可以生成几分钟的?

无言以对 发表于 2026-2-23 14:51:44

15152544000 发表于 2026-2-23 14:48
这个有时常限制吗?或者说最长可以生成几分钟的?

理论上没有限制,但生成的越长,对显存和内存占用越高,最后会导致OOM报错
页: [1]
查看完整版本: Qwen3-TTS - 一句话指挥AI配音 自由定制你的专属声音 十种语言随心说 支持50系显卡 一键整合包下载