Remove-Noise - 一个小巧强大的音频降噪工具,本地一键整合包下载
Remove-Noise 是基于通义实验室的 ZipEnhancer模型实现音频降噪功能,提供便捷的Web UI界面和API接口。
在语音识别转录、语音克隆等应用中,音频噪声会显著影响处理精度。因此,对原始音视频进行预处理降噪至关重要。ZipEnhancer 模型安装简便,且降噪效果良好,故此开发本小工具以方便使用。该WebUI和api功能由AI翻译工具 pyvideotrans的作者 jiangchang512大佬开发。
降噪案例:
未降噪音频
speech_with_noise.mp3
(74.97 KB, 下载次数: 0)
降噪后的音频
audio.mp3
(74.85 KB, 下载次数: 0)
应用场景:
在嘈杂的声学环境中降低噪声影响,甚至是消除噪声。
改善任意来源的音频声学质量,提升语音清晰度。
在各种背景音中提取人声或者背景声。
使用教程:
上传一段需要降噪的音频,点开始降噪即可。
API使用说明:
接口地址: http://127.0.0.1:5080/api
请求方法: POST
请求参数:
stream: 整数类型,控制返回结果格式。
0: 返回降噪后音频的URL地址。
1: 直接返回降噪后的WAV音频数据。
audio: 二进制文件类型,待处理的原始音频或视频文件。
返回结果 (JSON格式):
成功:
stream=0: { "code": 0, "data": { "url": "音频URL地址" } }
stream=1: 返回降噪后的WAV音频数据 (二进制数据)。
失败: { "code": -1, "msg": "错误信息" }
import requests
# stream=0: 获取音频URL
res = requests.post('http://127.0.0.1:5080/api', data={"stream": 0}, files={"audio": open('./300.wav', 'rb')})
if res.status_code != 200:
print(f"请求失败: {res.text}")
exit(1) # 使用 exit(1) 表示非零退出码,指示错误发生
print(f"降噪后音频URL: {res.json()['data']['url']}")
# stream=1: 获取WAV数据
res = requests.post('http://127.0.0.1:5080/api', data={"stream": 1}, files={"audio": open('./300.wav', 'rb')})
if res.status_code != 200:
print(f"请求失败: {res.text}")
exit(1)
with open("ceshi.wav", 'wb') as f:
f.write(res.content)
print("降噪后的音频已保存为 ceshi.wav")
下载地址:
夸克网盘:https://pan.quark.cn/s/8f3d4f27db1f
百度网盘:
|