找回密码
 立即注册
查看: 824|回复: 1

Moonshine - 新型开源ASR(语音识别)模型,体积小,速度快,比OpenAI Whisper快五倍 本地一键整合包下载

[复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-11-7 16:57:13 | 显示全部楼层 |阅读模式

Moonshine - 新型开源ASR(语音识别)模型,体积小,速度快,比OpenAI Whisper快五倍 本地一键整合包下载 . ...

Moonshine - 新型开源ASR(语音识别)模型,体积小,速度快,比OpenAI Whisper快五倍 本地一键整合包下载 . ...


Moonshine 是由 Useful Sensors 公司推出的一系列「语音到文本(speech-to-text, STT)转换模型」,旨在为资源受限设备提供快速而准确的「自动语音识别(ASR)服务」。Moonshine 的设计特别适合于需要即时响应的应用场景,如实时转录和语音命令识别。相比同类产品,如 OpenAI 的 Whisper,Moonshine 在处理速度上提高了五倍,并且在多个标准数据集上展示了更低的词错误率(WER)。
Moonshine 在多个维度上超越了现有的语音识别解决方案,特别是在处理速度和准确度方面。据官方报告,Moonshine 的处理速度「比 OpenAI 的 Whisper 快五倍」,并且在词错误率方面也表现得更好。这种显著的优势使得 Moonshine 成为资源受限环境下语音识别的理想选择。


更小体积的模型:
moonshine/base 模型参数大小为 61 MB。moonshine/tiny 模型仅需 27 MB RAM。适用于内存非常有限的设备。


更快的处理速度
Moonshine 的处理速度比 Whisper 快 1.7 倍。对于 10 秒的短音频片段,处理速度可达 Whisper 的五倍。高效处理能力和低资源需求确保实时或接近实时的语音转文字功能。


优点说完了,说说缺点,目前只支持英文,期待后期更多语种的支持。有类似英语转换需求的可以体验下,速度确实快,准确率也高。


使用教程:(CPU可运行,建议独立显卡N卡使用,速度更快)
上传一段需要识别的音频,选择模型,点转写即可


下载地址:
https://pan.quark.cn/s/940bad4339a4

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

103

回帖

130

积分

无名之辈

积分
130
发表于 2024-11-9 09:25:35 | 显示全部楼层
Traceback (most recent call last):
  File "P:\Moonshine\app.py", line 14, in <module>
    import moonshine
ModuleNotFoundError: No module named 'moonshine'
请按任意键继续. . .
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-19 08:04 , Processed in 0.096000 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表