无言以对 发表于 2025-2-23 15:06:40

FunASR - 阿里开源语音识别模型 支持语音转文本/语音转字幕/视频转字幕等 本地一键整合包下载



FunASR 是阿里巴巴达摩院开源的一个基本的端到端语音识别工具包和开源 SOTA 预训练模型,它集成了多项功能,包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多说话人ASR等。

提起语音识别,大家都会想到业界的翘首OpenAi开源的Whisper,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。同类项目还有本站发布的 SenseVoice,也是由阿里开源,还有近期小红书团队开源的 FireRedASR 都是在中文领域很优秀的语音识别项目。

今天分享的FunASR本地一键包,基于十字鱼大佬的WebUI打包整合, 支持语音、视频一键识别转写,并支持多种格式的文本导出,比如txt文本、SRC字幕文件等,支持中/英/日/韩等多国语言,尤其中文识别甚至远超Open的Whisper。同时支持批量处理,支持热词功能,感谢十字鱼大佬的WebUI。


使用教程:(建议N卡,显存4G起,基于CUDA12.4)

上传需要转写的语音或视频文件,选择模型,导出格式
最后点转写即可。


下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOJljYvMRMyDwqsYvc52PMCkA1?pwd=yqrb
夸克网盘:**** Hidden Message *****


解压密码:https://deepface.cc/ 复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可。

nsctt 发表于 2025-2-23 15:13:04

这个好像不错。介绍功能强大,期待一键包,谢谢

wemade 发表于 2025-2-23 23:36:05

感谢楼主分享

694105293 发表于 2025-2-24 11:03:55

支持作者:lol

viktor1982 发表于 2025-2-24 14:11:58

надо попробывать

694105293 发表于 2025-2-24 16:34:02

本帖最后由 694105293 于 2025-2-24 16:43 编辑

支持作者

Felix 发表于 2025-2-25 11:08:02

学习一下

hanpear 发表于 2025-2-25 21:16:10

感谢分享

来日方长 发表于 2025-2-26 12:55:08

国产AI看阿里

inhva1 发表于 2025-2-27 16:20:04

感谢分享,试试效果
页: [1] 2
查看完整版本: FunASR - 阿里开源语音识别模型 支持语音转文本/语音转字幕/视频转字幕等 本地一键整合包下载