设为首页收藏本站 劰载中...

 找回密码
 立即注册
楼主: 无言***

Whisper - AI一键音频转文字、音频转字幕工具,OpenAI开源语音识别神器 本地一键整合包下载

  [复制链接]

0

主题

2

回帖

8

积分

初入江湖

积分
8
发表于 2025-2-27 10:58:28 | 显示全部楼层
好东西,期待已久,自己安装很费劲

0

主题

2

回帖

8

积分

初入江湖

积分
8
发表于 2025-2-27 19:58:54 | 显示全部楼层
这个怎么下载模型包?放到哪个目录?我下载的large-v3.pt不识别啊

0

主题

3

回帖

9

积分

初入江湖

积分
9
发表于 2025-3-13 16:08:32 | 显示全部楼层
仅用作学习借鉴使用

0

主题

12

回帖

120

积分

上上宾

积分
120

上上宾

发表于 2025-3-14 12:01:32 | 显示全部楼层
本帖最后由 jasonit 于 2025-3-16 14:11 编辑

感谢 试了一下发现没有模型,然后一楼说模型文件单独打包。麻烦问下模型在哪?

0

主题

7

回帖

18

积分

初入江湖

积分
18
发表于 2025-3-18 23:40:07 | 显示全部楼层
感谢分享

0

主题

273

回帖

273

积分

江湖少侠

积分
273
发表于 2025-3-26 14:23:22 | 显示全部楼层
百花齐放,百家争鸣

0

主题

2

回帖

5

积分

初入江湖

积分
5
发表于 2025-5-15 14:06:57 | 显示全部楼层
34tq345rtq345q23235

0

主题

321

回帖

372

积分

江湖少侠

积分
372
发表于 2025-5-27 17:12:17 | 显示全部楼层
Whisper的音频识别模型包含tiny、base、small、medium、 large五种,从左到右tiny模型效果最差、large模型效果最好。同理,越好的模型需要的硬件越高,tiny和base只需要1G显存,small需要2G显存,medium需要5G显存,而large需要10G显存。除了large,还有large-V1,large-V2以及large-V3,目前效果最好的是large-V3。
考虑到一键包体积,目前只内置了几种常用的,有其他需求,可自行切换,会切换后会自动下载。


确实是一款很好的转文字工具,很多网站都有介绍,感谢楼主的分享

0

主题

3

回帖

99

积分

无名之辈

积分
99
发表于 2025-6-3 21:06:43 | 显示全部楼层
这个好用不,我试试对比一下

0

主题

1

回帖

6

积分

初入江湖

积分
6
发表于 2025-6-10 10:07:28 | 显示全部楼层
感谢楼主分享!!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|前沿AI软件资源站

GMT+8, 2025-10-11 11:48 , Processed in 0.177074 second(s), 2 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表