zyd2077
发表于 2025-2-27 10:58:28
好东西,期待已久,自己安装很费劲
zyd2077
发表于 2025-2-27 19:58:54
这个怎么下载模型包?放到哪个目录?我下载的large-v3.pt不识别啊
noah06
发表于 2025-3-13 16:08:32
仅用作学习借鉴使用
jasonit
发表于 2025-3-14 12:01:32
本帖最后由 jasonit 于 2025-3-16 14:11 编辑
感谢 试了一下发现没有模型,然后一楼说模型文件单独打包。麻烦问下模型在哪?
18770816121
发表于 2025-3-18 23:40:07
感谢分享
cyizb425
发表于 2025-3-26 14:23:22
百花齐放,百家争鸣
SiegfriedYin
发表于 2025-5-15 14:06:57
34tq345rtq345q23235
lujun1996
发表于 2025-5-27 17:12:17
Whisper的音频识别模型包含tiny、base、small、medium、 large五种,从左到右tiny模型效果最差、large模型效果最好。同理,越好的模型需要的硬件越高,tiny和base只需要1G显存,small需要2G显存,medium需要5G显存,而large需要10G显存。除了large,还有large-V1,large-V2以及large-V3,目前效果最好的是large-V3。
考虑到一键包体积,目前只内置了几种常用的,有其他需求,可自行切换,会切换后会自动下载。
确实是一款很好的转文字工具,很多网站都有介绍,感谢楼主的分享
chingyat
发表于 2025-6-3 21:06:43
这个好用不,我试试对比一下
浅语
发表于 2025-6-10 10:07:28
感谢楼主分享!!
页:
1
2
3
4
5
6
7
8
[9]
10