好东西,期待已久,自己安装很费劲
这个怎么下载模型包?放到哪个目录?我下载的large-v3.pt不识别啊
仅用作学习借鉴使用
本帖最后由 jasonit 于 2025-3-16 14:11 编辑
感谢 试了一下发现没有模型,然后一楼说模型文件单独打包。麻烦问下模型在哪?
感谢分享
百花齐放,百家争鸣
34tq345rtq345q23235
Whisper的音频识别模型包含tiny、base、small、medium、 large五种,从左到右tiny模型效果最差、large模型效果最好。同理,越好的模型需要的硬件越高,tiny和base只需要1G显存,small需要2G显存,medium需要5G显存,而large需要10G显存。除了large,还有large-V1,large-V2以及large-V3,目前效果最好的是large-V3。
考虑到一键包体积,目前只内置了几种常用的,有其他需求,可自行切换,会切换后会自动下载。
确实是一款很好的转文字工具,很多网站都有介绍,感谢楼主的分享
这个好用不,我试试对比一下
感谢楼主分享!!