小伙伴们在学习“外语”时。由于外语成绩太差而无法愉快学习。很是苦恼!
不用担心,表哥这里为大家推荐一款使用Whisper
语言模型进行计算语音转文字的软件。痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化。翻译快慢和你的电脑性能有一定关系。喜欢就收藏本文吧!
实验环境
-
Windows11 -
medium.pt(离线模型 1.4G
)
在本地部署
首先,我们到项目地址进行下载程序到本地。
项目地址: https://github.com/chidiwilliams/buzz/releases
在Windows中进行安装。
运行软件效果
下载离线模型(可选)
使用
首先双击Buzz.exe
,然后打开学习视频文件。
点击运行后,会自动下载对应的模型。
如果由于你的网络问题导致下载失败,可以下载离线模型到本地。然后复制到
C:Users逍遥子.cachewhisper
即可。(后台回复buzz
获取地址)
效果
在实际测试中,我们用1G的文件进行测试,由于不支持GPU加速,在CPU加持下,用时约30分钟。
完成之后,导出的字幕格式为srt
。翻译效率咱也不敢多问,也不敢多说。然后我们在播放器中外挂字幕就行了。这里我们以Potplayer
播放器为例。
总结
利用此款工具,我们可以方便的给视频添加字幕。并且识别率还是不错的。唯一的缺点是不支持实时翻译,并且不支持GPU的支持。当然如果您有更好的解决方案,可以分享给我们。
更多精彩文字 欢迎关注我们
防失联 关注我
原文始发于微信公众号(kali笔记):“学习”神器 基于Whisper模型的实时字幕工具BUZZ
免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论