1 介绍
Whisper是ChatGPT母公司OpenAI发布的一个自动语音识别(ASR)系统。该系统基于从网络上收集的680,000小时的多语种和多任务监督数据进行训练,具有以多种语言转录以及从这些语言翻译成英语的功能。
Vibe是使用 OpenAI Whisper 离线转录音频/视频的客户端工具,支持全平台,UI简洁,功能强大
项目地址
https://github.com/thewh1teagle/vibe
vibe界面展示
2 安装
下载地址
https://github.com/thewh1teagle/vibe/releases/tag/v2.2.0
直接一键安装
3 使用
3.1 模型下载
左上角点击三个点即可进入设置界面
找到模型下载入口即可下载相应的模型,且支持最新的
large-v3
模型
支持的模型有
3.2 转换
选择目标转换文件,语言可选择自动检测,目前支持主流的几十种语言,且可以讲目标语言翻译为英语
点击开始转录,即可将语音或视频转换为
SRT
、VTT
、TXT
、HTML
、JSON
等多种格式
效果展示
评论区