侧边栏壁纸
博主头像
枫叶实验室博主等级

小荷才露尖尖角, 早有蜻蜓立上头

  • 累计撰写 10 篇文章
  • 累计创建 30 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

Whisper语音转文字客户端vibe初体验

枫叶随想
2024-08-04 / 0 评论 / 0 点赞 / 302 阅读 / 3039 字
温馨提示:
部分素材来自网络,若不小心影响到您的利益,请联系我们删除

1 介绍

Whisper是ChatGPT母公司OpenAI发布的一个自动语音识别(ASR)系统。该系统基于从网络上收集的680,000小时的多语种和多任务监督数据进行训练,‌具有以多种语言转录以及从这些语言翻译成英语的功能。‌
Vibe是使用 OpenAI Whisper 离线转录音频/视频的客户端工具,支持全平台,UI简洁,功能强大
项目地址
https://github.com/thewh1teagle/vibe

vibe界面展示

居中的图片

2 安装

下载地址
https://github.com/thewh1teagle/vibe/releases/tag/v2.2.0

直接一键安装

3 使用

3.1 模型下载

左上角点击三个点即可进入设置界面

居中的图片

找到模型下载入口即可下载相应的模型,且支持最新的large-v3模型

支持的模型有

居中的图片

3.2 转换

选择目标转换文件,语言可选择自动检测,目前支持主流的几十种语言,且可以讲目标语言翻译为英语

居中的图片

点击开始转录,即可将语音或视频转换为SRTVTT​、TXT​​、HTMLPDFJSON等多种格式

效果展示

居中的图片
0

评论区