关于 Buzz
Buzz 是一款可以自动识别语音为文本字幕的软件工具,基于 OpenAI 开源的 Whisper 自动语音识别模型,可以批量将音频或者是视频中的内容自动转化为带有时间的字幕,速度非常快,是一款能极大提高效率的生产力小工具。
Buzz 语音转文字工具的特点
高准确率:基于 OpenAI 开源的 Whisper 自动语音识别模型,这是一款非常强大的机器学习模型
转换速度快:Buzz 的模型都离线存在本地,转换过程无需联网,因此转换速度很快,适合批量转换语音
跨平台支持 Windows / macOs / Linux
不仅支持中文,也支持很多个国家的语言,还能将结果翻译,不过只能翻译成英文
Buzz 上手使用体验
ChatGPT 自今年初火爆以来,至今热度不止,不光是 ChatGPT,AI 内容和工具也非常火热。今年给大家推荐的这款效率软件,就是基于开发了 ChatGPT 的人工智能公司「 OpenAI」 开源的 Whisper 模型做的软件 Buzz,能高效地将视频和音频自动转化为文本。
初次打开 Buzz, 会把 AI 模型下载到本地,下载完成后所有的语音转录文字过程都在自己的电脑运行,转换速度很快。
上面都是抄来的,总之个人使用之后感觉确实不错,准确率高速度快,唯一的问题就是中文生成后都是繁体,这个问题还没找到解决方式。
git地址:https://github.com/chidiwilliams/buzz/releases/tag/v0.8.4
git下载较慢windows版本的我放到云盘了,地址:https://www.alipan.com/s/6rmDxG2JS3u
另外推荐一个文本转语言的在线网站,完全基于微软文本转语音接口。页面简洁,生成速度非常快。地址:https://www.text-to-speech.cn/