Whisper 从0安装教程 windows

这里写自定义目录标题

  • Whisper 从0安装教程 windows
    • 安装过程
      • 安装python3.11
      • 安装Anaconda
      • 在Anaconda里面安装whisper
      • 安装 ffmpeg
      • 第一次运行whisper
        • 检查GPU
    • 一些弯路

Whisper 从0安装教程 windows

因为需要把语音变成文字稿,问了做语言相关的朋友,决定使用whisper来做这个工作
官方网站:https://github.com/ggerganov/whisper.cpp
但是官网的教程一般小白很难从0开始。我一共折腾了两天,找了不少教程,走了两次弯路终于搞定了。

安装过程

安装python3.11

因为看到Anaconda官网上最新的版本是基于python3.11的,但是我自己电脑上的版本是python3.10,为了避免我这种不太会搞环境的人不装错,还是先卸载3.10,装上3.11

在这里插入图片描述
在这里下载3.11最新版本,之后双击安装。
在这里插入图片描述
安装完成之后能够在开始菜单看到新安装的python3.11.

安装Anaconda

ref:https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf
在Anaconda官网下载
在这里插入图片描述
下载后双击安装,记住Anaconda的安装路径
在这里插入图片描述
之后一路默认选项直到安装完毕。

在Anaconda里面安装whisper

打开anaconda prompt
在这里插入图片描述
要以管理员权限打开,否则会装不上whisper
conda create --name whisper python=3.11
在这里插入图片描述

安装 ffmpeg

conda activate whisper
pip install ffmpeg-python
ffmpeg -version
在这里插入图片描述
检查一下whisper是不是装好了
在这里插入图片描述

第一次运行whisper

去到语音文件在的路径下,运行whisper,然后发现GPU没用上。
在这里插入图片描述

检查GPU

在任务管理器中检查GPU型号,这里可以看到这个gpu是6BG的。
在这里插入图片描述

在这里插入图片描述
然后就是检查cuda版本。
在这里插入图片描述
这里cuda版本是12.2
在这里插入图片描述
但是pytorch官方只有cuda12.1的版本的对应版本。但是不要担心,直接用这个就行,cuda12.2 对cuda12.1向下兼容。(我试了把指令里的12.1,改成12.2,然后没找到这个版本的pytorch)
安装
在这里插入图片描述
Check 是否能用GPU
在这里插入图片描述
在这里插入图片描述
运行:
后面加 --model medium可以用中等的模型(需要GPU在5G及以上)

在这里插入图片描述
然后就可以了!
会生成对应的字幕文件和txt文件

好像还可以指定语言
whisper xxxxx.mp4 --model medium --language Chinese

一些弯路

中间我用到的教程有:
https://zhuanlan.zhihu.com/p/595691785
这个教程是装在系统中运行的,我一开始是想按照这个教程来装的,但是我后来在anaconda里面装了pytorch,感觉都在anaconda里面搞算了,毕竟装到系统里面还要改环境变量啥的很麻烦。

https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf
这个是anaconda里面pytorch的安装,写得非常详细,我基本就是照这个装的pytorch,但是我后来发现我把pytorch装在了base里面。。。。。第一次运行的whisper只能用cpu,用不了gpu

https://medium.com/@steel540/whisper-teach-article-90a68687b912
最后用了这个教程,在anaconda里面装好了运行。

一些走弯路的时候的截图:
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/127105.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【深度学习基础】从R-CNN到Fast R-CNN,再到MaskR-CNN,发展历程讲清楚!

📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨ 📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 📢:文章若有幸对你有帮助,可点赞 👍…

代码随想录第五十七天|● 392.判断子序列 ● 115.不同的子序列

392.判断子序列 题目: 给定字符串 s 和 t ,判断 s 是否为 t 的子序列。 字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"是&qu…

【ArcGIS微课1000例】0076:KMZ转换KML的方法

文章目录 ArcGIS转kmzkmz转kmlArcGIS转kmz ArcGIS可以很方便的将dwg,shp、等矢量数据转为kmz。 拓展阅读: 【ArcGIS微课1000例】0075:将AutoCAD(Dwg、Dxf)文件转换为shp、KML(kml、kmz)文件

Python之循环语句

循环普遍存在于日常生活中,同样,在程序中,循环功能也是至关重要的基础功能。 循环在程序中同判断一样,也是广泛存在的,是非常多功能实现的基础 while循环的基础语法 生活中的循环 程序中的循环 只要条件满足 会无限循…

React:JSX语法入门

JSX语法入门及代码 JSX是一种JavaScript的语法扩展,用于在React中描述用户界面的结构。它允许开发者使用类似HTML的语法来创建React元素,使得代码更具可读性和可维护性。JSX将HTML标签和JavaScript代码结合在一起,可以在其中使用JavaScript表…

企业应将三成AI预算用于管理安全风险

本周二,科大讯飞因AI内容安全事件导致股价暴跌,同时也给野蛮生长的生成式人工智能行业敲响了警钟。 今天,基于大语言模型的生成式人工智能的安全风险已经从担忧变成现实,黑客只需要通过一些“有毒内容”,或者发布几个恶…

【EI会议征稿】第四届生物信息学与智能计算国际学术研讨会(BIC 2024)

第四届生物信息学与智能计算国际学术研讨会(BIC 2024) 2024 4th International Conference on Bioinformatics and Intelligent Computing 2024年第四届生物信息学与智能计算国际学术研讨会 (BIC 2024)将定于2024年1月26-28日在…

循环神经网络 - RNN

循环神经网络(Rerrent Neural Network,RNN)是神经网络的一种,类似的还有深度神经网络(DNN)、卷积神经网路(CNN)、生成对抗网络(GAN)等。**RNN对具有时序特性的数据非常有成效,他能挖掘数据中的时…

OSPF复习(2)

目录 一、LSA的头部 二、6种类型的LSA(课堂演示) 1、type1-LSA:----重要且复杂 2、type2-LSA: 3、type3-LSA: 4、type4-LSA: 5、type5-LSA: 6、type7-LSA: 三、OSPF的网络类…

Linux配置自动拨号

编辑自动拨号脚本 在/home目录下新建文件ppp_auto.sh #!/bin/bashppp_user$1 password$2 eth$3[ -z "$ppp_user" ]&&{ echo "没有指定拨号账号..." echo "示例: $0 user password ethx" exit 0 }[ -z "$password" ]&&am…

【OpenCV实现图像:用Python生成图像特效,报错ValueError: too many values to unpack (expected 3)】

文章目录 概要读入图像改变单个通道黑白特效颜色反转将图像拆分成四个子部分 概要 Python是一种功能强大的编程语言,也是图像处理领域中常用的工具之一。通过使用Python的图像处理库(例如Pillow、OpenCV等),开发者可以实现各种各…

Emscripten + CMakeLists.txt 将 C++ 项目编译成 WebAssembly(.wasm)/js,并编译 Html 测试

背景:Web 端需要使用已有的 C 库(使用 CMake 编译),需要将 C 项目编译成 WebAssembly(.wasm) 供 js 调用。 上篇文章《Mac 上安装 Emscripten》 已讲解如何安装配置 Emscripten 环境。 本篇文章主要讲解如何将基于 CMakeLists 配…

SpringCloud(五) Eureka与Nacos的区别

SpringCloud(二) Eureka注册中心的使用-CSDN博客 SpringCloud(四) Nacos注册中心-CSDN博客 在这两篇博文中我们详细讲解了Eureka和Nacos分别作为微服务的注册中心的使用方法和注意事项,但是两者之间也有一些区别. 一, Nacos实例分类 Nacos实例分为两种类型: 临时实例:如果实例…

【QT】仿函数

函数调用运算符 () 也可以重载由于重载后使用的方式非常像函数的调用&#xff0c;因此称为仿函数仿函数没有固定写法&#xff0c;非常灵活 示例&#xff1a; #include <iostream> #include <string> using namespace std;class MyPrint { public://重载的运算符是…

力扣151.反转字符串中的单词

原题链接&#xff1a;力扣151.反转字符串中的单词 全代码&#xff1a; 需要复刷 class Solution { public:void reverse(string& s, int start, int end){ //翻转&#xff0c;区间写法&#xff1a;左闭右闭 []for (int i start, j end; i < j; i, j--) {swap(s[i],…

【数据结构与算法】排序二叉树的创建节点的添加和删除(附代码实现与代码讲解)

首先来了解下排序二叉树的基本概念 排序二叉树&#xff1a;任意一个根节点&#xff0c;比他的左子树中的任意节点都大&#xff0c;比他的右子树中的任意节点都小 比如下面的这个树就是排序二叉树 OK&#xff0c;在了解了这个基本概念之后&#xff0c;就可以去看下面的代码了 …

【Linux】关于Nginx的详细使用,部署项目

前言&#xff1a; 今天小编给大家带来的是关于Nginx的详细使用&#xff0c;部署项目&#xff0c;希望可以给正在学习&#xff0c;工作的你带来有效的帮助&#xff01; 一&#xff0c;Nginx简介 Nginx是一个高性能的开源Web服务器和反向代理服务器。它最初由Igor Sysoev在2004年…

Linux开机、重启、关机和用户登录注销

1.【关机】 shutdown shutdown now 表示立即关机 shutdown -h now 表示立即关机 shutdown -h 1 表示1分钟后关机 halt 用来关闭正在运行的Linux操作系统 2.【重启】 shutdown -r now 表示立即重启 reboot 重启系统 sync …

Spring - 提供 IOC 容器实现的两种方式

BeanFactory&#xff1a; BeanFactory是Spring的IOC容器的基本实现&#xff0c;它是一个接口&#xff0c;提供了IOC容器的基本功能。BeanFactory在加载配置文件时不会立即创建对象&#xff0c;而是在需要时&#xff08;延迟初始化&#xff09;才会创建对象。通常BeanFactory在S…

OceanBase:01-单机部署(开发环境)

目录 一、体系架构 二、配置要求 三、解压安装包 四、执行安装 五、配置环境变量 六、快速部署 七、访问数据库 OceanBase 数据库&#xff08;OceanBase Database&#xff09;是一款蚂蚁集团完全自研的企业级原生分布式数据库&#xff0c;在普通硬件上实现金融级高可用&…