20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)

20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结
2024/1/22 19:52


结论:这个软件如果是习作,可以打101分,功能都实现了。
如果作为商业软件/共享软件,在易用性等方面,可能就只能有70分了。
【百分制】


可选的改进部分:
0、支持INTEL/AMD/ATI的显卡。并且给NVIDIA的显卡自动安装最新的驱动程序和CUDA版本!【对初学者友好!】
1、待转换的音频/视频目录:【中文路径/长目录】对特殊字符的支持
2、(识别)翻译成:语言可以按照拼音顺序排序。当然汉语/简体中文/普通话是可以放到最前面的!
3、计算精度,只列出来所支持的精度,并给出估计的识别时间!
4、打开输出目录。我第一次识别完成在会后就把 识别结果 这个目录剪切走了。
结果下一次识别的时候找不到 识别结果 这个目录,直接退出了!半小时白花了。
如果找到 识别结果 这个目录,可以直接新建的呀!
H:\BaiduNetdiskDownload\音视频转文字字幕小工具\识别结果
5、由于whisper体积庞大,文件众多,导致程序比较凌乱。实际上,根目录下只需要有这两个目录:whisper和 识别结果。

whisper
识别结果


缘起:为了使用openai的whisper识别小语种【非英语】电影的字幕,决定开始折腾CUDA了!
https://github.com/openai/whisper
https://www.bilibili.com/video/BV1d34y1F7qA
https://www.bilibili.com/video/BV1d34y1F7qA/?p=4&vd_source=4a6b675fa22dfa306da59f67b1f22616


1、待转换的音频/视频目录:c:/temp
测试发现只支持英文+数字目录。
【不要使用中文路径/长目录】


2、调用设备:显卡/CPU
你就找一片NVIDIA的CPU吧。
手头紧可以考虑二手:拼多多/淘宝


3、模型:whisper-large-v3就可以了。
不需要特别选择V2版本。


4、计算精度:
float16  不支持x
int8  支持
int8_float16  不支持x
int8_bfloat16  不支持x
bfloat16  不支持x

int8_float32  支持
int16  不支持x
float32  支持

int8_float32  支持【显存占用大概30%?】

float32  支持【显存占用几乎100%,几乎8GB全部占用了!】


5、版权;
由于内核是OpenAI所开源的【whisper】,收费就呵呵了!^_
不过whisper没有UI界面?
有人花时间整理出来,收点小钱¥也不是那么不可以接受的!
有能力的同学可以适当打赏点吧!


参考资料:
https://blog.csdn.net/weixin_42074867/article/details/90046478
win10 GTX1080配置Python CUDA、CUDNN支持

https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/cuda-toolkit-archive
CUDA Toolkit Archive

https://developer.nvidia.com/cuda-12-0-0-download-archive
CUDA Toolkit 12.0.0 (December 2022), Versioned Online Documentation

安装好就可以运行 音|视频转文字|字幕小工具V1.2【openai的whisper】


百度:WIN10 进入安全模式
https://baijiahao.baidu.com/s?id=1773719082166223864&wfr=spider&for=pc
Win10系统电脑进入安全模式的四种方法,让你轻松应对各种问题

方法一:通过强制关机进入自动修复界面
1.当电脑启动时,在Win10启动logo界面按住电源键强制关机,重复此操作三次。


http://www.baike6.com/b385814.html
电脑win10无法正常开机怎么办


https://www.jb51.net/os/win10/811307.html
win10怎么进安全模式 win10系统8种进安全模式方法

https://www.laomaotao.net/more/2023/0728/11528.html
Win10你的电脑未能启动的有效修复方法


https://www.xitongzhijia.net/xtjc/20230221/279941.html
电脑未正确启动怎么办?六种方法解决!(Win10/Win11通用)


https://www.microsoft.com/zh-cn/software-download/windows10
下载 Windows 10

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/640742.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2017年认证杯SPSSPRO杯数学建模A题(第二阶段)安全的后视镜全过程文档及程序

2017年认证杯SPSSPRO杯数学建模 A题 安全的后视镜 原题再现: 汽车后视镜的视野对行车安全非常重要。一般来说,汽车的后视镜需要有良好的视野范围,以便驾驶员能够全面地了解车后方的道路情况。同时,后视镜也要使图像的畸变尽可能…

Centos升级gcc版本

步骤1:查看当前服务器gcc版本 gcc –version 步骤2:查看当前gcc安装目录 find / -name gcc cd /usr/bin ll gcc* 因为gcc,g,c都是配套的,查找出 g和c的原版本位置 步骤3:安装下载依赖包 yum install glibc-heade…

yolov8 opencv dnn部署 github代码

源码地址 本人使用的opencv c github代码,代码作者非本人 实现推理源码中作者的yolov8s.onnx 推理条件 windows 10 Visual Studio 2019 Nvidia GeForce GTX 1070 opencv4.7.0 (opencv4.5.5在别的地方看到不支持yolov8的推理,所以只使用opencv4.7.0) c部署 环境…

竞赛保研 机器视觉目标检测 - opencv 深度学习

文章目录 0 前言2 目标检测概念3 目标分类、定位、检测示例4 传统目标检测5 两类目标检测算法5.1 相关研究5.1.1 选择性搜索5.1.2 OverFeat 5.2 基于区域提名的方法5.2.1 R-CNN5.2.2 SPP-net5.2.3 Fast R-CNN 5.3 端到端的方法YOLOSSD 6 人体检测结果7 最后 0 前言 &#x1f5…

Maven《四》-- 基于Idea进行Maven工程构建

目录 🐶4.1 构建概念和构建过程 🐶4.2 命令方式项目构建 1. 🥙编译:mvn compile 2. 🥙清理:mvn clean 3. 🥙打包:mvn package 4. 🥙安装:mvn install …

泰迪科技最新大数据法律监督模型解决方案

大数据法律监督平台是基于监督数据整合管理平台、监督模型构建平台、内置模型库以及法律监督线索管理平台打造的一套服务于检察机关法律监督工作的专业化系统。通过数据采集、融合、挖掘、建模、展现等一系列能力,辅助检察官从纷繁复杂的数据中,开展多维…

java遍历(for和forEach)

1.dade文件 package model;public class dade {private int id;private String name;public dade() {}public dade(int id, String name) {this.id id;this.name name;}public int getId() {return id;}public void setId(int id) {this.id id;}public String getName() {r…

Python中的函数(二)

1 闭包与装饰器 1.1 闭包 闭包(Closure)是指在一个函数内部定义的函数,并且该内部函数可以访问外部函数作用域中的变量。闭包可以在外部函数执行完毕后,仍然保持对外部函数作用域的引用,从而可以继续访问和操作外部函…

【Java】--网络编程:基于TCP协议的网络通信

【Java】–网络编程:基于TCP协议的网络通信 文章目录 【Java】--网络编程:基于TCP协议的网络通信一、TCP协议1.1 概念1.2 三次握手1.2.1 文字描述1.2.2 画图演示 1.3 四次挥手1.3.1 文字描述1.3.2 画图演示 二、基于TCP的Socket网络编程2.1 概念2.2 服务…

Kafka-服务端-网络层

Reactor模式 Kafka网络层采用的是Reactor模式,是一种基于事件驱动的模式。熟悉Java编程应该了解JavaNIO提供了实现Reactor模式的API。常见的单线程Java NIO的编程模式如图所示。 为了满足高并发的需求,也为了充分利用服务器的资源,服务端需要…

中间件存储设计 - 数组与链表

文章目录 数组ArrayListLinkedListHashMap小结 中间件主要包括如下三方面的基础:数据结构、JUC 和 Netty,接下来,我们先讲数据结构。 数据结构主要解决的是数据的存储方式问题,是程序设计的基座。 按照重要性和复杂程度&#xf…

Python fork方法:创建新进程

除可以进行多线程编程之外,Python 还支持使用多进程来实现并发编程。 Python 的 os 模块提供了一个 fork() 方法,该方法可以 fork 出来一个子进程。简单来说,fork() 方法的作用在于,程序会启动两个进程(一个是父进程&…

《WebKit 技术内幕》学习之十(1): 插件与JavaScript扩展

虽然目前的浏览器的功能很强 ,但仍然有其局限性。早期的浏览器能力十分有限,Web前端开发者希望能够通过一定的机制来扩展浏览器的能力。早期的方法就是插件机制,现在流行次啊用混合编程(Hybird Programming)模式。插件…

大模型实战营 Day5作业

基础作业: 使用 LMDeploy 以本地对话、网页Gradio、API服务中的一种方式部署 InternLM-Chat-7B 模型,生成 300 字的小故事(需截图) TurboMind 推理命令行本地对话 lmdeploy chat turbomind /share/temp/model_repos/internlm-cha…

RK3568平台 TinyAlsa集成第三方音频算法

一.tinyalsa介绍 ALSA(Advanced Linux Sound Architecture)是一个开源项目,涵盖了用户空间和内核空间对音频设备的操作接口,通过应用层使用alsalib可以实现对音频设备的控制 TinyAlsa是android推出的一个精简的ALSA库&#xff0c…

【教程】npm的时候ssh报错ssh://git@github.com/frozeman/bignumber.js-nolookahead.git

问题: fiscoubuntu:~/fisco/benchmarks$ npm install install web30.20.7 npm ERR! code 128 npm ERR! An unknown git error occurred npm ERR! command git --no-replace-objects ls-remote ssh://gitgithub.com/frozeman/bignumber.js-nolookahead.git npm ERR! …

Spring Cloud 系列:Seata 中TCC模式具体实现

概述 https://seata.io/zh-cn/docs/dev/mode/tcc-mode https://seata.io/zh-cn/docs/user/mode/tcc TCC模式与AT模式非常相似,每阶段都是独立事务,不同的是TCC通过人工编码来实现数据恢复。需要实现三个方法: Try:资源的检测和…

第4章-IP基本原理

目录 1. IP协议概述 1.1. 定义 1.2. 功能 1.3. IP网络的结构 1.4. IP头格式 2. IP地址和地址映射 3. IP包转发 4. 其他相关协议介绍 1. IP协议概述 1.1. 定义 IP协议:IP协议是网际互连协议; 工作层次:网络层; 封装&#…

dubbo:服务暴露

节点角色说明: Provider:暴露服务的服务提供方。 Consumer::调用远程服务的服务消费方。 Registry:服务注册与发现的注册中心。 Monitor:统计服务的调用次调和调用时间的监控中心。 Container:服务运行容器。 调用关系说明: 0.服务容器负责启动&#xff…

HTML+JavaScript-03

JavaScript函数 定义函数的格式 JavaScript 函数是通过 function 关键词定义的。 function sum(a, b){//函数体return a b;//返回值为a、b的和 }函数的调用 调用函数时直接书写函数名即可 function show(){alert("函数show被调用"); } show();函数的相互调用 …