免费自助建站网站一览/成都seo网络优化公司

免费自助建站网站一览,成都seo网络优化公司,2019为赌博网站做代理被判缓刑,安徽建站管理系统开发上篇文章阿虚分享了自己的「短视频」笔记方案 短视频文件小,易存储,所以阿虚建议是直接将原视频插入到笔记当中 而长视频文件大,很难像短视频一样操作。阿虚之前的建议是提取重要部分视频转长截图,或者视频转GIF 但上述方案仔细…

上篇文章阿虚分享了自己的「短视频」笔记方案

短视频文件小,易存储,所以阿虚建议是直接将原视频插入到笔记当中

而长视频文件大,很难像短视频一样操作。阿虚之前的建议是提取重要部分视频转长截图,或者视频转GIF

但上述方案仔细思考,其实只适用于精记录


▲泛阅读

阿虚后来在实践中,发现我更多时候是需要泛记录——即我经常会去B站、抖音、小红书等找视频评测,我主要需要的是「结论」和具体「推荐某产品的原因」

由于每次研究可能都会查看、下载大量评测视频,这就导致精记录的方案不太实用了,太费时间!🤨

于是阿虚对于需要泛记录的视频,采取的主要方案是——视频转文字,记录全文

1 CapsWriter Offline

当然,视频转文字在现在并不是什么稀奇事,阿虚之前就已经分享过很多免费工具了

也包括基于 OpenAI 训练出来的 Whisper 语音识别模型而开发的 WhisperDesktop、Buzz 这类桌面客户端💻

但使用客户端免不了多次鼠标点击,再加上此前推荐的 WhisperDesktop、Buzz 效率并不是很高,说白了就是整个转换流程挺费时间的

而阿里开源语音识别工具 FunASR 的出现,让整个中文语音识别革命性的进化了 ❗ ❗ ❗

不仅识别准确,最关键是识别速度极快,应该是目前中文语音识别领域速度最快!30 分钟的视频转为文字大概只需要 15 秒!

而让 FunASR 更简单易用,又得多谢 HaujetZhao 大佬开发的 CapsWriter Offline 项目:https://github.com/HaujetZhao/CapsWriter-Offline

这个项目原本是作者开发的一个 PC 端离线语音输入工具,帮大家解决了语音识别模型+标点符号添加模型调用的问题,即也算是有了可视化的软件界面

但就算这样,这个软件的使用也略显麻烦、费时:

  1. 需要先运行 start_server.exe 加载服务端(其会载入语音识别和添加标点模型,共占用约 2GB 内存),视个人电脑情况,一般加载需要20多秒
  2. 然后需要运行 start_client.exe 客户端才能看到下图软件界面,然后拖入音频、视频才能实现快速转文字(服务端只需启动一次,后续不必再等待20多秒)

但这个项目好就好在,软件的实际使用中,客户端不是必要的,启动服务端之后我们可以直接通过命令行来调用软件——这也是阿虚能借机发挥的原因😏

阿虚在原有软件的基础上:略微修改了原项目代码,另外用 AHK 写了一个辅助小程序,然后再写了一个增删右键菜单的小脚本

⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️

软件下载地址,微信内打开文章见置顶留言:一键视频转文字!本地、在线视频均支持,离线模型免费无限可用

⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️

在阿虚改善之后, CapsWriter Offline 便可能算的上当今最简单易用的 Windows 语音识别工具了!

在阿虚改善之后, CapsWriter Offline 便可能算的上当今最简单易用的 Windows 语音识别工具了!💪

  1. WIN10以上电脑可用,软件无需安装,解压即用
  2. 解压出来,双击运行 .bat 文件即可添加/删除右键菜单
  3. 随后就能如下图这样,在常见音频、视频文件上,直接右键使用了

不过这里需要特别说明一下:

  • 右键执行后,软件全程会静默执行,即前台不会有任何界面弹窗!耐心等待 20 多秒加载模型文件,再耐心等待10多20秒(视处理视频时长),就能完成文件处理,在源视频同目录下生成转换好的 txt 文本文件
  • 同时在每次使用过程中,只有处理的第一个视频需要等待 20 多秒加载模型,后续则均是直接开始处理视频文件
  • 另外由于软件服务端在后台会占用约 2GB 系统内存,如果后续不需要继续处理视频,可以通过右键系统托盘图标来退出后台服务端
  • CapsWriter 基于 FunASR 模型,所以只支持处理中、英两种语言!

实际使用效果就如下图,全程除了略需等待(转换多个视频也就第一个需要多等待20多秒),整个转换操作几乎无感

拿到视频的 txt 文字稿之后,再贴上视频链接,辅以重点视频片段截图,于是乎就能像阿虚下图这样,很快速的完成一篇涵盖多个视频内容的评测视频调研笔记了~🧐

2 ContextSearch

本地视频语音识别转文字问题基本已完美解决

但阿虚后续实际做视频笔记时候发现:我还是得先用 IDM 或者专用下载器,将视频下载到本地之后,多次点击找到视频所在文件夹,再右键进行转换——就还是有挺多步骤、不够优雅


▲还不够优雅~

还有没有办法省下多次键盘鼠标操作,一键完成在线视频转文字呢?

这里终于又可以搬出阿虚之前就大力推荐过的浏览器扩展了——ContextSearch

ContextSearch 是一款能实现在网页上一键调用命令行工具的扩展

考虑到文章篇幅,ContextSearch 的前期安装与配置这里就略过,请各位去复习上述文章👆

光有 ContextSearch 还不够,我们还得辅以开源下载神器 yt-dlp:https://github.com/yt-dlp/yt-dlp

yt-dlp 是一个功能丰富的命令行音频/视频下载器,支持数千个网站解析下载,B站、小红书、微博、知乎等常见视频平台都支持一键下载(注:目前不支持抖音)

2.1 使用效果

有了 ContextSearch+yt-dlp 的体验如何呢?

如下图,仅需在想要转文字的视频上右键,短一点的视频,10多秒即可完成视频转文字,并将结果复制到剪贴~

至此,对于 B站等网站的在线视频一键转文字体验可谓完美~

2.2 配置方法

那想要实现上图效果如何配置呢?

也不算复杂,首先我们打开 yt-dlp 项目官网,下载最新的 yt-dlp.exe 文件:https://github.com/yt-dlp/yt-dlp/releases

如果你访问Github困难,建议了解《Github加速访问教程》

然后,如果你之前学习过阿虚的任意WIN+R 使用教程(👈点击即可查看),配置过快速启动文件夹到系统环境,那就只需要把下载到的 yt-dlp.exe 扔进你的快速启动文件夹即可

不过,就算你目前完全不懂 WIN+R,也只需按下述操作即可轻松用上今天分享的工具

首先是按下键盘上的 WIN+R 键打开运行窗口

然后在英文输入法状态下输入一个 .(或者%USERPROFiiE%),然后回车,进入你的电脑用户目录

将上面获取的 yt-dlp.exe 文件放到打开的文件夹里面,也是可以的

然后我们打开 ContextSearch 的扩展选项,新建一个应用启动器,按下图进行配置即可(ContextSearch 配置教程点击这里查看)

特别注意,荧光黄处需要自行替换为你 CapsWriter 文件所在路径**(注:这部分代码借用了隔壁@奔跑中的奶酪)**:

tasklist /FI "IMAGENAME eq start_server.exe" 2>NUL | find /I /N "start_server.exe" >NUL || explorer "C:\Portable\CapsWriter\start_server.exe" & start "" cmd /c yt-dlp --output "../../../Downloads/Video/%(title)s.%(ext)s" --merge-output-format mp4 --no-mtime --exec "C:\Portable\CapsWriter\start_client.exe" "{searchTerms}"

最后再说明一下,通过上述代码实际执行的操作是:

  1. 先调用 yt-dlp 解析下载视频到系统 Downloads 文件夹中的 Video 文件夹
  2. 然后再调用 CapsWriter 语音识别下载好的视频文件,转为文字,内容存储在 txt 文件中

所以,如果你后续不需要这些下载好的视频、处理好的文本文件,需自行打开文件夹删除!

如果大家对阿虚的笔记方案感兴趣,相关文章我已经都整理到储物间(axutongxue.ysepan.com)8-2栏了,大家可以自行学习

当然,我只能给大家分享工具,提升效率

最关键的,还是要自己动手记录!

视频收藏了,不等于看过了

只有自己整理,记录了,它才真正属于你

希望大家保持记录,永远在学习的路上!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/893474.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++】详细讲解继承(上)

C面向对象的三大特性:封装,继承,多态。现在我们就介绍一下继承。 1.继承的概念及定义 1.1 继承的概念 继承机制是⾯向对象程序设计使代码可以 复⽤ 的最重要的⼿段。我们前面接触到的都是 函数 层次的复用,遇到过的 类 层次的复…

AIGC专栏18——EasyAnimateV5.1版本详解 应用Qwen2 VL作为文本编码器,支持轨迹控制与相机镜头控制

AIGC专栏18——EasyAnimateV5.1版本详解 应用Qwen2 VL作为文本编码器,支持轨迹控制与相机镜头控制 学习前言相关地址汇总源码下载地址HF测试链接MS测试链接 测试效果Image to VideoText to Video轨迹控制镜头控制 EasyAnimate详解技术储备Qwen2 VLStable Diffusion …

1905电影网中国地区电影数据分析(一) - 数据采集、清洗与存储

文章目录 前言一、数据采集步骤及python库使用版本1. python库使用版本2. 数据采集步骤 二、数据采集网页分析1. 分析采集的字段和URL1.1 分析要爬取的数据字段1.2 分析每部电影的URL1.2 分析每页的URL 2. 字段元素标签定位 三、数据采集代码实现1. 爬取1905电影网分类信息2. 爬…

【25】Word:林涵-科普文章❗

目录 题目​ NO1.2.3 NO4.5.6 NO7.8 NO9.10 NO11.12 不连续选择:按住ctrl按键,不连续选择连续选择:按住shift按键,选择第一个,选择最后一个。中间部分全部被选择 题目 NO1.2.3 布局→纸张方向:横向…

P6周:VGG-16算法-Pytorch实现人脸识别

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者:K同学啊 我的环境 语言环境:Python 3.8.12 编译器:jupyter notebook 深度学习环境:torch 1.12.0cu113 一、前期准备 1.设置GPU im…

【Rust自学】14.4. 发布crate到crates.io

喜欢的话别忘了点赞、收藏加关注哦(加关注即可阅读全文),对接下来的教程有兴趣的可以关注专栏。谢谢喵!(・ω・) 14.4.1. 创建并设置crates.io账号 在发布任何 crate 之前,你需要在 crates.io并…

数据结构——实验八·学生管理系统

嗨~~欢迎来到Tubishu的博客🌸如果你也是一名在校大学生,正在寻找各种编程资源,那么你就来对地方啦🌟 Tubishu是一名计算机本科生,会不定期整理和分享学习中的优质资源,希望能为你的编程之路添砖加瓦⭐&…

IBM湖仓一体与向量数据库:访问MinIO控制台(Accessing the MinIO console)

_1、从密钥中复制S3凭证并保存 (Copy the S3 credentials from the secret and save it ) oc extract secret/ibm-lh-config-secret -n ${PROJECT_CPD_INST_OPERANDS} --to- --keysenv.properties | grep -E "LH_S3_ACCESS_KEY|LH_S3_SECRET_KEY&q…

Ragas-RAG能力评测

Ragas是一个框架,它可以帮助你从不同的方面评估你的问答(QA)流程。它为你提供了一些指标来评估你的问答系统的不同方面,具体包括: 评估检索(context)的指标:提供了上下文相关性&…

基于ESP32-IDF驱动GPIO输出控制LED

基于ESP32-IDF驱动GPIO输出控制LED 文章目录 基于ESP32-IDF驱动GPIO输出控制LED一、点亮LED3.1 LED电路3.2 配置GPIO函数gpio_config()原型和头文件3.3 设置GPIO引脚电平状态函数gpio_set_level()原型和头文件3.4 代码实现并编译烧录 一、点亮LED 3.1 LED电路 可以看到&#x…

使用ffmpeg提高mp4压缩比,减小文件体积【windows+ffmpeg+batch脚本】

文章目录 关于前情提要FFmpeg是什么使用脚本运行FFmpeg首先,下载ffmpeg.exe然后在视频相同位置写一个bat脚本运行压缩脚本 关于 个人博客,里面偶尔更新,最近比较忙。发一些总结的帖子和思考。 江湖有缘相见🤝。如果读者想和我交…

Vue3初学之Element Plus Dialog对话框,Message组件,MessageBox组件

Dialog的使用&#xff1a; 控制弹窗的显示和隐藏 <template><div><el-button click"dialogVisible true">打开弹窗</el-button><el-dialogv-model"dialogVisible"title"提示"width"30%":before-close&qu…

自然语言处理(NLP)-总览图学习

文章目录 自然语言处理&#xff08;NLP&#xff09;-总览图学习1.一张总览图的学习1. 语音学&#xff08;Phonology&#xff09;2. 形态学&#xff08;Morphology&#xff09;3. 句法学&#xff08;Syntax&#xff09;4. 语义学&#xff08;Semantics&#xff09;5. 推理&#…

机器学习 vs 深度学习

目录 一、机器学习 1、实现原理 2、实施方法 二、深度学习 1、与机器学习的联系与区别 2、神经网络的历史发展 3、神经网络的基本概念 一、机器学习 1、实现原理 训练&#xff08;归纳&#xff09;和预测&#xff08;演绎&#xff09; 归纳: 从具体案例中抽象一般规律…

谈谈RTMP|RTSP播放器视频view垂直|水平反转和旋转设计

技术背景 我们在做RTMP|RTSP播放器的时候&#xff0c;有这样的技术诉求&#xff0c;有的摄像头出来的数据是有角度偏差的&#xff0c;比如“装倒了”&#xff0c;或者&#xff0c;图像存在上下或者左右反转&#xff0c;这时候&#xff0c;就需要播放器能做响应的处理&#xff…

论文阅读--Qwen22.5技术报告

Qwen2 1 引言 所有模型都是在超过7 trillion token&#xff08;7万亿&#xff09;的高质量、大规模数据集上预训练的 2 Tokenizer & Model 2.1 Tokenizer 沿用Qwen&#xff08;Bai等人&#xff0c;2023a&#xff09;的做法&#xff0c;我们采用了基于字节级字节对编码…

FPGA中场战事

2023年10月3日,英特尔宣布由桑德拉里维拉(Sandra Rivera)担任“分拆”后独立运营的可编程事业部首席执行官。 从数据中心和人工智能(DCAI)部门总经理,转身为执掌该业务的CEO,对她取得像AMD掌门人苏姿丰博士类似的成功,无疑抱以厚望。 十年前,英特尔花费167亿美元真金白银…

【jmeter】下载及使用教程【mac】

1.安装java 打开 Java 官方下载网站https://www.oracle.com/java/technologies/downloads/选择您想要下载的 Java 版本&#xff0c;下载以 .dmg 结尾的安装包&#xff0c;注意 JMeter 需要 Java 8下载后打开安装包点击“安装”按钮即可 2.下载jmeter 打开 Apache JMeter 官方…

postman请求参数化

postman界面介绍 一、使用环境变量(Environment Variables)进行参数化 1、在请求中使用环境变量 在请求的url、请求头(Headers)、请求体(Body)等部分都可以使用环境变量。 URL 部分示例 点击 Postman 界面右上角的 “眼睛” 图标(Environment Quick Look)打开环境管理…

2024年博客之星年度评选|第一步——创作影响力评审入围Top300名单 | 博客之星陪跑指南

2024年博客之星年度评选&#xff5c;第一步——创作影响力评审入围Top300名单 | 博客之星陪跑指南 2024年博客之星年度评选正在如火如荼地进行中&#xff01;作为博客圈最具影响力的评选活动之一&#xff0c;今年的评选吸引了众多优秀博主的参与。现在&#xff0c;距离Top300入…