【声音转文字CapsWriter】声音随时转化为文字,CapsWriter提高工作效率

文章目录

    • 前言
    • 1. 软件与模型下载
    • 2. 本地使用测试
    • 3. 异地远程使用
      • 3.1 内网穿透工具下载安装
      • 3.2 配置公网地址
      • 3.3 修改config文件
      • 3.4 异地远程访问服务端
    • 4. 配置固定公网地址
      • 4.1 修改config文件
    • 5. 固定tcp公网地址远程访问服务端

前言

今天我要给大家安利一个神器——CapsWriter-Offline。这款工具可以用声音搞定所有文字输入的工作,绝对是一个不可错过的宝藏应用!它不仅能让你的语音瞬间变成文字,还能通过结合cpolar内网穿透技术实现远程访问和使用其强大的功能。

无论是整理会议录音、进行高效的聊天输入,还是处理其他复杂的文本转换任务,CapsWriter-Offline都能轻松应对。而且最重要的是,它的操作非常简单,上手几乎零门槛!

接下来的内容中,我会详细介绍如何在Windows系统中安装并使用这款工具,并且告诉你一些实用的小技巧和注意事项。相信我,掌握了这些方法后,你的工作效率将会有质的飞跃!

image-20240910164231263

1. 软件与模型下载

本例演示环境为Windows11,另外需要准备一个麦克风。

首先,我们需要下载CapsWriter-Offline的64位版本,可以使用服务端、客户端。然后需要下载models.zip模型文件。

下载地址:Releases · HaujetZhao/CapsWriter-Offline (github.com)

image-20240910164525004

将软件和模型下载好后进行解压,然后将解压好的模型文件夹models复制到解压好的CapsWriter-Offline的文件夹中并替换原有的同名文件夹。

image-20240910164649325

2. 本地使用测试

现在我们首先双击打开服务端(start_server),会弹出窗口对模型进行加载,加载完成后会提示开始服务:

image-20240910164924307

这时我们在双击打开客户端(start_client),会弹出窗口连接服务端并检测音频输入设备:

image-20240910165106716

显示连接成功即可开始使用了。

软件在Windows系统中默认使用大小写切换键caps lock进行语音输入(可以在配置文件中进行修改),一直按住说话,松手即可识别语音并在聊天软件对话窗口等界面进行输出:

image-20240910165630286

可以看到对语音的识别非常准确,连标点符号也是。

除了支持无限时长语音的转写,作者在更新后,软件现在还支持文件转录字幕。即在客户端可以转写音视频文件为 srt 字幕了,只需将音视频文件拖动到客户端 exe 上打开即可。大家感兴趣的话,可以自行尝试。

3. 异地远程使用

此时,我们已经可以在本地的Windows系统电脑中使用CapsWriter-Offline进行语音转文字了,但也仅能在本地局域网中的设备上使用,如果想在异地也能远程使用在本地部署的工具应该怎么办呢?

很简单,只要在本地电脑上安装一个cpolar内网穿透工具就能轻松实现公网环境远程访问内网部署的服务了,无需公网IP,也不用设置路由器那么麻烦,接下来就介绍一下如何安装cpolar内网穿透!

3.1 内网穿透工具下载安装

安装cpolar步骤:

Cpolar官网地址: https://www.cpolar.com

点击进入cpolar官网,点击免费使用注册一个账号,并下载最新版本的Cpolar

img

登录成功后,点击下载Cpolar到本地并安装(一路默认安装即可)本教程选择下载Windows版本。

image-20240319175308664

Cpolar安装成功后,在浏览器上访问http://localhost:9200,使用cpolar账号登录,登录后即可看到Cpolar web 配置界面,结下来在web 管理界面配置即可。

img

3.2 配置公网地址

接下来配置一下修改CapsWriter-Offline客户端文件需要用到的公网地址,

登录后,点击左侧仪表盘的隧道管理——创建隧道,

创建一个 CapsWriter-Offline 的公网TCP地址隧道

  • 隧道名称:可自定义命名,本例中使用123
  • 协议:选择tcp
  • 本地地址:6016
  • 端口类型:选择随机临时TCP端口
  • 地区:选择China VIP

点击创建

image-20240910170829126

隧道创建成功后,点击左侧的状态——在线隧道列表,查看所生成的公网访问地址,可以看到生成了tcp公网地址,复制即可。

image-20240910172519802

3.3 修改config文件

现在我们可以在异地使用另一台Windows系统电脑,下载好CapsWriter-Offline软件(无需下载模型文件)。

进入CapsWriter-Offline文件夹,使用vscode打开config文件对客户端配置进行修改:

image-20240910171815011

我们需要对客户端配置中的地址和端口进行修改,使用刚才cpolar生成的公网地址7.tcp.vip.cpolar.cn替换127.0.0.1,使用公网地址后的端口10906替换6016,保存文件即可。

image-20240910172026442

1725960417305

3.4 异地远程访问服务端

在本地电脑服务端(start_server)运行的前提下,现在使用这台异地电脑双击打开客户端(start_client),可以看到通过使用cpolar生成的公网地址异地也能远程访问本地服务端,使用它进行语音转文字啦!

image-20240910173355703

小结

如果我们需要经常异地远程访问本地配置的服务,由于刚才创建的是随机的公网地址,24小时会发生变化。可以把地址设置成固定的TCP地址,不仅能够享受更多功能和更快的带宽,而且不用每次都重新创建隧道来访问,下面演示一下如何创建一个固定的tcp公网地址来解决这个问题。

4. 配置固定公网地址

我们接下来为CapsWriter-Offline配置固定的TCP公网地址,该地址不会变化,方便查看且无需每天重复修改访问地址。

登录cpolar官网,点击左侧的预留,选择保留的TCP地址,地区选择China VIP,填写一个备注(自己能记住就行)点击保留

image-20240910173831545

保留成功后复制这个tcp地址:

image-20240910173928682

返回登录Cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道:123,点击右侧的编辑:

image-20240910174033107

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 端口类型:选择固定TCP端口
  • 预留的TCP地址:填写刚才保留成功的tcp地址:3.tcp.vip.cpolar.cn:12635

点击更新(注意,点击一次更新即可,不需要重复提交)

image-20240910174221000

4.1 修改config文件

然后我们需要再次对客户端配置中的地址和端口进行修改,使用刚才配置的固定tcp公网地址3.tcp.vip.cpolar.cn替换7.tcp.vip.cpolar.cn,使用固定公网地址后的端口12635替换10906,保存文件即可。

image-20240910174459160

5. 固定tcp公网地址远程访问服务端

同样在本地电脑服务端(start_server)运行的前提下,现在使用这台异地电脑双击打开客户端(start_client),现在就可以通过使用cpolar配置的固定tcp公网地址远程访问本地服务端使用它进行语音转文字啦!不用每天修改公网地址,也能获得更快的访问速度。

891e7db64b7693d85f1ae5d0e056ef7

希望这篇文章能帮助你更好地了解CapsWriter-Offline的强大功能以及它与cpolar内网穿透技术结合后的无限可能。如果你对这款工具感兴趣或者有任何疑问,欢迎在评论区留言交流哦!别忘了分享给你的朋友们,让他们也一起来体验这种高效便捷的工作方式吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/894792.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

十二、Docker Compose 部署 SpringCloudAlibaba 微服务

一、部署基础服务 0、项目部署结构 项目目录结构如下: /home/zhzl_hebei/ ├── docker-compose.yml └── geochance-auth/└── Dockerfile└── geochance-auth.jar └── geochance-system/└── Dockerfile└── geochance-system.jar └── geochance-gateway/…

Games104——游戏引擎Gameplay玩法系统:基础AI

这里写目录标题 寻路/导航系统NavigationWalkable AreaWaypoint NetworkGridNavigation Mesh(寻路网格)Sparse Voxel Octree Path FindingDijkstra Algorithm迪杰斯特拉算法A Star(A*算法) Path Smoothing Steering系统Crowd Simu…

Win11非虚拟机安装ISE14.7

官网下载6.18GB 的 Full Installer for Windows 7/XP/Server解压后运行安装程序不勾选Enable WebTalk to send software, IP ...安装程序卡死在ISE:Configure WebTalk,此时打开任务管理器,在详情中找到xwebtalk,右键结束任务。安装程序继续进…

从0开始达芬奇(3.8)

剪视频有主次之分,主就是Aroll,次就是Broll。 智能媒体夹: 媒体池的智能媒体夹部分可以很好区分主次。这个相当于智能搜索,当有大量的素材时,可以为这些素材标明信息,下次使用不需要反复看,直…

python算法和数据结构刷题[3]:哈希表、滑动窗口、双指针、回溯算法、贪心算法

回溯算法 「所有可能的结果」,而不是「结果的个数」,一般情况下,我们就知道需要暴力搜索所有的可行解了,可以用「回溯法」。 回溯算法关键在于:不合适就退回上一步。在回溯算法中,递归用于深入到所有可能的分支&…

基于Java(SpringBoot)+MySQL+Vue实现的平行志愿录取系统

基于spring bootvue实现的平行志愿录取系统 1.项目简介 这两天干上高考出成绩,有不少亲戚家的孩子今年高考,和我询问关于报志愿的问题。老家河北今年是采用所谓的平行志愿。我看了很多的资料才明白什么叫所谓的“平行志愿”。 整个流程好像很是复杂。…

chrome浏览器chromedriver下载

chromedriver 下载地址 https://googlechromelabs.github.io/chrome-for-testing/ 上面的链接有和当前发布的chrome浏览器版本相近的chromedriver 实际使用感受 chrome浏览器会自动更新,可以去下载最新的chromedriver使用,自动化中使用新的chromedr…

Redis常见数据类型与编码方式

⭐️前言⭐️ 本小节围绕Redis中常见的数据类型与编码方式展开。 🍉欢迎点赞 👍 收藏 ⭐留言评论 🍉博主将持续更新学习记录收获,友友们有任何问题可以在评论区留言 🍉博客中涉及源码及博主日常练习代码均已上传GitHu…

win编译openssl

一、perl执行脚本 1、安装perl脚本 perl安装 2、配置perl脚本 perl Configure VC-WIN32 no-asm no-shared --prefixE:\openssl-x.x.x\install二、编译openssl 1、使用vs工具编译nmake 如果使用命令行nmake编译会提示“无法打开包括文件: “limits.h”“ 等错误信息 所以…

【Kubernetes Pod间通信-第2篇】使用BGP实现Pod到Pod的通信

Kubernetes中Pod间的通信 本系列文章共3篇: 【Kubernetes Pod间通信-第1篇】在单个子网中使用underlay网络实现Pod到Pod的通信【Kubernetes Pod间通信-第2篇】使用BGP实现Pod到Pod的通信(本文介绍)【Kubernetes Pod间通信-第3篇】Kubernetes中Pod与ClusterIP服务之间的通信…

< 自用文儿 > 下载 MaxMind GeoIP Databases 对攻击的 IP 做 地理分析

起因 两个 VPM/VPS,安装了 fail2ban 去拦截密码穷举攻击。每天的记录都在增长,以前复制屏幕输出就行,一屏的内容还容易粘贴出来的。昨天已经过 500 条,好奇 fail2ban 是如何存储这些内容的?就发现它在使用 SQLite3 数…

SpringCloudGateWay和Sentinel结合做黑白名单来源控制

假设我们的分布式项目,admin是8087,gateway是8088,consumer是8086 我们一般的思路是我们的请求必须经过我们的网关8088然后网关转发到我们的分布式项目,那我要是没有处理我们绕过网关直接访问项目8087和8086不也是可以&#xff1…

C#面试常考随笔12:游戏开发中常用的设计模式【C#面试题(中级篇)补充】

C#面试题(中级篇),详细讲解,帮助你深刻理解,拒绝背话术!-CSDN博客 简单工厂模式 优点: 根据条件有工厂类直接创建具体的产品 客户端无需知道具体的对象名字,可以通过配置文件创建…

数字人|通过语音和图片来创建高质量的视频

简介 arXiv上的计算机视觉领域论文: AniPortrait: Audio-Driven Synthesis of Photorealistic Portrait Animation AniPortrait:照片级真实感肖像动画的音频驱动合成 核心内容围绕一种新的人像动画合成框架展开。 研究内容 提出 AniPortrait 框架&a…

数据结构实战之线性表(三)

目录 1.顺序表释放 2.顺序表增加空间 3.合并顺序表 4.线性表之链表实现 1.项目结构以及初始代码 2.初始化链表(不带头结点) 3.链表尾部插入数据并显示 4.链表头部插入数据 5.初始化链表(带头结点) 6.带头结点的链表头部插入数据并显示 7.带头结…

Docker使用指南(一)——镜像相关操作详解(实战案例教学,适合小白跟学)

目录 1.镜像名的组成 2.镜像操作相关命令 镜像常用命令总结: 1. docker images 2. docker rmi 3. docker pull 4. docker push 5. docker save 6. docker load 7. docker tag 8. docker build 9. docker history 10. docker inspect 11. docker prune…

C++基础day1

前言:谢谢阿秀,指路阿秀的学习笔记 一、基础语法 1.构造和析构: 类的构造函数是一种特殊的函数,在创建一个新的对象时调用。类的析构函数也是一种特殊的函数,在删除所创建的对象时调用。 构造顺序:父类->子类 析…

尝试ai生成figma设计

当听到用ai 自动生成figma设计时,不免好奇这个是如何实现的。在查阅了不少资料后,有了一些想法。参考了:在figma上使用脚本自动生成色谱 这篇文章提供的主要思路是:可以通过脚本的方式构建figma设计。如果我们使用ai 生成figma脚本…

【PyQt】pyqt小案例实现简易文本编辑器

pyqt小案例实现简易文本编辑器 分析 实现了一个简单的文本编辑器,使用PyQt5框架构建。以下是代码的主要功能和特点: 主窗口类 (MyWindow): 继承自 QWidget 类。使用 .ui 文件加载用户界面布局。设置窗口标题、状态栏消息等。创建菜单栏及其子菜单项&…

【电脑系统】电脑突然(蓝屏)卡死发出刺耳声音

文章目录 前言问题描述软件解决方案尝试硬件解决方案尝试参考文献 前言 在 更换硬盘 时遇到的问题,有时候只有卡死没有蓝屏 问题描述 更换硬盘后,电脑用一会就卡死,蓝屏,显示蓝屏代码 UNEXPECTED_STORE_EXCEPTION 软件解决方案…