Windows 11部署FunASR离线语音识别系统

Windows 11部署FunASR离线语音识别系统

官网连接

https://github.com/alibaba-damo-academy/FunASR/blob/main/runtime/docs/SDK_advanced_guide_online_zh.md

1-安装Docker

运行Docker Desktop Installer.exe安装Docker

2-Windows添加删除程序增加虚拟机和Linux子系统功能

Hyper-V(Windows 11可能不显示,通过命令systeminfo显示:Hyper-V 要求: 已检测到虚拟机监控程序。将不显示 Hyper-V 所需的功能。说明系统支持Hyper-V的)
适用于Linux的Windows子系统
虚拟机平台
Windows虚拟机监控程序平台

错误处理:
Windows 11运行Docker提示"Docker Engine stopped"错误
a-在系统服务中启动Docker Desktop Service(com.docker.service)
b-在系统服务中启动Hyper-V 主机计算服务(vmcompute)

3-升级Linux子系统(可选)

wsl --update

4-部署Docker

docker pull registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.9
mkdir d://FunASR//model

5-启动Docker

docker run -p 10095:10095 -it --privileged=true -v d:/FunASR/model:/workspace/models registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.9

6-启动FunASR

cd FunASR/runtime
nohup bash run_server_2pass.sh --certfile 0  --download-model-dir /workspace/models --vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx --model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx  --online-model-dir damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx  --punc-dir damo/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727-onnx --itn-dir thuduj12/fst_itn_zh > log.txt 2>&1 &

7-关闭FunASR

ps -x | grep funasr-wss-server-2pass
kill -9 PID

8-打开新的控制台查看执行日志

docker exec -it PID /bin/sh
tail -f nohup.out

9-批处理自动执行

@echo off
REM 设置CONTAINER_NAME变量为容器的PID
set CONTAINER_NAME=3991fdb6c269chcp 65001REM 等待 30 秒让容器完全启动
timeout /t 30docker start %CONTAINER_NAME%REM 进入 Docker 容器
docker exec -it %CONTAINER_NAME% bash -c "cd FunASR/runtime && nohup bash run_server_2pass.sh --certfile 0 --download-model-dir /workspace/models --vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx --model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx --online-model-dir damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx --punc-dir damo/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727-onnx --itn-dir thuduj12/fst_itn_zh > log.txt 2>&1 &"REM 实时查看日志
docker exec -it %CONTAINER_NAME% bash -c "tail -f FunASR/runtime/nohup.out":: 暂停,等待用户按下任意键
pause

10-C#客户端

运行容器时命令含参数包含了-certfile 0,意思为关闭SSL,客户端通过ws://127.0.0.1:10095连接系统(默认为wss://,安全WebSocket协议)

流程:
客户端 ----------发起WebSocket连接---------->服务器
客户端----------发送JSON握手协议---------->服务器
客户端----------发送PCM二进制数据帧---------->服务器
客户端<----------返回JSON数据----------服务器

握手协议:

{"chunk_size":[5,10,5],"wav_name":"h5","is_speaking":true,"chunk_interval":10,"itn":false,"mode":"2pass","hotwords":"{\"阿里巴巴\":20,\"hello world\":40}"}

返回JSON数据有两种
实时返回数据

{"is_final":false,"mode":"2pass-online","text":"小明","wav_name":"h5"}

返回断句数据

{"is_final":false,"mode":"2pass-offline","stamp_sents":[{"end":39950,"punc":"。","start":39670,"text_seg":"小 明","ts_list":[[39670,39850],[39850,39950]]},{"end":40465,"punc":"","start":39950,"text_seg":"小 明","ts_list":[[39950,40050],[40050,40465]]}],"text":"小明。小明","timestamp":"[[39670,39850],[39850,39950],[39950,40050],[40050,40465]]","wav_name":"h5"}

不同点在于mode是online还是offline。

主要代码

  /** 与FunASR建立WebSocket连接* */public async Task StartWebSocketSync(){// 全局忽略证书验证错误ServicePointManager.ServerCertificateValidationCallback += (sender, cert, chain, sslPolicyErrors) => true;string wssUrl = "ws://127.0.0.1:10095";webSocket = new ClientWebSocket();try{await webSocket.ConnectAsync(new Uri(wssUrl), CancellationToken.None);await SendInitialMessage(webSocket);Console.WriteLine("WEBSOCKET已连接...");bWebSocketReady = true;await Task.WhenAll(ReceiveMessagesSync(webSocket), SendAudioSync(webSocket));}catch (Exception ex){Console.WriteLine($"WEBSOCKET连接错误: {ex.Message}");}}/** 发送握手数据* */private async Task SendInitialMessage(ClientWebSocket webSocket){var request = new{chunk_size = new int[] { 5, 10, 5 },wav_name = "h5",is_speaking = true,chunk_interval = 10,itn = false,mode = "2pass"};string jsonRequest = JsonConvert.SerializeObject(request);byte[] bytes = Encoding.UTF8.GetBytes(jsonRequest);await webSocket.SendAsync(new ArraySegment<byte>(bytes), WebSocketMessageType.Text, true, CancellationToken.None);}/** 接收数据并处理* */private async Task ReceiveMessagesSync(ClientWebSocket ws){var buffer = new byte[1024 * 100];while (ws.State == WebSocketState.Open){var result = await ws.ReceiveAsync(new ArraySegment<byte>(buffer), CancellationToken.None);if (result.MessageType == WebSocketMessageType.Close){await ws.CloseAsync(WebSocketCloseStatus.NormalClosure, string.Empty, CancellationToken.None);Console.WriteLine("WEBSOCKET已关闭。");}else{string message = Encoding.UTF8.GetString(buffer, 0, result.Count);if (!string.IsNullOrEmpty(message)){// HandleMessage(message); // 收到为包含识别文本的JSON数据}}}}/** 开始监听* */private async Task StartListeningAsync(CancellationToken cancellationToken){var waveIn = new WaveInEvent{WaveFormat = new WaveFormat(16000, 1) // 使用16kHz单声道};waveIn.DataAvailable += (s, e) =>{lock (this){// 读取数据byte[] bytes = new byte[e.BytesRecorded];for (var i = 0; i < e.BytesRecorded; i++){bytes[i] = e.Buffer[i];}// 缓存数据_waveBuffer.Add(bytes);}};waveIn.StartRecording();Console.WriteLine("开始监听麦克风...");while (!cancellationToken.IsCancellationRequested){await StartWebSocketSync();await Task.Delay(100, cancellationToken); // 适当的延迟}waveIn.StopRecording();Console.WriteLine("停止监听麦克风。");}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/27524.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

云电脑有多好用?适合哪些人使用?

云电脑作为一种新型的计算模式&#xff0c;其应用场景广泛且多样&#xff0c;适合各类人群使用。云电脑适合什么人群使用&#xff1f;云电脑有哪些应用场景&#xff1f;有什么好的云电脑推荐&#xff1f;以下本文将详细探讨云电脑的主要应用场景及其适用人群的相关内容&#xf…

win10下使用docker和VMware

1. 要使用docker的处理 打开 Hyper-V 管理员身份打开提示符。 输入命令bcdedit /set hypervisorlaunchtype auto 重启电脑 2. 要使用vm虚拟机 关闭 Hyper-V 管理员身份打开提示符。 输入 bcdedit 并回车&#xff0c;找到hypervisorlaunchtype选项发现为auto 输入命令bcdedit /s…

C#使用OpenXml读取Word、PPT、Excel文档内容

DocumentFormat.OpenXml是微软官方推出的一个操作Excel、Word、PPT文件的开源组件&#xff0c;因此它是免费的。以下是一些关于DocumentFormat.OpenXml的详细信息&#xff1a; 开源性质&#xff1a;DocumentFormat.OpenXml是一个开源项目&#xff0c;这意味着其源代码是公开的…

JavaScript内置方法 操作数组和字符串

在JavaScript中&#xff0c;数组和字符串是非常常见的数据类型&#xff0c;它们各自有一套强大的内置方法。以下是一些常用的数组和字符串方法&#xff0c;以及它们的实例和注意事项&#xff1a; 数组操作方法&#xff1a; 1. push() / pop() push()&#xff1a;向数组的末尾…

禁用PS/Photoshop等一系列Adobe旗下软件联网外传用户数据操作

方案一&#xff1a; 下载火绒杀毒&#xff0c;在联网请求上禁用Adobe软件的联网请求&#xff0c;甚至还可以额外发现哪些是它要想要偷偷摸摸干的。 方案二&#xff1a; 最后注意&#xff1a; 用盗版软件只是获得了使用权&#xff01;

Docker系列.Docker Desktop中如何启用Kubernetes

Docker技术概论 Docker Desktop中如何启用Kubernetes - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite&#xff1a;http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of this article:https://blog.…

Linux编辑器 vim使用 (解决普通用户无法进行sudo提权问题)

文章目录 一.vim是什么命令模式底行模式 二.关于vim暂停问题三.注释批量化注释批量化去注释 四.解决普通用户无法进行sudo提权问题五.vim的配置 一.vim是什么 用过VS的都知道&#xff0c;拥有着编辑器编译器调试.编写C&#xff0c;C&#xff0c;python等的功能。就是集成 Linu…

骤旱(Flash drought)相关小结

1. 简介 2. 数据集 3. 识别算法 待更新

1606 - 求一个两位数倒序的结果

问题描述 请输出一个两位的整数 n&#xff0c;倒过来的数&#xff0c;也就是输出这个两位数个位和十位颠倒的结果。 比如&#xff1a;整数 23 倒过来是 32&#xff0c;整数 18 倒过来是 81 &#xff0c;整数 20 倒过来是 2。 输入 两位整数 n。 输出 n 倒过来的整数。 样…

LeetCode | 434.字符串中的单词数

这道题直接使用语言内置的 split 函数可直接分离出字符串中的每个单词&#xff0c;但是要注意区分两种情况&#xff1a;1、空串&#xff1b;2、多个空格连续&#xff0c;分割后会出现空字符的情况&#xff0c;应该舍弃 class Solution(object):def countSegments(self, s):&qu…

java算法:选择排序

文章标题 概述与基本实现优缺点尝试优化 概述与基本实现 选择排序&#xff08;Selection Sort&#xff09;是一种简单直观的排序算法。它的基本思想是每次从待排序的元素中选择最小&#xff08;或最大&#xff09;的元素&#xff0c;放置在已排序的部分的末尾&#xff0c;直到…

JAVA系列---函数式接口

函数式接口的定义 一个函数式接口有且仅有一个抽象方法(SAM&#xff0c;single abstract method)。对于接口来说抽象方法必须重写&#xff0c;默认方法可选重新&#xff0c;静态方法不可重新。Object 类中的 public abstract method 不会被视为单一的抽象方法。这些方法对于函…

java技术专家面试指南100问【java学习+面试宝典】(四)

如何避免“伪共享”&#xff1f; 字节填充&#xff08;创建变量时&#xff0c;使用字段对其进行填充&#xff0c;避免多个变量被分派到同一个缓存行里&#xff09;。JDK8提供了一个Contended注解来解决伪共享。 Netty 的应用场景了解么&#xff1f; Netty 主要用来做网络通信…

数据结构学习笔记-树

1.树的存储结构 &#xff08;1&#xff09;双亲表示法 顺序存储结点数据&#xff0c;结点中保存父节点在数组中的下标。 优点&#xff1a;找父节点方便&#xff1b;缺点&#xff1a;找孩子不方便 #define MAX_TREE_SIZE 100 //树中最多结点数 typedef struct{ //树的…

微信小程序点击打开关联企业微信客服

wx.openCustomerServiceChat({extInfo: {url: https://work.weixin.qq.com/kfid/kfc****},corpId: *****,})

磁盘性能概述与磁盘调度算法

目录 1. 磁盘性能概述 1. 数据传输速率 2. 寻道时间 3. 旋转延迟 4. 平均访问时间 2. 早期的磁盘调度算法 1. FIFO&#xff08;First-In-First-Out&#xff09;调度算法 2. SSTF&#xff08;Shortest Seek Time First&#xff09;调度算法 3. SCAN&#xff08;Elevator…

Dubbo3 服务原生支持 http 访问,兼具高性能与易用性

作者&#xff1a;刘军 作为一款 rpc 框架&#xff0c;Dubbo 的优势是后端服务的高性能的通信、面向接口的易用性&#xff0c;而它带来的弊端则是 rpc 接口的测试与前端流量接入成本较高&#xff0c;我们需要专门的工具或协议转换才能实现后端服务调用。这个现状在 Dubbo3 中得…

SVN 报错Error: Unable to connect to a repository at URL解决方法

1. 报错背景&#xff1a; 使用ssh 用svn拉取仓库代码时&#xff0c;出现如下报错&#xff1a; Can’t create session: Unable to connect to a repository at URL svn://127.0.0.1 …. Can’t connect to host ‘127.0.0.1’: Connection refused at C:/Program Files/Git/mi…

蓝牙耳机怎么连接电脑?轻松实现无线连接

蓝牙耳机已经成为许多人生活中不可或缺的一部分&#xff0c;不仅可以方便地连接手机&#xff0c;还能轻松连接电脑&#xff0c;让我们在工作和娱乐时享受无线的自由。然而&#xff0c;对于一些用户来说&#xff0c;将蓝牙耳机与电脑连接可能会遇到一些问题。本文将介绍蓝牙耳机…

从大型语言模型到大脑语言理解:探索话语理解的神经机制

随着科技的飞速发展&#xff0c;人工智能领域取得了令人瞩目的成就。在这其中&#xff0c;大型语言模型&#xff08;LLMs&#xff09;以其卓越的性能和广泛的应用前景&#xff0c;成为了当前研究的热点。然而&#xff0c;尽管LLMs在文本生成、语言翻译等领域展现出了惊人的能力…