【java】websocket对接微软语音实时识别

目录

          • 1. pom依赖
          • 2. websocket接口
          • 3. 自定义输入流
          • 4. 自定义控制
          • 5. 自定义语音流
          • 6. 说明

1. pom依赖
<dependency><groupId>com.microsoft.cognitiveservices.speech</groupId><artifactId>client-sdk</artifactId><version>1.37.0</version>
</dependency>
2. websocket接口
package com.learning;import com.microsoft.cognitiveservices.speech.CancellationReason;
import com.microsoft.cognitiveservices.speech.ResultReason;
import com.microsoft.cognitiveservices.speech.SpeechConfig;
import com.microsoft.cognitiveservices.speech.SpeechRecognizer;
import com.microsoft.cognitiveservices.speech.audio.AudioConfig;
import lombok.extern.slf4j.Slf4j;
import org.springframework.stereotype.Controller;import javax.websocket.*;
import javax.websocket.server.ServerEndpoint;
import java.io.IOException;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.Semaphore;@Slf4j
@Controller
@ServerEndpoint("/microsoft")
public class MicrosoftAsrSocketServer {private VoiceAudioStream voiceAudioStream;Semaphore stopTranslationWithFileSemaphore = new Semaphore(0);@OnOpenpublic void onOpen(Session session) {voiceAudioStream = new VoiceAudioStream();String queryString = session.getQueryString();SpeechConfig speechConfig = SpeechConfig.fromSubscription("你的token", "eastus");speechConfig.setSpeechRecognitionLanguage("zh-CN");AudioConfig audioConfig = AudioConfig.fromStreamInput(this.voiceAudioStream);SpeechRecognizer speechRecognizer = new SpeechRecognizer(speechConfig, audioConfig);speechRecognizer.recognizing.addEventListener((s, e) -> {System.out.println("RECOGNIZING: Text=" + e.getResult().getText());this.returnMessage(session, e.getResult().getText());});speechRecognizer.recognized.addEventListener((s, e) -> {if (e.getResult().getReason() == ResultReason.RecognizedSpeech) {System.out.println("RECOGNIZED: Text=" + e.getResult().getText());}else if (e.getResult().getReason() == ResultReason.NoMatch) {System.out.println("NOMATCH: Speech could not be recognized.");}});speechRecognizer.canceled.addEventListener((s, e) -> {System.out.println("CANCELED: Reason=" + e.getReason());if (e.getReason() == CancellationReason.Error) {System.out.println("CANCELED: ErrorCode=" + e.getErrorCode());System.out.println("CANCELED: ErrorDetails=" + e.getErrorDetails());System.out.println("CANCELED: Did you set the speech resource key and region values?");}stopTranslationWithFileSemaphore.release();});speechRecognizer.sessionStopped.addEventListener((s, e) -> {System.out.println("Session stopped event.");stopTranslationWithFileSemaphore.release();});try {speechRecognizer.startContinuousRecognitionAsync().get();} catch (InterruptedException e) {e.printStackTrace();} catch (ExecutionException e) {e.printStackTrace();}}@OnMessagepublic void onMessage(byte[] bytes) {voiceAudioStream.write(bytes, 0, bytes.length);}@OnClosepublic void onClose(Session session) throws IOException {session.close();voiceAudioStream.close();stopTranslationWithFileSemaphore.release();}@OnErrorpublic void onError(Session session, Throwable error) throws IOException {error.printStackTrace();voiceAudioStream.close();stopTranslationWithFileSemaphore.release();}/*** 回写消息* @param session* @param message*/private void returnMessage(Session session, String message){if (session.isOpen()) {log.info("<=======写出数据:{}",message);try {if(!"".equals(message) && message != null){session.getBasicRemote().sendText(message);}} catch (IOException e) {e.printStackTrace();}}}
}
3. 自定义输入流
package com.learning;import lombok.extern.slf4j.Slf4j;import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.concurrent.ConcurrentLinkedDeque;@Slf4j
public class EchoStream extends InputStream {private ManualResetEvent dataReady = new ManualResetEvent();private ConcurrentLinkedDeque<byte[]> buffers = new ConcurrentLinkedDeque<>();public Boolean dataAvailable(){return !buffers.isEmpty();}public  void write(byte[] buffer, int offset, int count){// log.info("开始write,EchoStream");buffers.addLast(buffer);if(buffers.size()>1){dataReady.set();}}@Overridepublic int read() throws IOException {return 0;}public byte[] getLBuffer(){if(buffers.size() != 0){return buffers.pollFirst();}return new byte[0];}public  InputStream Read(byte[] buffer, int offset, int count){//log.info("开始read,EchoStream");try {if(buffers.size() == 0){dataReady.waitForever();}} catch (InterruptedException e) {e.printStackTrace();}byte[] lBuffer = buffers.pollFirst();if (lBuffer == null || lBuffer.length == 0){dataReady.reset();}if (!dataAvailable()) {dataReady.reset();}buffer = lBuffer.clone();return new ByteArrayInputStream(buffer);}@Overridepublic void close() throws IOException {super.close();}
}
4. 自定义控制
package com.learning;import java.util.concurrent.TimeUnit;
import java.util.concurrent.atomic.AtomicBoolean;
import java.util.concurrent.locks.Condition;
import java.util.concurrent.locks.Lock;  
import java.util.concurrent.locks.ReentrantLock;  public class ManualResetEvent {  private final Lock lock = new ReentrantLock();  private final Condition condition = lock.newCondition();  private AtomicBoolean isSet = new AtomicBoolean(false);public void set() {  lock.lock();  try {  isSet.set(true);  // 唤醒所有等待的线程  condition.signalAll();  } finally {  lock.unlock();  }  }  public void reset() {  lock.lock();  try {  isSet.set(false);  // 注意:我们在这里不唤醒任何线程,因为它们是等待信号被设置  } finally {  lock.unlock();  }  }  public void waitForever() throws InterruptedException {  lock.lock();  try {  while (!isSet.get()) {  // 等待信号被设置  condition.await();  }  } finally {  lock.unlock();  }  }  // 也可以提供一个带有超时的等待方法  public boolean waitFor(long timeout, TimeUnit unit) throws InterruptedException {lock.lock();  try {  if (!isSet.get()) {  return condition.await(timeout, unit);  }  return true;  } finally {  lock.unlock();  }  }  // 注意:这里没有包含TimeUnit的导入,你需要添加它  // import java.util.concurrent.TimeUnit;  // 示例用法  public static void main(String[] args) throws InterruptedException {  ManualResetEvent event = new ManualResetEvent();  // 启动一个线程来模拟生产者设置事件  new Thread(() -> {  try {  Thread.sleep(1000); // 模拟耗时操作  event.set(); // 设置事件,允许等待的线程继续执行  Thread.sleep(1000); // 再次模拟耗时操作  event.reset(); // 重置事件,使等待的线程再次等待  } catch (InterruptedException e) {  e.printStackTrace();  }  }).start();  // 主线程等待事件被设置// 等待事件被设置event.waitForever();// 在这里可以添加更多的逻辑来处理事件被重置的情况  // 例如,通过循环等待事件再次被设置  // 注意:在实际应用中,你可能需要处理更多的线程和更复杂的逻辑}public void close() {try {isSet.set(false);// 唤醒所有等待的线程condition.signalAll();} finally {lock.unlock();}}
}
5. 自定义语音流
package com.xiaoi.xics.avatar.api.interfaces;import com.microsoft.cognitiveservices.speech.audio.PullAudioInputStreamCallback;
import lombok.extern.slf4j.Slf4j;
import java.io.IOException;
import java.io.InputStream;/*** 自定义语音流*/
@Slf4j
public class VoiceAudioStream extends PullAudioInputStreamCallback {private EchoStream dataStream = new EchoStream();private ManualResetEvent waitForEmptyDataStream = null;private InputStream stream;/*** 服务从PullAudioInputStream中读取数据, 读到0个字节并不会关闭流*/@Overridepublic int read(byte[] dataBuffer){long  ret = 0;// 用户主动close时可以关闭流if (waitForEmptyDataStream != null && !dataStream.dataAvailable()){waitForEmptyDataStream.set();return 0;}try {if(this.stream != null){ret = this.stream.read(dataBuffer,0, dataBuffer.length);if((int)ret < 1){this.stream = dataStream.Read(dataBuffer, 0, dataBuffer.length);ret = this.stream.read(dataBuffer,0, dataBuffer.length);}}else{this.stream = dataStream.Read(dataBuffer, 0, dataBuffer.length);ret = this.stream.read(dataBuffer,0, dataBuffer.length);}} catch (IOException e) {e.printStackTrace();}return (int)Math.max(0, ret);}/*** Client向PullAudioInputStream写入数据*/public void write(byte[] buffer, int offset, int count){dataStream.write(buffer, offset, count);}@Overridepublic void close(){if (dataStream.dataAvailable()){// 通过ManualResetEvent强制流的使用者必须调用close来手动关闭流waitForEmptyDataStream = new ManualResetEvent();try {waitForEmptyDataStream.waitForever();} catch (InterruptedException e) {e.printStackTrace();}}if(waitForEmptyDataStream != null){this.waitForEmptyDataStream.close();}try {this.dataStream.close();this.stream.close();} catch (IOException e) {e.printStackTrace();}}
}
6. 说明
  • 1.学习用途,切勿放入工作当中,警惕线程控制类。
  • 2.springboot集成websocket流程省略,前端连上websocket后打开麦克风传入语音输入流。
  • 3.亲测有效。自测参考地址:ws://127.0.0.1:8080/microsoft
  • 4.参考C#的实现过程的,点我跳转。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/13538.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# Stack用法

C#中的Stack&#xff08;堆栈&#xff09;是一种后进先出&#xff08;LIFO, Last In First Out&#xff09;的数据结构&#xff0c;用于在顶部添加和移除元素。Stack类位于System.Collections.Generic命名空间中&#xff0c;它允许存储特定类型的对象。以下是一些基本的Stack用…

如何搭建Sphinx文档

环境准备 Linux CentOS 7 方案 搭建一个文档网站&#xff0c;本文档使用的是tomcatsphinx。 Tomcat可以快速搭建出http服务&#xff0c;也可以使用apache httpd。 Sphinx作为文档网页自动生成工具&#xff0c;可以从reStructured文档转换为html文件。 Tomcat安装 创建/…

华为设备WLAN配置之AP上线

WLAN基础配置之AP上线 配置WLAN无线网络的第一阶段&#xff0c;AP上线技术&#xff1a; 实验目标&#xff1a;使得AP能够获得来自AC的DHCP地址服务的地址&#xff0c;且是该网段地址池中的IP。 实验步骤&#xff1a; 1.把AC当作三层交换机配置虚拟网关 sys Enter system view,…

PaddlePaddle----基于paddlehub的文字识别

识别的代码 要使用 PaddleHub 进行 OCR 文本识别&#xff0c;您可以使用 PaddleHub 提供的预训练模型 chinese_ocr_db_crnn_mobile。以下是一个示例 Python 代码&#xff0c;演示如何使用 PaddleHub 进行 OCR 文本识别&#xff1a; import paddlehub as hub import cv2# 加载预…

note-网络是怎样连接的1 浏览器内部

助记提要 常见浏览器使用的协议 4种HTTP方法 8种响应状态码类型 5种5种IP地址的含义域名查找的基本原理协议栈发送消息的4个阶段 第1章 浏览器生成消息 探索浏览器内部 1 浏览器输入的URL 常见协议 http(访问Web服务器)&#xff0c;ftp(从ftp服务器下载和上传)&#xff0c;f…

【XuperChain】一、搭建第一条区块链节点

一、准备环境&#xff1a; 下载git和golang即可 apt install git apt install golang二、拉取代码&#xff0c;编译XuperChain 通过此命令拉取XuperChain源码到本地 git clone https://github.com/xuperchain/xuperchain.git 拉取成功后&#xff0c;会代码保存到了xuperChain…

使用Python生成一束玫瑰花

520到了&#xff0c;没时间买花&#xff1f;我们来生成一个电子的。 Python不仅是一种强大的编程语言&#xff0c;用于开发应用程序和分析数据&#xff0c;它也可以用来创造美丽的艺术作品。在这篇博客中&#xff0c;我们将探索如何使用Python生成一束玫瑰花的图像。 准备工作…

【逻辑漏洞】重置/忘记密码安全问题

【逻辑漏洞】重置/忘记密码安全问题 密码重置令牌泄漏密码重置中毒电子邮件轰炸密码重置令牌生成方式太过简陋使用过期令牌用好的响应替换坏的响应尝试使用自己的重置令牌注销/密码重置中的会话失效 密码重置令牌泄漏 如果密码重置令牌包含在 URL 中&#xff0c;并且用户在请求…

野心是需要付出去达到的,而欲望就只是欲望

当你能分清楚自己的想法是野心还是欲望时&#xff0c;就没有那么焦虑了。 这是野心还是欲望&#xff1f; 理解这两者之间的区别&#xff0c;对于我们的情绪状态和生活决策有着重要的影响。本文将探讨如何区分野心与欲望&#xff0c;并分享如何通过这种理解来减少焦虑。 野心&a…

如何解决爬虫的IP地址受限问题?

使用代理IP池、采用动态IP更换策略、设置合理的爬取时间间隔和模拟正常用户行为&#xff0c;是解决爬虫IP地址受限问题的主要策略。代理IP池是通过集合多个代理IP来分配爬虫任务&#xff0c;从而避免相同的IP地址对目标网站进行高频次访问&#xff0c;减少被目标网站封禁的风险…

TransFormer学习之VIT算法解析

1.算法简介 本文主要对VIT算法原理进行简单梳理&#xff0c;下图是一个大佬整理的网络整体的流程图&#xff0c;清晰明了&#xff0c;其实再了解自注意力机制和多头自注意力机制后&#xff0c;再看VIT就很简单了 受到NLP领域中Transformer成功应用的启发&#xff0c;ViT算法尝…

详解ArcGIS 水文分析模型构建

目录 前言 项目环境、条件 Dem 数据预览 ArcGIS模型构建器 模型搭建 填洼 流向 流量 河流长度 栅格计算器 河流链接 河网分级 栅格河网矢量化 绘制倾泻点 栅格流域提取 集水区 盆域分析 栅格转面 模型应用 导出 py 文件 完善脚本 最终效果 结束语 前言 …

【时间复杂度和空间复杂度之间的故事】

【时间复杂度和空间复杂度之间的故事】 一.前言 二.时间复杂度定义时间复杂度的计算规则习题 三.空间复杂度定义计算方法习题空间复杂度 O(1)空间复杂度 O(n) 本文主要讲解关于时间复杂度与空间复杂度 &#x1f600;&#x1f603;&#x1f601;&#x1f601;&#x1f607;&…

linux驱动中amba框架的作用

一,linux amba使用原因 一些芯片的设备树上的很多片内外设的compatible属性为compatible = "arm,primecell",且在内核源码中找不到compatible匹配的驱动,这是因为这些驱动使用了arm提供的amba协议。AMBA是由ARM Holdings开发的一种广泛使用的片上互连规范,它为系…

Go 秒读32GB大文件

在Go中&#xff0c;处理大文件时&#xff0c;一般采用分块读取的方式&#xff0c;以避免一次性加载整个文件到内存中。 1、打开文件 使用os.Open打开文件 package mainimport ("log""os" )func main() {file, err : os.Open("xxx.txt")if er…

部署Web应用,使用多种Azure服务【简略步骤】

步骤1&#xff1a;设计和开发Web应用 首先&#xff0c;选择一个开发框架和编程语言。例如&#xff0c;使用ASP.NET Core和C#进行开发。 创建项目&#xff1a; 使用Visual Studio或VS Code创建一个ASP.NET Core Web应用。 开发应用&#xff1a; 根据需求开发应用的各个部分&…

FastAPI单元测试:使用TestClient轻松测试你的API

当使用FastAPI进行单元测试时&#xff0c;一个重要的工具是TestClient类。TestClient类允许我们模拟对FastAPI应用程序的HTTP请求&#xff0c;并测试应用程序的响应。这使我们能够在不启动服务器的情况下对API进行全面的测试。 下面我将详细讲解TestClient的使用方法和常见操作…

10大桌面软件前端框架,那个是您的最爱呢?

桌面端前端框架是用于构建桌面应用程序的前端框架&#xff0c;以下是一些常用的桌面端前端框架&#xff1a; 1. Electron&#xff1a; Electron是一个开源的桌面应用程序开发框架&#xff0c;可以使用HTML、CSS和JavaScript构建跨平台的桌面应用程序&#xff0c;例如VS Code、…

2024 年第四届长三角高校数学建模竞赛赛题B题超详细解题思路+代码分享

B题 人工智能范式的物理化学家 问题一问题二问题三问题四问题五完整代码与文档获取 B题思路详细解析分享给大家&#xff0c;还会继续更新完成具体的求解过程&#xff0c;以及全部的代码与技术文档&#xff0c;都会直接给大家分享的哦~需要完整代码直接看到最后哦 问题一 针对问…

谈谈【软件测试的基础知识,基础模型】

关于软件测试的基本概念和基本模型 前言一个优秀的测试人员具备的素质关于需求测试用例软件错误(BUG)概念开发模型瀑布模型&#xff08;Waterfall Model&#xff09;螺旋模型&#xff08;Spiral Model&#xff09; 前言 首先,什么是软件测试? 通俗来讲:软件测试就是找BUG&…