ChatSDK 全双工语音识别库

ChatSDK :是对AIUI的语音SDK封装,套餐费用最低在6万/年
iflylib :是对原始msc的语音SDK封装,相对AIUI便宜很多
baidulib :是对百度语音SDK封装,百度号称永久免费
AIUITools :AIUI网络测试工具-折线图动态测试可持续观测

共同特点:实现了全双工语音识别iat、合成tts、和语义nlp部分接口的封装,经过稳定测试,通过简洁的调用方式来满足开发需求。两者核心类都是 SpeechManager
参考文档:玩转AIUI后处理、讯飞论坛
参考项目:电视语音助手


ChatSDK 全双工语音识别库

重大亮点:全双工语音识别,不中断,不中断,不中断

ChatSDK 是基于讯飞的AIUI进行封装,使用简洁,您可以下载本项目,然后将ChatSDK作为 Module 导入你的项目使用
核心类:SpeechManager
 

功能包括:语音识别、语音合成、语音语义理解、文本语义理解
场景:(语音点读笔、AI机器人、智能音箱、车载语音、家电语音、人机交互、在线教育机器人、语音鼠标、实时翻译、大屏广告互动、...)
落地产品公司:(牛听听、绿米联创、讯飞翻译、TCL-TV、小曼、优必选)
边听边识别: Respeaker远场麦克风阵列AI智能语音识别开发板
使用说明:

1:将chatsdk作为module引入自己的项目
2:替换自己的libaiui.so库和aiui_phone.cfg中的appid
3:安装成功后,确保权限打开,跟手机说话,会有结果返回

相关接口使用
step1 : 初始化语音合成、识别模块
SpeechManager.CreateInstance(getApplicationContext());
step2 : 设置语音识别和语义的回调
SpeechManager.getInstance().setBaseSpeechCallback(speechCallback); 
step3 : 语音识别和语义理解的回调
BaseSpeechCallback speechCallback = new BaseSpeechCallback() {/*** 通过识别语音得到文字** @param text 识别后的文本*/@Overridepublic void recognizeResult(String text) {//语音识别结果}/*** @param text 返回三方语义结果,可直接speak出来* @param json 返回三方语义结果json串,可根据需求自行解析*/@Overridepublic void nlpResult(String text, String json) {//语义理解结果SpeechManager.onSpeaking(text);}
};
step4 : 错误码回调接口
/*** 设置错误回调接口** @param callback 传入错误信息回调接口*/
public void setErrorInfoCallback(IErrorInfoCallback callback) {iErrorInfoCallback = callback;
}

#疑难问题:

1:讯飞服务有时候不稳定的情况:封装专门的测试工具
2:讯飞的服务器稳不稳定,对讯飞的HTTP和百度这种三方网站进行封装,实时的观察讯飞当前网络的链接UI动态情况
3:vad 前后置端点的处理, 解决跟interact_timeout两者之间互相影响的问题
4: 离线语音合成TTS不用讯飞语记
5:需要等2小时测试一下,但是热词并不是绝对的,只是增加热词的被识别出来的概率。
6:清除历史
AIUI支持多轮对话,如在问合肥今天的天气怎么样之后,再询问明天的呢,AIUI会结合上一句询问合肥今天 天气的历史,就会回答合肥明天的天气。
AIUI默认在休眠后唤醒会清除交互历史,在交互状态下唤醒,则不会清除交互历史。
AIUI清除历史的方式是可配置的,默认为auto即是上面描述的模式。当配置成user值后, 用户可以通过发送CMD_CLEAN_DIALOG_HISTORY在任何时候手动清除交互的历史。即使在上面两种情况下,客户端没有主动清除交互历史,服务端保存用户交互历史的时间也是有限的,当用户交互超过5轮后,服务端也会将交互历史清空。
7:AIUI的SDK出现网络10120问题,实际是anzer5G网络来回切换导致网络不稳定,换了高功率的HRR-Test(anzer2017)后正常.
8:上传热词无法通过客户端SDK进行,单纯的热词仅可通过网页端进行上传,如果您逐步深入了解了所见即可说、动态实体等高级特性就会发现上传的实体等资源本身就是热词的一种。
9:AIUI主动在线合成有时会出现卡顿,建议使用离线合成
10:AIUI不支持识别语种的切换,只有通过情景模式来切换自己想要的语种
11:关于 AIUI "continuous" 会识别到自身合成语音问题
12:H264音视频对讲开发
13: [思必驰语音的特点是支持高度定制化,支持定制后台语义透传] (登录注册)
14:Android基于MediaBroswerService的App实现概述
14:(未完待续。。。)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/613642.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Camunda Spin

Spin 常用于在脚本中解析json或者xml使用,S(variable) 表示构造成Spin对象,通过prop(“属性名”)获取属性值,通过stringValue()、numberValue()、boolValue() 等对类型转换。 repositoryService.createDeployment().name("消息事件流程&…

web第一次作业

题1&#xff1a; <form action"#" method"post"><table><tr><td>用户名&#xff1a;</td><td><input type"text" name"UserName" maxlength"20" size"15"></td>…

NumPy 数据操作实用指南:从基础到高效(上)

简介&#xff1a; 本文介绍了使用 NumPy 进行数据操作的基本步骤&#xff0c;包括导入库、创建数组、基本操作等。通过实例演示了如何利用 NumPy 进行数组的创建、索引、切片、变形、级联和切割等操作&#xff0c;以及如何应用这些功能在图像处理中进行实际应用。 numpy get st…

C++之单例模式

C之单例模式 前言介绍1、单例模式是什么&#xff1f;1.1 实现单例模式的三个要点1.2 单例模式分类 2. 懒汉式2.1 懒汉实现&#xff1a;基础方法2.2 懒汉实现&#xff1a;基于单锁2.3 懒汉实现&#xff1a;基于双重检测锁2.4 懒汉实现&#xff1a;基于双重检测锁和资源管理2.4.1…

Javascript——vue下载blob文档流

<el-table-column label"操作" fixed"right" width"150" showOverflowTooltip><template slot-scope"scope"><el-button type"text" v-has"stbsd-gjcx-down" class"edit-button" click&…

Mac 远程到 windows/Linux 开发体验为什么这么差?

随着科技的发展&#xff0c;远程开发已经成为一种常见的开发方式&#xff0c;其中Mac远程到windows/Linux开发也得到了广泛的应用。然而&#xff0c;许多用户反映Mac远程到windows/Linux开发体验并不理想&#xff0c;存在诸多问题。本文将深入探讨这些问题&#xff0c;并分析其…

MySQL 从零开始:02 MySQL 安装

文章目录 1、下载 MySQL 安装程序2、安装 MySQL 要操作 MySQL &#xff0c;首先要安装 MySQL &#xff0c;本文将一步步展示如何安装 MySQL&#xff0c;简直详细到令人发指。 环境&#xff1a; 操作系统&#xff1a;Windows10 64位MySQL版本&#xff1a;社区版 8.0.11.0 1、下…

探索AI技术的奥秘:揭秘人工智能的核心原理

人工智能&#xff08;AI&#xff09;已经成为当今科技领域最引人注目的话题之一。然而&#xff0c;对于许多人来说&#xff0c;AI仍然是一个神秘的领域&#xff0c;不清楚其核心原理。本文将探索AI技术的奥秘&#xff0c;为读者揭开人工智能的核心原理。 随着技术的飞速发展&am…

Asynchronous FIFO and synchronous FIFO-翻译自外网

Synchronous FIFO 先进先出 (FIFO) 是一种非常流行且有用的设计块&#xff0c;用于模块之间的同步和握手机制。 FIFO 的深度&#xff1a; FIFO 中的槽数或行数称为 FIFO 的深度。 FIFO 的宽度&#xff1a;每个槽或行中可以存储的位数称为 FIFO 的宽度。 在同步 FIFO 中&…

6.2 声音编辑工具GoldWave5简介(1)

不管你的MP3歌曲的简单剪接或者音频格式的转换,还是更加高级的后期加工 GoldWave5都可以令你轻松胜,甚至你自己录一首卡拉OK,也可以经过GoldWave5的修饰成为像歌星一样水晶般的动人声音!除了附有许多的效果处理功能外&#xff0c;它还能将编辑好的文件存成WAV、AU、SND、RAW、A…

vue 公众号开发,调用jssdk封装

vue 公众号开发&#xff0c;经常会使用到 转发朋友&#xff0c;朋友圈&#xff0c;调用扫一扫等功能&#xff0c;这时就要使用微信的 jssdk 微信jssdk传送门 1. 安装jssdk 插件 (jweixin-module) npm install jweixin-module --save 2. 封装方法 utils/jwx.js let jweixin…

sqlilabs第四十九五十关

Less-49(GET - Error based - String Bind - ORDER BY CLAUSE) 手工注入 无回显(还是单引号闭合)&#xff0c;只能使用延时注入 自动脚本 和上一关一样 Less-50(GET - Error based - ORDER BY CLAUSE -numeric- Stacked injection) 手工注入 这里需要使用堆叠注入的思路 自…

Qt优秀开源项目之二十:RedPanda-CPP(小熊猫C++)

小熊猫C是跨平台、轻量易用的开源C/C集成开发环境。 官网&#xff1a;http://royqh.net/redpandacpp github&#xff1a;https://github.com/royqh1979/RedPanda-CPP 小熊猫C&#xff08;原名小熊猫Dev-C 7)是基于Qt开发的Dev-C替代版本。和经典的Dev-C 5.11、新的Embarcadero …

TDengine 签约积成电子

随着电力系统的复杂性和数据量不断增加&#xff0c;电力负荷、电压、频率等庞大的时序数据需要更高效的存储和处理能力&#xff0c;才能确保数据的可靠性和实时性。此外&#xff0c;电力系统还需要对实时数据进行快速分析和决策&#xff0c;以确保电网的稳定运行。然而&#xf…

openssl3.2 - 官方dmeo学习 - sconnect.c

文章目录 openssl3.2 - 官方dmeo学习 - sconnect.c概述笔记END openssl3.2 - 官方dmeo学习 - sconnect.c 概述 TLS客户端 - 使用根证书, 非阻塞, 向服务器要东西. 笔记 开始一个新demo学习时, 要从头配置包含路径, 麻烦. 直接拷贝上一个实现工程, 换掉实现.c方便一些. 换的…

(超详细)4-YOLOV5改进-添加ShuffleAttention注意力机制

1、在yolov5/models下面新建一个SE.py文件&#xff0c;在里面放入下面的代码 代码如下&#xff1a; import numpy as np import torch from torch import nn from torch.nn import init from torch.nn.parameter import Parameterclass ShuffleAttention(nn.Module):def __…

C //练习 4-12 运用printd函数的设计思想编写一个递归版本的itoa函数,即通过递归调用把整数转换为字符串。

C程序设计语言 &#xff08;第二版&#xff09; 练习 4-12 练习 4-12 运用printd函数的设计思想编写一个递归版本的itoa函数&#xff0c;即通过递归调用把整数转换为字符串。 注意&#xff1a;代码在win32控制台运行&#xff0c;在不同的IDE环境下&#xff0c;有部分可能需要…

【IOS】惯性导航详解(包含角度、加速度、修正方式的api分析)

参考文献 iPhone的惯性导航&#xff0c;基于步态。https://www.docin.com/p-811792664.html Inertial Odometry on Handheld Smartphones: https://arxiv.org/pdf/1703.00154.pdf 惯性导航项目相关代码&#xff1a;https://github.com/topics/inertial-navigation-systems use…

openssl3.2 - 官方dmeo学习 - 索引贴

文章目录 openssl3.2 - 官方dmeo学习 - 索引贴概述笔记工程的搭建和调试环境BIOBIO - client-arg.cBIO - client-conf.cBIO - saccept.cBIO - sconnect.cBIO - server-arg.cBIO - server-cmod.cBIO - server-conf.cBIO - 总结certsEND openssl3.2 - 官方dmeo学习 - 索引贴 概述…

长尾分布定义,举个物种长尾分布和词频长尾分布的例子。

问题描述&#xff1a;长尾分布定义&#xff0c;举个物种长尾分布和词频长尾分布的例子。 问题解答&#xff1a; 长尾分布是一种概率分布的类型&#xff0c;它描述的是一种极端事件或者稀有事件的发生概率。具体来说&#xff0c;长尾分布描述的是少量的类别占据了大部分的样本…