通信原理课设(gec6818) 007:语音识别

目录

1、去科大讯飞官网下载对应的sdk

2、科大讯飞文件夹的意思

3、配置ARM的录音环境

4、编程实现语音识别


我们的需求是将一个语音文件从客户端传到服务器,因此我们最好是选用tcp
    
现在市面上面常用的语音识别解决方案为:科大讯飞c和百度c++

离线语音识别和在线语音识别有一定区别,以识别“你好”为例:
在线:语音识别可以直接返回“你好”这个字符串    
离线:只能做命令词 --- 根据我的需求写好代号
           如:你好 --- 1001
           最终我们可以拿到这个1001这个id

语音解决方案没有arm的环境,因此我们需要用开发板去录音,将这个录音文件发送给乌班图,由乌班图识别出来之后返回给arm板

1、去科大讯飞官网下载对应的sdk

进入科大讯飞官网 -> 讯飞开放平台 -> 离线命令词识别 -> 免费试用
    -> 下载对应的SDK-> 跳转到对应的sdk下载界面->注意下面三个红色框框的选择(下载sdk可能会提示要实名认证,认证就好了)

2、科大讯飞文件夹的意思

每个人下载的sdk都是不一样的

进入到\samples\asr_offline_sample,可以看到有一个makefile文件,我们在编译的时候直接make就可以了。make会找Makefile去执行,make完成如果没有报错,它会在bin目录里面生成一个asr_offline_sample可执行文件。

由于我们只用x64的库,所以我们用记事本打开makefile,将x86改成x64

在执行的时候要找到这个库  我们需要将这个库弄到 /lib文件夹

 sudo cp lib/x64/libmsc.so /lib

3、配置ARM的录音环境

链接:https://pan.baidu.com/s/1LZ0Lpj9DhqpMzhzYjp0xVg?pwd=scrt 
提取码:scrt

1、首先将alsa-1.0.tar.gz这个文件拷贝到开发板的 /home
     cp /mnt/udisk/alsa-1.0.tar.gz /home

2、在home目录里面解压这个文件
     tar xvf alsa-1.0.tar.gz

3、进入  alsa-1.0这个文件夹 
     cd  alsa-1.0
     进入这个文件夹里面的bin目录
     cd bin
     将这个bin目录里面的  arecord aplay这两个文件复制到 /bin
     cp arecord aplay /bin
    
4、 然后cd ..
     进入lib这个文件夹 cd bin
     将里面so这些动态库复制到 /lib这个文件夹
     cp libasound.s* /lib

5、回到home目录
      cd /home
      在home目录里面建立一个文件夹 叫gec
      mkdir gec
      继续在gec文件夹里面建立一个文件夹alsa-1.0.22
      mkdir -p /home/gec/alsa-1.0.22
      将这个alsa-1.0整体copy 到gec文件夹里面去 并且要换一个名字叫alsa-1.0.22(必须是这个名字)
      cd /home/alsa-1.0  进入这个文件夹
      cp -rf * /home/gec/alsa-1.0.22

6、录音环境配置完成,进行测试

      录音:arecord 1.wav  (ctrl + c结束)
      放音:aplay 1.wav

      录音4s,频率16000,保存为hehe.pcm:arecord -d4 -c1 -r16000 -traw -fS16_LE hehe.pcm
      放音:aplay -d4 -c1 -r16000 -traw -fS16_LE hehe.pcm

(录音是arecord ,放音是aplay ,其他参数都是一样的)

4、编程实现语音识别

我们进行语音识别时,也是在网络编程,需要客户端和服务端。在这里,客户端是开发板,开发板进行录音,并将录音文件发送给乌班图。Ubuntu是服务端,接收开发板发送过来的录音文件,并进行语音识别,返回语句的id。

在第二部分我们知道文件夹中的bin存放可执行文件以及识别的音频。我们进入bin文件夹可以看到一个call.bnf,用记事本打开:

看到这个,我们就能知道语音识别仅仅能识别返回在call.bnf定义了id的语句,那怎么才能识别我们想要说的话呢?简单,我们自己在里面加就可以了。比如加个“打开蜂鸣器”:

有了这个基础,我们后面才能实现语音控制开发板。

现在先实现简单的语句识别,即开发板录音并将录音文件发给ubuntu,ubuntu进行语音识别,并返回对应语句的id:

建立两个文件夹:client和server

client文件夹存放客户端程序tcp_client.c

server文件夹存放科大讯飞的sdk和服务端程序tcp_sever.c

由于这次是传文件,和上一篇网络编程的传法还是有些不同的

关键代码:

tcp_client.c :

void function(void)
{unsigned char buf[1024] = {0};while(1){//首先发送文件大小//阻塞你按回车printf("按回车继续\n");getchar();//弄你的文件printf("请录音4秒........\n");//获取音频文件 system("arecord -d4 -c1 -r16000 -traw -fS16_LE hehe.pcm");int fd = open("hehe.pcm",O_RDWR);if(-1 == fd){perror("open pcm error");exit(10);}int filesize = lseek(fd,0x00,SEEK_END);lseek(fd,0x00,SEEK_SET);//偏移到开头send(sockfd,&filesize,4,0);//接收信息 "error!!!" or "next!!!!"recv(sockfd,buf,9,0);printf("11111 %s\n",buf);if(strcmp(buf,"next!!!!")){printf("服务器错误了\n");continue;}//如果是"next!!!!"发送文件while(1){int r = read(fd,buf,1024);if(-1 == r){perror("read pcm error");break;}else if(0 == r){printf("over\n");break;				}else{send(sockfd,buf,r,0);}}close(fd);//等待接收idint id;recv(sockfd,&id,4,0);	if(id == 6666){printf("打印");}printf("id ===== %d\n",id);}
}

asr_offine_sample.c :

//一个全局的科大讯飞的id  也就是我最终想要得到的结果
int FlayId = 0;//0代表一个错误值//解析出相应的id出来 id固定为4位
int StringToId(const char * str)
{int id = 0;printf("------> %s\n",str);int len = strlen(str) - 3;//固定匹配  "id="这个字符串  模式匹配用正则表达式for(int i = 0;i < len;i++){if(!strncmp(str,"id=",3)){str += 4;//id=" 这个字符串给过掉printf("------> %s\n",str);id = (str[0]-'0')*1000+(str[1]-'0')*100+(str[2]-'0')*10+(str[3]-'0'); break;}str++;//一旦没有匹配 那么我们就往后面走一个}return id;
}//语音识别  返回结果
//返回的是ID  返回0表示识别失败
int GetFlayId(void)
{int ret = run_asr(&asr_data);if(MSP_SUCCESS != ret)//识别出错{printf("离线语法识别出错: %d \n", ret);return 0;}return FlayId;
}

tcp_server.c :

void SaveFile(int accceptfd,int filesize)
{//每一次都是重复的覆盖hehe.pcmint fd = open("wav/hehe.pcm",O_RDWR | O_TRUNC | O_CREAT, 0664);//截短这个文件if(-1 == fd){send(accceptfd,"error!!!",9,0);//失败发送这个错误return;}send(accceptfd,"next!!!!",9,0);//发送下一步的指令unsigned char buf[1024] = {0};int size = 0;//接收文件的内容while(1)		{int r = recv(accceptfd,buf,1024,0);if(-1 == r){perror("recv error");break;}else if(0 == r)//客户端已经断了{printf("对方断开连接了\n");break;}else//接收到信息了{//将文件的内容写入到文件write(fd,buf,r);//做完之后要退出size += r;if(size >= filesize)break;}}close(fd);
}//专门用于去服务一个客户的线程
void * ClinetFunction(void * arg)
{pthread_detach(pthread_self());//将其分离int * accceptfd = (int *)arg;printf(" * accceptfd = %d\n", * accceptfd);int filesize = 0;//你发什么信息过来  我就在这个信息之前加上一节 然后回发给你while(1){printf("\t\t等待客户端传文件过来........\n");int r = recv(*accceptfd,&filesize,4,0);//阻塞等待数据过来if(-1 == r){perror("recv error");break;}else if(0 == r)//客户端已经断了{printf("对方断开连接了\n");break;}else//接收到信息了{//文件大小SaveFile(* accceptfd,filesize);int id = GetFlayId();//文件接收完毕  那么我们就放过去识别即可//给客户端返回idsend(* accceptfd,&id,4,0);}}close(*accceptfd);free(accceptfd);return NULL;
}

完整工程:

链接:https://pan.baidu.com/s/1thUvAArWzcqmOT6QrvGHew?pwd=yuyi 
提取码:yuyi

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/586776.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

龙芯3A5000上安装使用QQ

原文链接&#xff1a;龙芯3A5000上安装使用QQ hello&#xff0c;大家好啊&#xff01;今天我要给大家带来的是在龙芯3A5000处理器上安装使用QQ的文章。近期&#xff0c;腾讯发布了最新版本的QQ&#xff0c;值得一提的是&#xff0c;这一版本增加了对Linux系统下龙芯架构的支持。…

KG+LLM(一)KnowGPT: Black-Box Knowledge Injection for Large Language Models

论文链接&#xff1a;2023.12-https://arxiv.org/pdf/2312.06185.pdf 1.Background & Motivation 目前生成式的语言模型&#xff0c;如ChatGPT等在通用领域获得了巨大的成功&#xff0c;但在专业领域&#xff0c;由于缺乏相关事实性知识&#xff0c;LLM往往会产生不准确的…

项目记录:利用Redis实现缓存以提升查询效率

一、概述 当我们查询所有数据时&#xff0c;如果缓存中没有&#xff0c;则去数据库查询&#xff0c;如果有&#xff0c;直接查缓存的数据就行。注意定期更新缓存数据。 二、主体代码 private static final String ROOM_SCHEDULES_HASH "RoomSchedules";Overridepu…

HTML---JavaScript基础

文章目录 目录 文章目录 本章目标 一.JavaScript基础 概述 特点 JavaScript 基本机构 语法 网页中引用JavaScript的方式 二. JavaScript核心语法 变量 ​编辑 数据类型 数组 练习 本章目标 掌握JavaScript的组成掌握JavaScript的基本语法会定义和使用函数会使用工具进行…

引领手游技术潮流:武汉灰京文化的卓越技术创新与市场推广支持

在数字娱乐领域&#xff0c;手游行业正蓬勃发展&#xff0c;为数以亿计的玩家提供了丰富的娱乐选择。武汉灰京文化&#xff0c;作为该领域的佼佼者&#xff0c;以其强大的技术创新和全面的市场推广支持&#xff0c;为合作伙伴的成功铺平了道路&#xff0c;不仅提升了游戏质量&a…

TV端Web页面性能优化实践

01 背景 随着互联网技术的持续创新和电视行业的高速发展&#xff0c;通过电视观看在线视频已经逐渐成为大众的重要娱乐方式。奇异果App作为在TV设备上用户活跃度最高的应用之一&#xff0c;为广大用户提供了丰富的内容播放服务&#xff0c;除此之外&#xff0c;同样有会员运营、…

【Kubernetes】什么是 kubectl ?

什么是 kubectl &#xff1f; 1.什么是 kubectl &#xff1f;2.Kubernetes 内部结构3.Kubernetes API 的作用 1.什么是 kubectl &#xff1f; 在学习如何更有效地使用 kubectl 之前&#xff0c;您应该对它是什么以及它如何工作有一个基本的了解。从用户的角度来看&#xff0c;…

Javaweb-servlet

一、servlet入门 1.Servlet介绍 (1)什么是Servlet Servlet是Server Applet的简称&#xff0c;是用Java编写的是运行在 Web 服务器上的程序&#xff0c;它是作为来自 Web 浏览器或其他 HTTP 客户端的请求和 HTTP 服务器上的数据库或应用程序之间的中间层。使用 Servlet&#…

CGAL的三角网格曲面脊线和脐点的近似计算(需要微分几何学的知识)

脊线&#xff08;Ridges&#xff09;&#xff1a;在光滑曲面上&#xff0c;脊线是一种特殊的曲线。沿着这条曲线&#xff0c;曲面的一个主曲率在其曲率线上达到极值&#xff08;最大或最小&#xff09;。这意味着脊线是那些曲率发生突变的区域&#xff0c;它们在形状感知、物体…

Android Studio下载gradle失败

1、打开Android Studio设置Gradle的地方&#xff0c;点击左上角的File->Settings查看gradle存放路径 C:\Users\Administrator.gradle\wrapper\dists\gradle-5.4.1-all\3221gyojl5jsh0helicew7rwx 2、找到正在下载的gradle版本&#xff0c;Android Studio取消下载gradle&…

Tomcat与Servlet是什么关系

Tomcat与Servlet是什么关系 Apache Tomcat和Servlet之间存在密切的关系&#xff0c;可以说它们是一对密切合作的组件。下面是它们的关系&#xff1a; Tomcat是Servlet容器&#xff1a; Tomcat是一个开源的、轻量级的Servlet容器。Servlet容器是一个Web服务器扩展&#xff0c;用…

2023.12.28 关于 Redis 数据类型 List 内部编码、应用场景

目录 List 编码方式 早期版本 现今版本 List 实际应用 多表之间的关联关系 消息队列 频道&#xff08;多列表&#xff09;消息队列 微博 Timeline 栈 & 队列 List 编码方式 早期版本 早期版本 List 类型的内部编码方式有两种 ziplist&#xff08;压缩列表&#xf…

Cisco模拟器-企业网络部署

某企业园区网有&#xff1a;2个分厂&#xff08;分别是&#xff1a;零件分厂、总装分厂&#xff09;1个总厂网络中心 1个总厂会议室&#xff1b; &#xff08;1&#xff09;每个分厂有自己的路由器&#xff0c;均各有&#xff1a;1个楼宇分厂网络中心 每个楼宇均包含&#x…

004、变量与可变性

1. 变量与可变性 在Rust中&#xff0c;变量默认是不可变的&#xff0c;这一设计是为了让你安全方便地写出复杂、甚至是并行的代码。 当然&#xff0c;Rust也提供了可使用的可变变量的方法&#xff0c;这个待会讨论。 当一个变量是不可变时&#xff0c;一旦它被绑定到某个值上面…

Java之程序、进程、线程、管程和并发、并行的概念

文章目录 1. 进程与线程1.1 程序1.2 进程1.3 线程1.4 管程 2.并行与并发2.1 并发2.2 并行 1. 进程与线程 1.1 程序 程序是指令和数据的有序集合&#xff0c;其本身没有任何运行的含义&#xff0c;是一个静态的概念。简单的说就是我们写的代码。 1.2 进程 &#xff08;1&…

分布式系统架构设计之分布式数据存储的分类和组合策略

在现下科技发展迅猛的背景下&#xff0c;分布式系统已经成为许多大规模应用和服务的基础架构。分布式架构的设计不仅仅是一项技术挑战&#xff0c;更是对数据存储、管理和处理能力的严峻考验。随着云原生、大数据、人工智能等技术的崛起&#xff0c;分布式系统对于数据的高效存…

科技云报道:开源才是大模型的未来?

科技云报道原创。 一年前&#xff0c;ChatGPT横空出世&#xff1b;7个多月后&#xff0c;Meta宣布开源LLaMA 2&#xff0c;并且可免费商用。 这一天&#xff0c;也成为大模型发展的分水岭。短时间内&#xff0c;LLaMA 2对一些闭源的大模型厂商造成了致命性的打击。 随后&…

【力扣100】207.课程表

添加链接描述 class Solution:def canFinish(self, numCourses: int, prerequisites: List[List[int]]) -> bool:# 思路是计算每一个课的入度&#xff0c;然后使用队列进行入度为0的元素的进出# 数组&#xff1a;下标是课程号&#xff0c;array[下标]是这个课程的入度# 哈希…

轻松调整视频时长,创意与技术的新篇章

传统的视频剪辑工具往往难以精确控制时间&#xff0c;而【媒体梦工厂】凭借其先进的算法和界面设计&#xff0c;让视频时长的调整变得简单而精确&#xff0c;助你释放无限的创意&#xff0c;用技术为你的创意插上翅膀&#xff0c;让每一秒都有意义。 所需工具&#xff1a; 一…

性能优化-如何提高cache命中率

本文主要介绍性能优化领域常见的cache的命中率问题&#xff0c;旨在全面的介绍提高cache命中率的方法&#xff0c;以供大家编写出性能友好的代码&#xff0c;并且可以应对性能优化领域的面试问题。 &#x1f3ac;个人简介&#xff1a;一个全栈工程师的升级之路&#xff01; &am…