紫光展锐M6780丨一语即达,“声”临其境

在前面四期,紫光展锐针对M6780的显示技术进行了系列揭秘。虽名为“智能显示芯片”,但M6780的魅力远不止于超高清智能显示,更有智能语音交互功能,助力打造数字世界的交互新体验。

智能语音技术是一种基于人工智能和语音识别技术的创新领域,它使得智能终端能够理解和处理用户的语音指令及交流。在智能家居和物联网领域,随着智能家居设备的普及和用户对便捷交互的需求增加,智能语音技术成为人们控制设备、查询信息、实现家居数字化的主要方式之一。

紫光展锐M6780从用户角度出发,在智能语音技术领域进行技术创新,带来了全面的体验升级!

图片

完整端侧智能语音解决方案-让交互“更智能”

语音助手如今已是智能终端的标配,M6780作为紫光展锐首款智能显示芯片集成了完整端侧智能语音方案。通过紫光展锐自研的多麦克风阵列分离降噪、智能语音唤醒识别、端侧命令词识别等技术,让芯片可以听得清、听得懂、能执行。

阵列分离降噪技术可以实现对外界干扰噪声和回声的抑制消除,让设备“听得清”;智能语音唤醒识别技术,确保设备“听得懂”。该方案(详见图二)完全集成在端侧,相对于云端唤醒识别算法,交互延迟更低,无需云端计算资源节省成本,且无隐私风险。

图片

多麦克风阵列分离降噪技术

在日常生活中,当电视正在播放电视节目,如果用户想语音控制电视,在嘈杂环境下设备如何才能够听清用户指令?这便需要回声消除技术——针对电视多扬声器、大音量的特性,紫光展锐研发出多通道立体声回声消除技术和自适应残留回声抑制技术,共同保证双工交互场景的成功率。

图片

针对家居场景中,噪声类型多、混响大、拾音距离远信噪比差的问题。紫光展锐将盲源分离和波束形成技术深度结合,实现了两者算法短板的互补,兼容了二者的优势。即使在多干扰的嘈杂环境也可以保障用户流畅交互。

M6780搭载了完整的声学前端阵列分离技术,能够解决噪声、回声和混响对用户交互体验的影响。经专业实验室测试,紫光展锐自研的声学前端系统使得噪声场景下唤醒率提升平均在25%左右,特别是低信噪比场景下,唤醒率提升明显。在回声场景下,唤醒率平均提升90%左右,达到了业界先进水平。

双级唤醒技术

语音唤醒作为语音交互的门户,需要24小时不间断运行(always on),需要保证高唤醒率、低误唤醒率,同时要求具有较低的计算和内存开销,以满足低功耗、低成本需求。为实现高性能、低功耗,展锐采用两级唤醒策略:

第一级唤醒模型为超轻量级,参数量仅为50k左右,部署在协处理器。当开启语音唤醒功能,一级唤醒处于always on状态,实时监测音频流中是否包含唤醒词。这个阶段只需要非常低的计算资源,因此在长时间运行的过程中能够有效地减少功耗,同时也能保证一个较高的召回率水平。

第二级模型建模粒度更细,计算量也更大,部署在主处理器,只有在一级唤醒网络检测成功后才会触发。该级唤醒能够压制从一级唤醒过来的几乎所有虚警,只有该级唤醒词识别成功后才会触发后续的语音响应。两级唤醒策略可以合理地使用SoC资源,在资源消耗和唤醒性能之间达到一个较好的平衡。

端侧命令词识别技术

唤醒只是语音交互的第一步,紧随而至的控制指令识别才是交互需求的目的。语音识别控制作为语音交互的核心诉求,需要满足低延迟、高准确率等,否则易降低用户使用语音助手的意愿。

紫光展锐M6780支持电视常用热词识别,即使在无网络的情况下,也可以实现对设备基本操作的控制。命令词识别过程中通常面临集内互为相近词的误识问题,例如“上一频道”和“下一频道”,这对于准确率的优化提升非常不利,而该问题对用户体验影响非常关键。因此紫光展锐在模型的区分性训练和解码优化策略上都针对性地提出了多种创新方案,在保证识别率的同时,集内相近词误识降低了48%。

同时,紫光展锐设计了“一语即达”one-shot方案(唤醒词和命令词一起说,不需要等待中间唤醒反馈),实现了更自然的人机交互方式。为了更贴合用户实际使用电视的习惯,我们也增加了设备“延时聆听”功能,用户仅需一次唤醒,在一定时间内实现多次交互控制的需求。

图片

噪声场景实验室唤醒性能对比图

图片

回声场景实验室唤醒性能对比图

紫光展锐M6780智能语音方案,在听音室客观条件下安静场景唤醒率98%、带噪场景综合唤醒率90%以上,虚警控制在1次/24h以下。命令词识别也实现了安静场景96%、带噪场景90%的识别率的高性能。在于不同竞品的对比测试中,M6780方案综合唤醒率排名位于前列,达到业界领先水平。M6780智能语音系统凭借优异的前后端音频算法以及软硬件实现,让语音交互“更智能”。

作为世界领先的平台型芯片设计企业,紫光展锐坚持以技术创新为核心,全力提升产品、技术能力,强化公司核心竞争力,推动公司跨越式发展,为产业和社会创造价值,用科技之光照亮幸福生活。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/669838.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

踩坑了,MySQL数据库生成大量奇怪的大文件

作者:田逸(formyz) 一大早就收到某个数据库服务器磁盘满的报警信息,其中数据盘使用率超过90%,如下图所示。 这是一台刚上线不久的MySQL从库服务器,数据盘的总容量是300G。先登录系统,查看主从同…

【VUE】UniAPP之uview组件库,自定义tag封装,支持添加u-icon图标

组件代码 <template><view class"tag" :class"[props.mode, props.shape]"><slot name"left"><!-- icon图标 没有传入图标时不显示 --><u-icon v-if"props.icon ! " :name"props.icon" :color&…

MySQL学习一、库和表的基础操作

目录 一、常用数据类型 1.数值类型 2.字符串类型 3.日期类型 ​二、数据库的基础操作 三、表的基础操作 一、常用数据类型 1.数值类型 数值类型可以指定为无符号&#xff08;unsigned &#xff09;&#xff0c;但不建议取 2.字符串类型 3.日期类型 二、数据库的基础操作…

零售新业态,让老牧区焕发新生命

敦煌老马一声魔性“浇给”勾起了无数人对羊肉的食欲&#xff0c;而当大家集体涌入餐厅或者在网上下单&#xff0c;都想要尝一尝网红同款的时候&#xff0c;可能并没有想过这样一个问题——为什么在今天&#xff0c;即便是远离牧区的现代大城市&#xff0c;草原羊肉却一样能触手…

单片机串口 奇偶校验 配置问题

一、问题描述 使用GD32单片机串口进行通信测试&#xff0c;单片机的串口配置的是偶校验(Even)、数据位为8、停止位为1、波特率为9600。串口测试软件用的格西烽火&#xff0c;软件的配置如下&#xff1a;   单片机通过串口和串口测试软件进行通信交互&#xff0c;软件收到的数…

时钟算法---模运算、乘法逆元

使用时钟讲解了模运算和乘法逆元 1.加法 2.减法 3. 乘法 4. 除法&#xff08;乘法逆元&#xff09; 5.乘方 6. 对数 乘方的逆运算称为对数。在一般的数学中&#xff0c;求对数并不难&#xff0c;例如&#xff1a;

记一次页面接口502问题:“502 Bad Gateway”

接收别人的项目进行迭代&#xff0c;项目部署到服务器上之后&#xff0c;有一个接口数据刷不出来&#xff0c;一直502 后来联想到网关的问题&#xff0c;想通过设置白名单的方式解决&#xff0c;设置之后依旧不行。 查看nginx日志发现报错&#xff1a; *169 connect() failed …

ELFK日志采 - QuickStart

文章目录 架构选型ELKEFLK ElasticsearchES集群搭建常用命令 Filebeat功能介绍安装步骤Filebeat配置详解filebeat常用命令 Logstash功能介绍安装步骤Input插件Filter插件Grok Filter 插件Mutate Filter 插件常见的插件配置选项&#xff1a;Mutate Filter配置案例&#xff1a; O…

Leetcode24:两两交换链表中的节点

一、题目 给你一个链表&#xff0c;两两交换其中相邻的节点&#xff0c;并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题&#xff08;即&#xff0c;只能进行节点交换&#xff09;。 示例&#xff1a; 输入&#xff1a;head [1,2,3,4] 输出&#xff…

亲测解决vscode的debug用不了、点了没反应

这个问题在小虎登录vscode同步了设置后出现,原因是launch文件被修改或删除。解决方法是重新添加launch。 坏境配置 win11 + vscode 解决方法 Ctrl + shift + P,搜索debug添加配置: 选择python debugger。 结果生成了一个文件在当前路径: launch内容: {// Use Int…

centos安装inpanel

前置条件 安装python yum -y install python 安装 cd /usr/local git clone https://gitee.com/WangZhe168_admin/inpanel.git cd inpanel python install.py 安装过程需要设置账户 密码 端口号 我设置的是admin:admin 10050 使用 打开浏览器,输入 http://192.168.168.…

AI助力农作物自动采摘,基于YOLOv7【tiny/l/x】不同系列参数模型开发构建作物生产场景下番茄采摘检测计数分析系统

去年十一那会无意间刷到一个视频展示的就是德国机械收割机非常高效自动化地24小时不间断地在超广阔的土地上采摘各种作物&#xff0c;专家设计出来了很多用于采摘不同农作物的大型机械&#xff0c;看着非常震撼&#xff0c;但是我们国内农业的发展还是相对比较滞后的&#xff0…

YOLO-World——超级轻量级开放词汇目标检测方法

前言 目标检测一直是计算机视觉领域中不可忽视的基础挑战&#xff0c;对图像理解、机器人技术和自主驾驶等领域具有广泛应用。随着深度神经网络的发展&#xff0c;目标检测方面的研究取得了显著进展。尽管这些方法取得了成功&#xff0c;但它们存在一些限制&#xff0c;主要体…

Spring Web Header 解析常见错误

在上一章&#xff0c;我们梳理了 URL 相关错误。实际上&#xff0c;对于一个 HTTP 请求而言&#xff0c;URL 固然重要&#xff0c;但是为了便于用户使用&#xff0c;URL 的长度有限&#xff0c;所能携带的信息也因此受到了制约。 如果想提供更多的信息&#xff0c;Header 往往…

Redis(三)(实战篇)

查漏补缺 1.spring 事务失效 有时候我们需要在某个 Service 类的某个方法中&#xff0c;调用另外一个事务方法&#xff0c;比如&#xff1a; Service public class UserService {Autowiredprivate UserMapper userMapper;public void add(UserModel userModel) {userMapper.…

Antd+React+react-resizable实现表格拖拽功能

1、先看效果 2、环境准备 "dependencies": {"antd": "^5.4.0","react-resizable": "^3.0.4",},"devDependencies": {"types/react": "^18.0.33","types/react-resizable": "^…

Linux中有名管道和无名管道

无名管道基础 进程间通信介绍 常用通信方式 无名管道&#xff08;pipe&#xff09; 有名管道 &#xff08;fifo&#xff09; 信号&#xff08;signal&#xff09; 共享内存(mmap) 套接字&#xff08;socket&#xff09;过时的IPC通信方式 System V IPC 共享内存&#xff08;sh…

Windows下Node.js下载安装及环境变量配置教程

Windows下Node.js下载安装及环境变量配置教程 安装版本&#xff1a;node-v18.19.0-x64.msi 文章目录 Windows下Node.js下载安装及环境变量配置教程一、Node.js和NPM简介二、下载地址三、安装步骤四、环境配置五、安装淘宝镜像总结 一、Node.js和NPM简介 1、Node.js &#xf…

数据结构|对称矩阵压缩存储的下标公式推导|如何求对称矩阵压缩存储对应的一维数组下标

因为考试的时候可能会给很多情况的变式题&#xff0c;所以要会推导而不是背公式&#xff0c;情况变了&#xff0c;公式就不管用了。 行优先、只存储主对角线下三角区&#xff1a; 矩阵下标 ai,j(i>j)->一维数组下标 B[k] 按照行优先的原则&#xff0c;确定 ai,j 是一维数…

Unity3D实现项目限制功能(使用次数限制和时间限制)

系列文章目录 unity工具 文章目录 系列文章目录前言一、时间限制1-1、代码如下&#xff1a; 二、次数限制2-1、 在Unity项目中需要对注册表进行操作&#xff0c;还需要设置一下API兼容级别设置成 .NET Framework2-2、设置如下图 Player里面2-3、代码如下&#xff1a; 三、同时…