如何做嵌入式人工智能

如何做嵌入式人工智能

人工智能技术与咨询 

图片

来源:PerfXLab澎峰科技

澎峰科技是中科院的技术团队,做过国际知名的开源矩阵计算库OpenBLAS,获得过中国计算机学会科技进步二等奖、中国科学院杰出科技成就奖,是国家高新技术企业、中关村高科技企业、中关村金种子企业。

什么叫嵌入式人工智能,或者说端上智能呢?其实并不是在嵌入或在设备端来训练深度学习模型,在部署阶段,我们的模型在服务器内训练,但是在实际使用的过程中,是在云端做部署,还是在端上设备做部署,两者会有很大的差异。大家见的比较多的是在云端做部署,比如很多API通过网络的方式上传图片,在云上计算并返回结果。使用嵌入式端部署的话,模型可能传输到了手机上,在此基础上可以做图像识别和处理功能,另外也可以传输到无人机上或智能摄像头上。

以抖音为例,里面有个美颜直播功能,当人脸动的时候,美颜的画像其实一直跟着人脸动,同时也有很多特效,这个就是嵌入式非常典型的应用。那么为什么不是拍好一段视频上传到云端,再做美颜呢?因为如果上传到云端再处理,交互性会非常差,无法让用户实时看到效果,成本也比较高。因此,所有的效果全部在手机端完成,交互性会更好。这里主要用到了三个算法:一是人脸检测,先找到人的脸;二是识别人脸关键点,找到人的鼻子在哪儿,眼睛在哪儿;三是做一些贴图,比如眼镜或小猫的贴图,不管人脸怎么动,甚至是旋转,贴图都可以时刻贴合人脸。

但是真正做嵌入式系统的时候会遇到一些挑战,最主要的挑战是运行速度。有些模型太大,是很难传输到手机上的,通常好几秒才能处理一张图像,或者功耗太高了,可能手机录一会儿就没电了,这些都是我们遇到过的挑战。要应对这种挑战,一般来说要从硬件、软件、算法三个方面共同努力,才能把嵌入式AI部署好。

介绍一下高性价比ARM SoC AI方案。以人脸识别为例,高性价比人脸识别设备支持本地2万张人脸库,联网抓拍模式可支持5万人脸库,识别时间在0.2秒以内。大家知道Caffe、Tensorflow框架,很多大公司做了很多服务器的训练框架,用来训练模型,但是训练完去部署的时候,如果还是照搬安装在手机上,其实非常耗资源,也非常笨拙。

现在有专门针对嵌入式平台的前向推理框架,前向推理框架的主要功能有五个方面。一是设备管理,一般来说嵌入式系统都是异构系统,不只是CPU,可能还有GPU、IPG或DSP,手机芯片里面有DSP,也可以用DSP做深度学习计算。二是除了异构性管理以外,还涉及模型管理。三是内存管理和存储格式,需要考虑以内存占用优先还是以性能优先。手机的内存通常很充足,但是一些更小的嵌入式设备、IoT级别的设备,内存非常受限,那就需要重点考虑。四是层级融合,从性能优化的角度来提升速度。五是实现方法选择。比如卷积,卷积是AI操作中非常重要的一部分操作,怎么做卷积最快有很多门道,卷积的实现方法有三到四种,要求底层的优化与上层的框架实现互相配合,而且要针对所调用的模型,根据效果做试配。可以通过性能评测看到结果,很多平台上都可以做性能评测。

下面看一下高性能FPGA AI方案。如果模型比较大,但又要求速度比较快,那么该如何去部署?典型的做法是用FPGA的AI来实现。我们支持两种常见的SoC架构和FPGA的开发生态。硬件部分结合软件工具,可以将训练好的模型经过量化、压缩等操作,部署在AI加速处理架构上,实现较高效的执行。AI加速处理架构主要分为PS端与PL端的两部分设计,实质上是用状态机控制模型,使用PE实现具体的卷积操作,从而获得比较好的性能。

使用该方案能得到比较快的速度,平台上的速度可达300MHz,7100芯片上的速度可达160M Hz,基本上都达到了每秒处理60帧的速度,同时DSP单元的使用率达到了95%。这项技术可以应用在无人机上,而且未来还可以形成定制芯片。

我们不仅要将硬件和软件结合起来做底层优化,在算法模型这一层也有很多工作要做。首先,针对嵌入式AI的深度学习模型,要专门做优化。其次,我们要做模型压缩功能,最常用的方法是蒸馏法。蒸馏法是指我们先在服务器上训练一个比较复杂的模型,再在此基础上训练一个小的模型,相当于一个老师教一个学生,这样学习来的小模型可以具备和大模型接近的性能效果,精度也更高,并且大大节省了计算资源。然后,我们要做量化。最后,我们持续研发新型的网络结构,从而进一步降低计算量。(根据演讲内容整理,未经本人审核)

图片

图片

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481816.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如果宇宙是答案,那么问题是什么?

来源:未读利昂莱德曼(Leon Max Lederman,1922-2018),前费米国家加速器实验室主任,美国科学促进会理事会主席。他主持设计了超导超级对撞机建造计划,是“上帝粒子”一词的提出者。198…

通信网信息传输与分发技术国家级重点实验室2021年度预研基金项目申请指南

通信网信息传输与分发技术国家级重点实验室2021年度预研基金项目申请指南 人工智能技术与咨询 人工智能技术与咨询 北京龙腾亚太教育咨询有限公司依托中国管理科学研究院职业资格认证培训中心成立于2016年9月30日,并于2020年开始与中华文化促进会、中国国家人事人才培训网合…

寻找可落地的因果科学范式:从因果推理到因果学习

来源:集智俱乐部作者:丁善一 编辑:邓一雪导语目前在互联网的交互框架内,用户和消费者只被允许做“有限的表达”,比如被设计好的制式问题、按钮、案件、关键词命中等等,从而臆测主观诉求,然后希望…

液体火箭发动机技术国家级重点实验室2021年度对外开放项目指南

液体火箭发动机技术国家级重点实验室2021年度对外开放项目指南 人工智能技术与咨询 国家级重点实验室 简介 西安航天动力研究所液体火箭发动机技术国家级重点实验室瞄准面向航天运输系统对液体火箭发动机技术的需求,重点开展基础性、创新性和重大关键技术的预先研…

迈向可验证的 AI: 形式化方法的五大挑战

来源:前沿科技作者:Sanjit A. Seshia, Dorsa Sadigh, S. Shankar Sastry编译:李梅、黄楠编辑:陈彩娴人工智能试图模仿人类智能的计算系统,包括人类一些与智能具有直观联系的功能,例如学习、解决问题以及理性…

数字孪生及其在航空航天中的应用

数字孪生及其在航空航天中的应用 人工智能技术与咨询 来源:《航空学报》,作者孟松鹤等 摘要: 数字孪生已引起国内外的广泛重视,可看作是连接物理世界和数字世界的纽带。其通过建立物理系统的数字模型、实时监测系统状态并驱动模型动态更新实…

【综述专栏】马毅沈向洋曹颖最新AI综述火了!

来源:量子位在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异。对于AI从业者来说,在广袤的…

水声被动定位中的机器学习方法研究进展综述

水声被动定位中的机器学习方法研究进展综述 人工智能技术与咨询 来源:《信号处理》,作者牛海强等 摘 要: 本文对基于机器学习方法的水声被动定位研究进展进行了综述。所涉及的机器学习方法有多层感知机(前馈神经网络)、支持向量机、随机森…

不盲追大模型与堆算力!沈向洋、曹颖与马毅提出理解 AI 的两个基本原理:简约性与自一致性...

来源:AI科技评论论文作者:马毅、曹颖、沈向洋整理:西西编辑:陈彩娴近两年,“大力(算力)出奇迹”的大模型成为人工智能领域多数研究者的追求趋势。然而,其背后巨大的计算成本与资源耗…

微服务技术发展的现状与展望

微服务技术发展的现状与展望 人工智能技术与咨询 来源:计算机研究与发展,作者冯志勇等 摘 要 随着云计算、物联网等技术迅速发展,用户对软件系统的需求趋于多样化,面向服务的体系架构(service oriented architecture, SOA)需要…

规则引导的知识图谱联合嵌入方法

规则引导的知识图谱联合嵌入方法 人工智能技术与咨询 本文来自《计算机研究与发展》 ,作者姚思雨等 摘 要 近年来,大量研究工作致力于知识图谱的嵌入学习,旨在将知识图谱中的实体与关系映射到低维连续的向量空间中.且所学习到的嵌入表示已…

潘云鹤院士获吴文俊人工智能最高成就奖!第十一届“吴文俊人工智能科学技术奖”揭晓...

来源:中国人工智能学会文章整理:自央视新闻、北京日报链接:https://content-static.cctvnews.cctv.com/snow-book/video.html?item_id7729020039002188616&t1657962648440&toc_style_idvideo_default&share_towechat&track_…

基于深度强化学习的区域化视觉导航方法​​

基于深度强化学习的区域化视觉导航方法 ​​人工智能技术与咨询​​ 本文来自《上海交通大学学报》,作者李鹏等 在环境中高效导航是智能行为的基础,也是机器人控制领域研究的热点之一.实现自主导航的传统方法是结合一系列硬件和算法解决同步定位和建图、路径规划…

智源就“抄袭事件”发布最新通报:2 处属于抄袭,已得到原作者谅解,相关责任人均已主动离职...

来源:AI前线整理:冬梅大模型论文抄袭事件,终于有了结果。今年 4 月,一篇名为《A Roadmap for Big Model》(大模型路线图)的论文被爆出抄袭,该篇论文中涉及国内 19 家机构和百名 AI 学者&#xf…

人工智能技术在智能制造中的典型应用场景与标准体系研究

人工智能技术在智能制造中的典型应用场景与标准体系研究 人工智能技术与咨询 来源:《中国工程科学》 ,作者李瑞琪等 摘要: 针对人工智能在智能制造领域应用不断深入的趋势,本文基于企业关键绩效指标(KPI&#xff09…

旷视张祥雨:从基础科研的「大」和「统一」,看视觉AI研究新趋势

来源:机器之心在 MegTech 2022 上,旷视研究院基础科研负责人张祥雨表示:“大”和 “统一” 是视觉 AI 基础研究的新趋势。基础模型科研是 AI 创新突破的基石,每一代基础模型的突破都极大程度地促进了视觉 AI 的发展。7 月 15 日&a…

基于位置的知识图谱链接预测

基于位置的知识图谱链接预测 人工智能技术与咨询 本文来自《中文信息学报》,作者张宁豫等 摘 要: 链接预测是知识图谱的补全和分析的基础。由于位置相关的实体和关系本身拥有丰富的位置特征,该文提出了一种基于位置的知识图谱链接预测方法。该方法首…

意识理论综述:众多竞争的意识理论如何相互关联?

来源: 集智俱乐部作者:Anil K. Seth & Tim Bayne译者:李路凯、陈斯信编辑:邓一雪 导语意识和底层的神经活动之间如何联系起来?试图解释这一问题的意识理论层出不穷。然而,随着实验数据积累,…

滑翔导弹末段多约束智能弹道规划

滑翔导弹末段多约束智能弹道规划 人工智能技术与咨询 来源:《光学精密工程》,作者邵会兵等 摘要:滑翔导弹末段飞行时空复杂度高、不确定性强、约束多,给弹道规划与制导算法带来了较大的建模和求解难度。针对这一问题&#xff0…

《时代》杂志:元宇宙时代将改变世界

来源:新智元元宇宙上了Time封面,有点官宣那味儿了!还在纠结会不会错过元宇宙和web3浪潮?清华大学科学史系副教授胡翌霖,这次给你讲个透!元宇宙——下一个数字时代将会改变一切。这是最新一期的Time杂志封面…