边缘计算芯片格局分析

640?wx_fmt=png

来源:半导体行业观察 


近日,华为和比特大陆纷纷发布了针对边缘计算的新芯片产品。华为的Ascend系列采用达芬奇架构,其中Ascend 310功耗8W算力8TOPS正是针对边缘计算市场。而之后比特大陆发布的BM1682和BM1880也是针对边缘计算市场,其中BM1682功耗30W算力3TFlops针对边缘服务器市场,而BM1880功耗3W整数算力2TOPS则是针对边缘终端市场。人工智能结合边缘计算已经成为最热门的市场之一,我们今天就来分析并展望这个市场。


近日,华为和比特大陆纷纷发布了针对边缘计算的新芯片产品。华为的Ascend系列采用达芬奇架构,其中Ascend 310功耗8W算力8TOPS正是针对边缘计算市场。而之后比特大陆发布的BM1682和BM1880也是针对边缘计算市场,其中BM1682功耗30W算力3TFlops针对边缘服务器市场,而BM1880功耗3W整数算力2TOPS则是针对边缘终端市场。人工智能结合边缘计算已经成为最热门的市场之一,我们今天就来分析并展望这个市场。

640?wx_fmt=jpeg

640?wx_fmt=jpeg

华为和比特大陆都纷纷在边缘人工计算市场布局


边缘计算新兴市场


人工智能芯片市场第一个得到关注的是云端服务器市场,Nvidia的GPU以其强劲的算力掌握了大部分市场。随着人工智能的铺开,边缘计算(edge computing)的概念也得到了越来越多的认可。


边缘计算相对于云计算有几点优势,首先是延迟较小,在云端和终端通常有几十毫秒到几百毫秒不等的网络延迟,对于工业应用等对延迟有高要求的应用来说云端部署人工智能无法满足其对于延迟的需求;其次是数据隐私,有些应用不希望把数据传输到云端,一方面担心云端数据被云运营商看到,另一方面担心数据传输过程中被黑客劫持;最后是可靠性,如果把人工智能部署在云端那么一旦网络断了在终端的人工智能程序就无法工作了,这对于要求高可靠性的应用来说难以满足要求,但是如果把人工智能部署在边缘就没有这个问题。


边缘人工智能计算中其实还包含了多个层次,一种是终端设备(如手机)上的人工智能计算,这样的规划把人工智能计算直接放到终端设备上,可以实现最低的延迟。然而,由于终端设备的电池容量有限或者对于散热容忍度较低,因此在终端设备上做人工智能计算对于AI芯片的能效比提出了极高的要求,同时这样也并非唯一的边缘计算形态。


除了终端设备上的直接做计算之外,还可以把终端的数据放到离终端比较近的本地服务器去计算。例如,对于工业应用这样的对于稳定性和延迟有要求但是又可以做集群化计算的应用,除了把计算直接放到终端设备之外另一种方法就是就近设立边缘服务器让计算放到边缘服务器上去做然后快速返回给终端设备。边缘服务器对于芯片功耗的要求相比在终端设备上直接计算就会宽松许多,因此非常适合于这种可以集群化计算的应用。


边缘计算的两种市场目前都已经在起飞。而相关AI芯片也得到了许多关注。标志性事件是华为的两次芯片发布会。去年秋天发布的麒麟970芯片附带NPU,可以说是人工智能部署在手机的一次重要尝试。今年秋天又发布了Ascend系列芯片,其中Ascend 310芯片也是针对边缘服务器市场并且华为已经开发了基于Ascend 310的边缘计算服务器准备部署在自动驾驶领域。因此我们可以预计在未来无论是相关应用还是相关芯片都将有更多公司大手笔投入,从而推动AI进一步发展。


边缘服务器的芯片形态与竞争格局


边缘服务器的市场现在来看将是人工智能最早落地的应用之一(甚至比手机里的人工智能还要早且成熟),因为目前中国的智能摄像头产品已经在安防、人脸识别等领域真正落地,而边缘服务器是很适合智能摄像头的产品形态,一方面在不少此类应用中对于可靠性有很强的需求,因此部署在边缘端的人工智能更适合;另一方面智能摄像头的计算可以集群化操作,因此一个边缘服务器处理多路智能摄像头的形式是非常经济的方式。除了智能摄像头之外,无人驾驶也是边缘服务器的一个例子,因为在无人车里面需要做传感器融合做大量计算,相当于在无人车上部署了一个边缘服务器。


边缘服务器市场通常对于通用性有一定需求,因此比较合适的方案是处理器加上通用型深度学习加速芯片,而深度学习加速芯片最常见的形式是以PCIe加速卡的形式插到主板上,并与主处理器协同工作。值得注意的是,由于边缘服务器对于人工智能算法精度有一定要求,因此往往使用的是类似半精度浮点数的运算方式,很多边缘终端芯片上常见的INT-4甚至INT-2等激进的低精度整数运算由于损失精度过多因此在边缘服务器不太适合。


我们认为边缘服务器市场尚属于新兴市场,加入战场的公司并不多,目前仅有Nvidia,华为,比特大陆等, 而且不同的公司可以主打不同的细分市场,因此市场竞争远未饱和。我们不妨来分析一下Nvidia,华为和比特大陆三家公司的竞争格局。Nvidia的产品是Xavier芯片,峰值算力30TOPS,功耗30W,主要针对的是自动驾驶市场,因此芯片上还集成了双目视觉、光流等,模组售价2499美元,显然是针对高端自动驾驶市场,而对于智能摄像头等对于部署成本有要求的场合并不合适。


华为的Ascend 310定位中高端,其8W/8TFlops的性能下可覆盖智能摄像头市场,上可进击自动驾驶市场(华为已经与奥迪合作,发布了基于Ascend 310芯片的自动驾驶边缘服务器MDC600)。而比特大陆则是主打性价比路线,BM1682自带视频解码和后处理操作且集成了CPU,因此客户需要加速智能机器视觉相关应用时理论上只需要BM1682即可,无需再去购入额外的CPU,这也降低了成本。

640?wx_fmt=jpeg

华为基于Ascend 310的MDC600边缘计算服务器主攻自动驾驶市场


目前在中国市场,最主要的市场还是安防等应用的智能摄像头,因此产品定位决定了主要是华为和比特大陆之间的竞争,那么比特大陆和华为之间的竞争格局会如何呢?

我们认为,首先这个市场很大,华为和比特大陆的主打方向也不相同(华为主打性能而比特大陆走性价比路线),因此并不存在势不两立的激烈竞争。另一方面,其实华为和比特大陆的共同竞争对手是海康威视这样的智能摄像头系统厂商,一旦海康威视也开始自研芯片且在自己的安全摄像头系统中以各种方式推广自研边缘服务器,那么华为和比特大 陆的压力将会很大。不过我们预计到那个时候智能摄像头以外的市场也会变得成熟,从而给华为和比特大陆等芯片公司提供新的机会,而不用被迫在智能摄像头领域与巨头系统厂商竞争。


边缘终端市场的芯片形态与竞争格局


边缘终端市场是指直接在终端设备上做计算的AI芯片,对于功耗和能效比有很强的要求。目前来看,边缘终端市场有两种形态的芯片产品,一种是针对特定应用的SoC,一种是通用加速器做独立芯片。SoC面向专用市场,在芯片中深度学习加速计算事实上只是一小部分,而其他大部分芯片面积则交给了主控处理器、视频解码等等模块。SoC集成度高,一般的技术路线是用新的SoC代替原有的不支持深度学习加速的SoC做更新换代。


一个典型的例子就是华为麒麟系列SoC加入寒武纪的NPU,就属于SoC自己的更新换代。专注于AI芯片的厂商进入SoC市场的策略往往是提供IP授权,以发挥自己的强项(如寒武纪给华为提供NPU IP)。对于SoC往往针对的是一个特定市场,因为其中的模块都是针对该应用而设计,如果用在其他应用中则显得浪费,例如麒麟SoC最适合的场景是手机,其中包含的GPU、ISP、Modem等都是为了手机场景打造,如果是用在工业场景则这些模组都闲置了,因此也就引出了另一个终端通用型深度学习加速器芯片市场。该市场相对于SoC市场来说允许较低的集成度,即可以在主控芯片之外再搭配额外的芯片以支持相应功能。


在终端SoC市场,事实上竞争已经白热化,华为、高通等公司都纷纷推出专属的SoC搭载 AI加速模组,而AI加速模组IP的提供商也有ARM,Cadence,CEVA等传统IP提供商以及寒武纪这样的初创公司。不少传统SoC芯片公司都纷纷在自家SoC中加入自研或授权的人工智能模块。对于人工智能终端SoC市场,我们的分析是该市场虽然最早得到关注但是很可能近几年还是被原来的SoC公司占领市场,因为目前终端人工智能市场尚未真正落地收获真金白银,因此SoC中加入人工智能还只是锦上添花之举。

在IP授权方面,Cadence和ARM入局意味着小公司面临巨大压力,因为IP市场存在一定的头部效应,且Cadence和ARM可以通过与其他的优势IP做捆绑销售来推销其人工智能IP,在人工智能并非最关键SoC模组的市场现状下,小公司想要与Cadence和ARM等巨头竞争只能走差异化,例如超低功耗或模拟计算等路线。


终端通用深度学习加速器芯片市场的应用则刚起步,之前Movidius推出的神经计算加速棒并未引起巨大反响。但是这并不代表这个市场不存在,而是还处于幼年期,需要培养,因此许多公司在这个市场布局主要一是培养开发者生态,另一方面也探索研究哪个市场最有潜力,预计在市场成熟之后再收缩战线,针对几个重要的应用推出相应的优化芯片,从而占领最合适的市场。因此,目前对于这个市场最合适的策略是推出开发板和插件式加速硬件(如USB加速棒)这样简单易用的产品,这样厂商和客户可以一起探索市场需求,决定最佳产品形态。 我们看到比特大陆就是在这个市场跟随Movidius推出了BM1880芯片,并配套推出了开发板、芯片模组以及USB加速棒等多种硬件形态供客户挑选,我们相信在近期将会看到通用型终端人工智能加速器的更多应用。


未来发展预期


如之前的分析,我们预计在人工智能边缘计算会成为未来最重要的人工智能硬件市场之一。在边缘计算领域,边缘服务器芯片市场非常重要但是目前厂商不多,我们预期会有不少公司入局,包括从芯片领域提出超高性能的初创公司,以及海康威视这样的系统厂商开始自研芯片,而如华为、比特大陆等已经提前入场的公司也会继续加大投入。


在终端边缘计算市场,SoC芯片(AI加速器IP)领域竞争已经非常激烈,未来恐怕会有一波洗牌的过程,最后只会剩下几家能在不同细分市场牢牢把握住客户的公司。在通用终端加速器芯片领域我们则可望看到更多应用出现,在未来几年内我们能看到的边缘终端加速器应用实际上将会很大程度上决定这个市场的具体规模。


最后,我们必须看到边缘计算等人工智能芯片应用目前最大的市场其实在中国。这是因为中国的人工智能落地情况远好于美国。在政府的支持下,旷视、商汤、依图等初创企业纷纷推出优秀的产品并在市场上站住了脚跟,这一方面加速了基于人工智能的应用成熟,另一方面也给人工智能芯片带来了市场,从而为人工智能的完整产业链的成熟带来了机会。我们可以肯定地说,人工智能芯片的未来还得要看中国!


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/493801.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于PCA的人脸特征抽取

我们将应用PCA技术来抽取人脸特征。一幅人脸照片往往由比较多的像素构成,如果以每个像素作为1维特征,将得到一个维数非常高的特征向量, 计算将十分困难;而且这些像素之间通常具有相关性。这样,利用PCA技术在降低维数的…

超市的100年发展史:好日子终结 亚马逊无人店是趋势

来源:网易智能 电商巨头亚马逊已经在旧金山、西雅图和芝加哥等地开设了多家无人便利店Amazon Go,它们向顾客展现了无缝购物体验这种未来购物模式,它依赖于高科技追踪技术,消费者只需将商品从货架上取下,并放入帆布手提…

图像识别初步

本文主要包括以下内容 模式与模式识别的基本概念过度拟合最小距离分类器基于相关的模板匹配本章的典型案例分析 基于最小距离分类器的鸾尾属植物分类基于相关技术的图像模式匹配 模式识别概述 模式识别(Pattern Recognition)是人类的一项基本智能,在日常生活中…

下一个人才大缺口:量子计算研究人员

来源:36Kr初创公司Zapata Computing的创始人兼首席执行官克里斯托弗萨瓦(Christopher Savoie)表示,他向三位专攻量子计算的外国科学家提供了就业机会,他在等他们的工作签证获得批准。但几个月过去了,这家位…

LIBCMTD.lib与libcpmtd冲突的解决方法。

error: 1>uafxcwd.lib(afxmem.obj) : error LNK2005: "void * __cdecl operator new(unsigned int)" (??2YAPAXIZ) 已经在 LIBCMTD.lib(new.obj) 中定义 1>uafxcwd.lib(afxmem.obj) : error LNK2005: "void __cdecl operator delete(void *)" (??…

基于PCA和SVM的人脸识别

svm推广到多类情况 一对多的最大响应策略(one against all) 假设有A 、B、C.. D四类样本需要划分。在抽取训练集的时候,分别按照如下4种方式划分。 A. 所对应的样本特征向量作为正集(类标签为1), B、C、D所对应的样本特征向量作为负集(类…

为何协作机器人能够兴起?“协作机器人-激烈的市场谁能杀出重围”

来源:机器人大讲堂作者:包文涛,哈尔滨工业大学机器人研究所工学硕士,在机器人和工业自动化领域有超过10年的专业经验。曾任职于ABB集团,先后在新加坡、美国、加拿大等地工作,在产品管理、技术方案、项目工程…

5款新颖的ReSharper插件

ReSharper是著名的代码生成工具。自ReSharper 8.0版本发布以来,新的扩展管理器、模板设置、分发安装等功能改革使得对插件的要求变高。接下来小编整理了5款新颖插件。 JetBox 当开发者工作在不同的机器设备时,这个插件可以利用DropBox同步ReSharper设置。…

机器学习实战之K近邻算法

k近邻算法概述 简单地说,K近邻算法采用测量不同特征值之间的距离方法进行分类。 优 点 :精度高、对异常值不敏感、无数据输入假定。 缺点:计算复杂度高、空间复杂度高。 适用数据范围:数值型和标称型。 它的工作原理是:存在一个样本数 据集合,也称作训练样本集,并且样本集…

神经网络的叛离:32年前从心理学与生理学分离的瞬间

来源:大数据文摘编译:Andy反向传播算法隶属于深度学习,它在解决模型优化问题的方面有着重要的地位。这一算法由被誉为深度学习之父的Geoffrey Hinton提出。1986年,他发表了名为Learning representations by back-propagating erro…

希尔排序-插入改进

引自:http://hi.baidu.com/gsgaoshuang/item/17a8ed3c24d9b1ba134b14c2 学习算法的一个好网站 http://student.zjzk.cn/course_ware/data_structure/web/paixu/paixu8.2.2.1.htm 希尔排序(Shell Sort)又称为缩小增量排序,输入插入…

机器学习实战之决策树

你是否玩过二十个问题的游戏,游戏的规则很简单:参与游戏的一方在脑海里想某个事物,其他参与者向他提问题,只允许提20个问题,问题的答案也只能用对或错回答。问问题的人通过 推断分解,逐步缩小待猜测事物的范围。决策树的工作原理与20个问题类似,用户输人一系列数 据,然后给出游…

2018全球硬科技创新暨“一带一路”创新合作大会,这些硬科技都要来!

来源:新华社近年来,多个省市陆续开始了一场科技标签秀,以深圳等为代表的“人工智能”、以上海为代表的“金融科技”,以贵州为代表的“大数据”等纷纷亮相,而伴随着“一带一路”新丝路的战略实施,西安&#…

吴恩达:人工智能寒冬不会到来,但我们太乐观了

来源:量子位AI Winter Is Coming?人工智能领域的各路专家学者曾经为这个话题吵翻了天。最近,这个话题又有更新了。人工智能寒冬论的作者Filip Piekniewski在博客上发文,给自己提出的观点增加了新的证据。非常巧的是,吴…

自动驾驶中常用的四类机器学习算法

来源:智车科技机器学习算法已经被广泛应用于自动驾驶各种解决方案,电控单元中的传感器数据处理大大提高了机器学习的利用率,也有一些潜在的应用,比如利用不同外部和内部的传感器的数据融合(如激光雷达、雷达、摄像头或物联网)&…

国际基因编辑科技发展报告

来源:全球技术地图作者:贾晓峰 中国科学技术信息研究所摘要:以特异性的改变遗传物质靶向基因序列为目标的基因编辑技术是近年生命科学领域最热门的研究领域之一。围绕基因编辑的相关领域研究和人物事件连续多年入选Nature国际科学事件和科学人…

科学家发现大脑动态评估信息重要性机制

大脑中部的丘脑室旁核(PVT) 图片来源:中科院深圳先进技术研究院来源:中国科学报周末该在家看书还是出去K歌?寒冬将至,该坚持健身还是涮个火锅?每天,人们都会面临上百种选择。以往&am…

腾讯AI Lab研发「智能显微镜」 抢先布局病理分析领域

来源:腾讯AI实验室腾讯 AI Lab 在南京举办的「腾讯全球合作伙伴大会」上宣布,其AI医疗领域研究已抢先从影像筛查进入病理分析阶段,相关的「智能显微镜」项目已在研发测试阶段。智能显微镜融入了人工智能(AI)的视觉、语…

石墨烯新新新应用,MIT大规模生产细胞大小机器人,有感知能存储

(MIT开发的微型机器人)来源:机器人大讲堂近期,MIT又玩出了新花样,在前几个月成功开发出细胞大小并且能够感知外部环境、储存数据并执行计算任务的微型机器人后,MIT又带来了新消息:他们为大规模生…

多种图像配准方法的综合比较(KAZE、SIFT、SURF等)

接触图像配准是从去年十月份开始的,老师要求我尽快重现一遍整个流程,这样对课题可以有一个整体的把握,而后再仔细推敲细节,甚至提出自己的想法,老师的这个思路现在觉得非常不错。自己当时选取的是SURF方法,…