GPU、FPGA芯片成为增强机器学习能力的“左膀右臂”

640?

选自:forbes 

编译:网易智能  

参与:nariiy


在商业软件中,电脑芯片已被遗忘。对于商业应用程序来说,这是一种商品。由于机器人技术与个人硬件设备联系更为紧密,因而制造应用程序仍然更侧重于硬件部分。


自20世纪70年代以来,整体上看,人工智能(AI)的现状,以及具体到深度学习(DL)领域,硬件与软件的关系比任何时候都联系地更加紧密。而我最近几篇“管理人工智能(management AI)”的文章与过度拟合和偏见有关,机器学习(ML)系统中存在的两个主要风险。本专栏将深入探讨许多管理人员,尤其是业务线经理可能会处理的硬件缩略词问题,这些缩略词在机器学习系统中被不断提及:图形处理单元(Graphics Processing Unit ,GPU)和现场可编程门阵列(Field Programmable Gate Array ,FPGA)。


这有助于理解GPU的价值,因为GPU加速了深度学习应用程序所需的张量(tensor)处理。FPGA的兴趣点则在于寻找研究新AI算法的途径,训练这些系统,并开始部署现在正在许多工业AI应用中研究的低容量定制系统。尽管这是关于FPGA进行训练的能力研究讨论,但我认为早期使用是源于F,现场(field)的使用。


例如,训练一个推理引擎(机器学习“机器”的核心)可能需要千兆字节,甚至兆兆字节的数据。在数据中心运行推理时,计算机必须管理一个潜在的不断增加中的并发用户请求数。在边缘应用程序中,无论是在用于检查管道的无人机中还是在智能手机中,设备都必须很小且仍然有效,而且还具有适应性。简单地说,一个CPU和一个GPU是两个器件,而一个FPGA可以有不同的块做不同的事情,并有可能提供一个稳健的芯片系统。鉴于所有这些不同的需求,最好了解可支持不同需求的系统架构的当前状态。


有两类主要的芯片设计可以驱动当前的ML系统,GPU和FPGA。在未来的中期(至少几年),也有可能成为游戏转换者的新技术暗示。让我们来看看。


图形处理单元(GPU)


640?


机器学习世界中最大的芯片是图形处理单元GPU。这个主要用于电脑游戏,让其在计算机显示器上看起来更好的东西是如何变得对机器学习至关重要的?要理解这一点,我们必须回到软件层。


机器学习目前的冠军是Deep Learning(DL)系统。DL系统基于各种算法,包括深度神经网络(DNN),卷积神经网络(CNN),递归神经网络(RNN)以及许多其他变体。你在这三个术语中看到的关键词是“网络(network)”。算法是一个主题的变体,主题是几层节点, 节点和层之间有不同类型的通信。


正在处理的是多个阵列或矩阵。矩阵(matrix)的另一个更为精确的术语是张量(tensor),因此它在整个机器学习行业中用于诸如TensorFlow之类。


现在回到你的电脑屏幕。您可以将它按行和列看作是像素或点的矩阵。这是一个二维矩阵或张量。当你添加颜色,添加到每个像素的位大小,想要一个快速变化的一致图像的时候,计算可以很快变得复杂并且在一步一步的CPU中占用周期。而GPU拥有自己的内存,可以将整个图形图像保存为矩阵。然后可以使用张量数学计算图像中的变化,然后只更改屏幕上受影响的像素。这个过程比每次更改图像时重新绘制整个屏幕要快得多。


NVIDIA成立于1993年,旨在创建一个芯片来解决诸如CPU等通用计算机无法解决的矩阵问题。这是GPU的诞生。


矩阵运算并不关心最终产品是什么,而只是处理元素。这是一种轻微的过度简化,因为不同的运算依稀疏矩阵(当有很多零时)与密集矩阵的不同而有不同的工作方式,但内容不会改变运算,这个事实依然存在。当深度学习理论学者看到GPU的发展时,他们很快就采用其来加速张量运算。


GPU对机器学习的发展至关重要,推动了数据中心的训练和推理。例如,NVIDIA Volta V100 Tensor Core在其基本架构和以更低精度运行推理的能力方面继续加速推进(这将是另一个话题,意味着更少的位,即意味着更快的处理)。但是,当涉及物联网时还有其他问题需要考虑。


现场可编程门阵列(FPGA)


640?


在现场(field)中,所有类型的应用程序都有不同的需求。有很多不同的应用领域,车辆,管线,机器人等等。不同行业可以为每种类型的应用设计不同的芯片,但这可能会非常昂贵并且会破坏公司的投资回报率。还可能推迟上市时间,错过重要的商业机会。对于那些不能提供足够规模经济市场的高度个性化需求而言,情况尤其如此。


FPGA是帮助公司和研究人员解决问题的芯片。FPGA是一种集成电路,可以编程为多种用途。它有一系列“可编程逻辑块”和一种编程块和块之间关系的方法。它是一种通用工具,可以为多种用途进行定制。主要供应商包括赛灵思(Xinlinx)和美国国家仪器(National Instruments)。


值得注意的是,芯片设计成本较低的问题并不能使FPGA成为低价位的选择。它们通常最适用于研究或工业应用。电路和设计的复杂性使其可编程,不适用于低成本的消费类应用。


由于FPGA可以重新编程,这使得其对于新兴的机器学习领域来说很有价值。不断增加算法,并通过重新编程块来针对不同算法进行微调。此外,低精度推断的低功耗FPGA对于远程传感器来说是一个很好的组合。虽然发明人将“现场(field)”更多地称为“客户(customer)”,但FPGA在实现AI应用方面的真正优势在实际领域中。无论是对于工厂、道路和管道等基础设施,还是无人机远程检测,FPGA都允许系统设计人员灵活地使用一块硬件,以实现多种用途,从而实现更简单的物理设计,从而可以更加容易地进行现场应用。


新体系结构即将到来


GPU和FPGA是目前正在帮助解决如何扩大机器学习对许多市场影响的挑战的技术。他们所做的是让更多人关注这个行业的发展,并试图及时创建新的架构来应用。


一方面,许多公司试图在GPU上学习张量运算的教训。惠普、IBM和英特尔都有开发专门用于深度学习的下一代张量运算设备的项目。与此同时,像Cambricon、Graphcore和Wave Computing这样的初创公司也在努力做同样的事情。


另一方面,Arm、Intel和其他公司正在设计架构,以充分利用GPU和CPU,并使器件也瞄准机器学习市场,据称能够做的不仅仅是集中张量运算,对于围绕核心AI流程的其他处理也更加强大。


虽然上述一些组织专注于数据中心和其他物联网,但现在谈论其中的任何一个都为时尚早。


从全球公司到初创公司,一个告诫是,除了最早的信息外,还没有其他信息出现。如果我们最迟在2020年看到最早的器件样品,那么这将是一个惊喜,所以它们至少在五年内不会上市。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/495367.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

增强现实技术的9个最新应用趋势

来源:资本实验室摘要:随着AR技术的成熟,AR与行业的融合越来越深入。从设计到营销,从教育到医疗,从出行到文化,AR正在重新定义各产业的思维方式和运行方式。1.教育AR应用程序正在以更具互动性的方式改变教学…

安卓系统内 的 安卓虚拟机

转载:虚拟大师,让你的系统再安装一个系统,实现Xposed自由,支持摄像头调用http://xposed.appkg.com/2971.html 虚拟大师 VMOS 虚拟大师简介 虚拟大师是 Android 系统上的 Vmvare,完整的且自带 Root 系统能够让你实现无限…

未来一年最有可能成为独角兽的29家美国初创公司

来源: 资本实验室摘要:近期,研究机构PitchBook梳理出了在未来一年最有可能成为独角兽的29家美国初创公司。资本实验室今日投资关注聚焦前沿科技创新与传统产业升级“小兄弟,老夫看你骨骼清奇,天赋异禀,定是…

StreamWriter类的一般使用方法

理解StreamWriter可以对照StreamReader类来进行,因为他们只是读写的方式不同,一个是读,一个是写,其他的差别不是特别大。 StreamWriter继承于抽象类TextWriter,是用来进行文本文件字符流写的类。 它是按照一种特定的编…

Firefox、Chrome 盘助手

From:https://www.runningcheese.com/baiduyun IDM 下载地址:http://www.ucbug.com/soft/26392.html 定制 Firefox、Chrome 下载地址:https://www.runningcheese.com/ 由网友 "哩呵" 制作的 网盘助手 脚本,需要通过拓…

复杂性理论:科学方法的第三个梯级

来源:人机与认知实验室摘要:莫兰认为系统论超越了还原论,复杂性理论又超越了系统论,它们代表着科学方法论依次达到的三个梯级。复杂性研究从20世纪末叶兴起,目前在国内外已成为许多学科领域内研究的前沿和热点。它涉及…

Notepad++ 简单使用

github 下载地址:https://github.com/notepad-plus-plus 简介 Notepad 是 Windows 下的一款免费开源代码编辑器,它使用较少的CPU功率,降低电脑系统能源消耗,但轻巧且执行效率高,使得 Notepad 可完美地取代微软视窗的记…

MIT:机器学习预测2018世界杯冠军

来源 :199IT互联网数据中心摘要:麻省理工学院报道,他们的研究人员开发了一种新型人工智能,用以预测世界杯走势。麻省理工学院报道,他们的研究人员开发了一种新型人工智能,用以预测世界杯走势。研究人员声称…

安卓逆向_20 --- 模拟器检测、反调试检测、ELF动态调试、__libc_init 下断

From( 模拟器检测实战分析 ):https://www.bilibili.com/video/BV1UE411A7rW?p65 怎样过 app 的模拟器检测:https://bbs.pediy.com/thread-249759.htm Android 模拟器如何不被检测思路:https://bbs.pediy.com/thread…

2017-2018中国机器人创新Top100榜单深度分析

来源:产业创新创投数据平台Innov100摘要:人类和机器人由相互隔离、保持距离发展到充分的人机交互,融合共生。一、2017-2018年中国机器人创新Top100榜单二、中国机器人创新Top100数据分析(一)机器人创新Top100产业生态分…

揭秘:机器究竟是怎么学习的?

来源:雪球摘要:从算法的角度看,机器学习有很多种算法,例如回归算法、基于实例的算法、正则化算法、决策树算法、贝叶斯算法、聚合算法、关联规则学习算法和人工神经网络算法。从算法的角度看,机器学习有很多种算法&…

安卓逆向_21 --- Java层和so层的反调试( IDA 动态调试 JNI_OnLoad、init_array下断)

1. 安卓程序动态调试条件 安卓程序动态调试条件 ( 2个满足1个即可 ): 1. 在 AndroidMainfest.xml ---> application 标签下,设置或者添加属性 android:debuggable"true" 2. 系统默认模式,在 build.prop(boot.img),…

一文读懂:深扒人脸识别60年技术发展史

来源:与非网摘要: “他来听我的演唱会,门票换了手铐一对”。最近歌神张学友变阿SIR,演唱会上频频抓到罪犯,将人脸识别技术又一次推到了大众的视线中。“他来听我的演唱会,门票换了手铐一对”。最近歌神张学…

安卓逆向_22( 一 ) --- Xposed【 Android Studio + Xposed 实现简单的 hook 】

From:使用渗透测试框架 Xposed 框架 hook 调试 Android APP:https://www.freebuf.com/articles/terminal/56453.html Xposed框架分析:https://blog.csdn.net/zjx839524906/article/details/81046844 xposted框架 原理 Xposed框架之函数Hoo…

TED演讲 | 2100年,神经学家如何研究人类大脑?

“本文来源于药明康德微信公众号(ID:WuXiAppTecChina)”除非我们弄清楚如何在健康人体中获得神经元的电活动,否则不会在理解人类大脑或疾病方面取得任何进展。 Were not going to make any progress towards understanding the hu…

安卓逆向_24( 一 ) --- Hook 框架 frida( Hook Java层 和 so层) )

From:Hook 神器家族的 Frida 工具使用详解:https://blog.csdn.net/FlyPigYe/article/details/90258758 详解 Hook 框架 frida ( 信抢红包 ):https://www.freebuf.com/company-information/180480.html APP逆向神器之Frida【Android初级篇】…

最前线丨新零售结果、AT暗战,今年的618都讲了哪些故事

来源:36Kr今年的618成了巨头们验收新零售成果的好时机。618源于2010年,最初为京东店庆。2013年天猫加入618大促,苏宁、国美紧随其后。此后,618成为电商价格战的战场,也成为全网狂欢的节日。618今年已经走到底第9个年头…

什么是RUP

一、RUP产生的背景 UML能够用来为系统进行面向对象建模,但是并没有指定应用UML的过程,它仅仅是一种语言,它是独立于任何过程的。如果想要成功的应用UML一个好的过程是必要的。合理的过程能够有效的测度工作进度,控制和改善工作效率…

动态 | DeepMind 首次披露旗下专利申请情况

来源:AI科技评论摘要:作为一家顶尖的人工智能研究公司,DeepMind 近年来申请了一堆国际专利,但是具体到专利内容和申请数量就不得而知了。近日,DeepMind首次披露了一系列国际专利,这些专利涉及了现代机器学习…

Frida Android hook

From:https://eternalsakura13.com/2020/07/04/frida/ 开发环境配置 ( IDE 智能提示 frida ): 下载 nodejs: https://nodejs.org/zh-cn/download/npm install types/frida-gum 见过的较好的frida笔记: https://kevinspider.gith…