异构计算=未来?一文带你秒懂3大主流异构

戳蓝字“CSDN云计算”关注我们哦!

640?wx_fmt=jpeg

技术头条:干货、简洁、多维全面。更多云计算精华知识尽在眼前,get要点、solve难题,统统不在话下!


作者:Pasca

来源:蛋蛋团(ID:dandan_tuan)


640?wx_fmt=png640?wx_fmt=png

本文旨在梳理和科普,让读者了解异构计算的基本概念和其中不同异构计算方案的侧重点,更多资讯请关注蛋蛋团(ID:dandan_tuan)。


大纲

一、传统计算的困境

二、异构计算的崛起

三、”厨房论“异构计算

四、总结


640?wx_fmt=png



一、传统计算的困境


广为流传的摩尔定律(英特尔(Intel)创始人之一戈登·摩尔提出)表明:每24个月会将芯片的性能提高一倍。


后来,另外一个英特尔首席执行官大卫·豪斯(David House)提出:预计18个月会将芯片的性能提高一倍。


640?wx_fmt=jpeg


尽管到目前为止,芯片的发展经历一次次的性能提升。但随着互联网的爆炸式发展和信息化的普及。以及近几年兴起的诸如机器学习、深度学习、人工智能、工业仿真等对计算性能的需求极高的领域崛起后,已经远远超过了传统CPU处理器的除计算性能瓶颈,出现了诸多如并行度不高、带宽不够、时延高等限制。


640?wx_fmt=png

来源网络,CPU和GPU的发展趋势对比,)


如上图,GPU的发展比CPU更为迅猛,每一代制程缩减直接带来更多的核心数,同时,GPU 每年有大约40% 的性能提升。


传统CPU芯片计算可以叫同构计算,也可以叫通用计算,设计之初,更多的是注重控制。而GPU设计作为协处理器只为处理CPU难以负载的大量并行计算。


而CPU占据70%的部分晶体管是用来构建Cache还有一部分控制单元,负责逻辑算数的部分并不多。GPU整个就是一个庞大的计算阵列,适合做大量密集型计算类型,就好游戏爱好者,如果想要体验画质更高的游戏画面,就必须买更好GPU的显卡。


总结一下,CPU负责逻辑性强的事物处理和串行计算,GPU则专注于执行高度线程化的并行处理任务(大规模计算任务)。


640?wx_fmt=jpeg

(来源网络,CPU和GPU架构比较)


通俗一点,CPU好比于笔,你可以拿他画你任何想画的东西。而GPU好比于打印机,打印肯定更快,但是需要CPU的协同。


二、异构计算的崛起



640?wx_fmt=jpeg



在普通服务器领域亦如此,针对机器学习、深度学习、人工智能、工业仿真等领域,异构计算平台已经成为新宠,而在异构计算江湖中,也是群雄鼎力,存在着三大不同的流派。


CPU+GPU流派、CPU+FPGA流派以及CPU+ASIC流派。


640?wx_fmt=jpeg

首先我们来讲个小故事,通俗易懂的了解这些流派。


三、”厨房论“异构计算


上文也说了,同构计算或者说通用计算性能的发展已经远远跟不上应用的需求,如近几年的国内的天河2A和神威超算都属于异构超算,接下来几年研发的超算也都属于异构超算,可见,异构超算已经成为中美两国超算领域的趋势。


这里我们引用网上的一个经典“厨房论”异构计算。


在饭店的厨房,通常会有一个大厨(CPU),它会做各种菜(兼容性极好),但是如果做菜之前的大量重复动作(洗菜、切菜)导致它一天做菜的份数明显减少。

并且,由于最近(人工智能时代到来)客人点菜要求越来越高(花样菜式),大厨开始不堪负重。


640?wx_fmt=jpeg

640?wx_fmt=jpeg


本来顾客大多要的「炒白菜」,现在一个个都想吃「开水白菜」。


一道是家常菜,一道是国宴菜。然而后者复杂程度(大量数据复杂处理)远远不是前者所能比较。


于是,大厨想着,一大菜我一个做着麻烦,但是我可以请个帮手(协处理器)。比如在切菜方面,这个帮手可以同时处理很多菜品(并行计算),而且很熟练,速度很快(低延时)。


于是,一个负责切菜,一个负责做菜,分工明确。当然,大厨挑选这个帮手也是精挑细选,主要体现在以下方面:


  1. 多样的菜品处理能力,如洗菜切菜一体化(算法性能)——协处理器需要能全面支持需要用到的场景关键算法。

  2. 支持同时、快速加工(数据并行和低延时处理能力)——协处理器需要有大量并行通道,且每个通道支持低延时的数据处理。

  3. 便于大厨操作和菜品存取(接口性能)——和主处理器很方便的数据交互

  4. 学习能力强,新菜式也能学会(配置灵活)——协处理器可以针对计算需求升级迭代

  5. 一天别吃太多(功耗低)——协处理器更低的功耗意味着更低的运行成本,更小的空间占用和更简单的热处理方案。


GPU:手脚麻利但是比较笨的帮厨


CPU和GPU都属于通用处理器,但是和CPU一样,都有一个很大的缺点,CPU和GPU的代码都存在Memory这个“菜谱”中,需要经过取指令,译码,然后才能执行指令。在这个流程中,取指令,译码会开销额外的时间,降低了数据处理速度。

640?wx_fmt=png

如果说CPU大厨形容为“头脑发达(控制电路多),四肢简单(计算电路少),那么GPU帮厨正好相反。


在GPU中,硬件资源被大量用作逻辑运算单元(ALU),小部分用作控制电路。这为大规模的数据并行处理提供了基础。


于是,当这个帮厨(GPU)被使唤去切菜洗菜时,手脚非常麻利,完成的又快又好。但是如果你让这个帮厨(GPU)去做“土豆切丝,洋葱切片,南瓜雕花……”,可能就没有那么利索了。


这是因为,复杂的控制流程会产生大量的分支(如编程语言中的case和if else),而GPU中一个控制单元要负责好几个计算单元。所以,如果要最大程度地使用GPU,势必要求控制分支越少越好。


FPGA: 功能多变的万能料理机


在厨房中,有一种厨具我相信有很多人都会喜欢,大厨也喜欢,那就是料理机。


有了料理机,大厨终于有可以节省了大量的时间来包饺子了,使用料理机处理肉馅即可。同时,当有需要制作果汁、豆浆时,也可以使用料理机,作为一款多功能料理机,可以满足大厨的多种需求。


640?wx_fmt=png


FPGA作为一种高性能、低功耗的可编程芯片,中文名叫做”现场可编程门级列阵“。


最耀眼的词语:可编程。


这也意味着,今天可以切土豆丝,明天切土豆片都行。FPGA使用预建的逻辑块和可重新编程布线资源,可以让用户无需使用电路实验板或者烙铁,通过特定的软件开发计算任务,编译后就能自定义配置芯片硬件功能。


只需要OpenCL和HLS(High Level Synthesis)技术,直接把C、C++代码编译成Verilog即可。


640?wx_fmt=jpeg


在处理海量数据的时候,FPGA 相比于CPU 和GPU,优势在于:FPGA计算效率比CGPU更高,FPGA更接近IO。


正因此,FPGA目前已经占据在了异构计算的主流地位。


ASIC:最强订制料理机


ASIC的中文全称是“特殊订制集成电路”。


关键词:特殊订制。


它是订制的,也意味着不需要去纠结CPU和GPU怎样分配控制资源和计算资源的问题了,想怎么分配就怎么分配。编程语言越接近底层硬件,运行速度越快。


ASIC的设计是直接用软件思维搭建硬件电路,所有的设计是直接建筑在物理硬件(门电路)上的。所以,ASIC不需要取指令和译码,每个时间单位都能专注于数据处理或者传输,大大提高了效能。


直接设计的硬件结构也让数据处理管线真正实现,每一级的处理结果能直接用于下一级的输入,无缝连接。在一定规则下(比如一定芯片面积和布线规则下),并行通道可以最大化叠加。在功耗方面,因为硬件利用的最大化,是所有协处理器里最小的。


如果将协处理器按照性能排行:ASIC > FPAG > GPU。


640?wx_fmt=jpeg


然而,由于ASIC定制化,导致价格十分高昂,定制的过程漫长,并且功能定制化很难再去更改。


就好比于,大厨今天想做土豆丝,明天土豆片。不好意思,再去定制一台。


AI算法尚处于蓬勃发展、快速迭代的今天,ASIC存在开发周期较长、需要底层硬件编程、灵活性较低等劣势,因此发展速度不及GPU和FPGA。


四、总结


以目标的发展趋势来看,三者用一句话来概括如下:

  • GPU:先发制人的“十项全能”选手,云端终端均拔头筹。

  • FPGA:“变形金刚”,算法未定型前的阶段性最佳选择。

  • ASIC:“专精职业选手”,专一决定效率,AI芯片未来最佳选择。


640?wx_fmt=jpeg

(七牛云、阿里云异构实例一览)


FPGA目前由于其优点越发得到AI厂商青睐,有望在这几年承担更多的角色。


在云端主要作为GPU计算性能不足的有效补充存在;同时CPU会“变小”,从14nm,甚至是5nm,但是依旧作为控制中心存在,必不可少。


未来芯片的发展前景取决于生态,有望统一在主流的几个软件框架下,形成云端CPU+GPU+FPGA(可选)的多芯片协同场景。


640?wx_fmt=png


福利

扫描添加小编微信,备注“姓名+公司职位”,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!


640?wx_fmt=jpeg


推荐阅读:

  • Elastic Jeff Yoshimura:开源正在开启新一轮的创新 | 人物志

  • 深入浅出Docker 镜像 | 技术头条

  • 19岁当老板, 20岁ICO失败, 21岁将项目挂到了eBay, 为何初创公司如此艰难?

  • 码二代的出路是什么?

  • 机器学习萌新必备的三种优化算法 | 选型指南

  • 小程序的侵权“生死局”

  • @996 程序员,ICU 你真的去不起!


640?wx_fmt=png真香,朕在看了!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/523960.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Git Windows安装手册

文章目录1. 下载、安装、验证2、Next3. 选择安装位置4. 选择组件5. 创建开始菜单目录6. 选择Git使用的默认编辑器7 . Next8. 选择HTTPS传输后端9. 配置行结束转换10. Next11. 配置终端模拟器以与 Git Bash 一起使用12. git安装验证:1. 下载、安装、验证 git官网&am…

Nutanix,在转型的道路上越走越远 | 人物志

戳蓝字“CSDN云计算”关注我们哦!人物志:观云、盘点、对话英雄。以云计算风云人物为核心,聚焦个人成长、技术创新、产业发展,还原真实与鲜活!一年多以前,以超融合设备厂商之名起家的Nutanix,开始…

使用自己的域名解析CSDN博客

本文主要介绍怎样使用自己购买的域名指向CSDN博客 通常来说技术人员都会创建个自己的技术博客,总结下工作中的问题,经验等等,不过某些博客的访问链接的确是不太容易记忆或者输入,对我们分享造成一定的困扰,本文通过配置…

qt中设置QTabWidget,QGroupBox,QScrollArea的样式

引言 本文对标题中所述的三种控件的样式使用样式表来设置其外观。该样式表没有采用样式文件,而是在程序中直接使用函数setStyleSheet()来设置控件的样式。 前期准备 ui文件中各控件的结构如下图; 1.QGroupBox 从上面可以看到,QGroupBox属…

分布式精华问答 | 如何实现分布式系统的高可用性?

布式的处理方式越来越受到业界的青睐——计算机系统正在经历一场前所未有的从集中式向分布式架构的变革。今天,我们就来看看关于分布式的精华问答吧!1Q:什么是分布式缓存?A:为了提高性能和响应时间,在应用程…

qt将生成的程序打包在他人电脑上可用

引言 生成的可执行文件exe后,想在没有安装qtCreate编译器的电脑上用,这里可以使用qt自带的打包工具来添加所需的库到运行程序所在的目录。 步骤 将生成的exe文件拷贝到一个空文件夹下,若程序使用过程中用到其他项目成员的库文件&#xff0…

Guns 下载、导入、运行_入门试炼01

一、在码云搜索Guns下载项目解压: 码云Guns:https://gitee.com/stylefeng/guns 二、打开idea点击open选择guns文件夹,等一会,会出现: 三、配置Guns项目的数据库 在导入成功的“guns-admin”项目中,我们…

Docker 官方公共仓库 Docker Hub 遭攻击,恐19 万用户信息泄露;Intel 10核心新品要现身了?...

关注并标星星CSDN云计算极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的!每周三次,打卡即read更快、更全了解泛云圈精彩newsgo go go 新上的努比亚红魔3&#xff…

Guns 代码生成演示_入门试炼02

一、运行Guns idea运行springboot开源项目Guns: https://blog.csdn.net/qq_37164847/article/details/81701583 二、设计表结构 表结构: CREATE TABLE sys_house (id int(11) NOT NULL AUTO_INCREMENT COMMENT 房屋编号,house_user varchar(50) NOT…

qt点击按钮本身,来删除自身

引言 实现下面这样一个功能,点击界面的添加按钮,增加一行班级和学生的信息,刚才被点击行的按钮上的文字由添加变为删除,按钮文字为删除,点击的时候可以删除被点击行的所有控件,选中那个班级后会自动更新对…

强推!盘点阿里巴巴 15 款开发者工具 | 程序员硬核评测

戳蓝字“CSDN云计算”关注我们哦!程序员硬核评测:客观、高效、不说软话。无论是技术质量、性能水平,还是工具筛选,一测便知!从人工到自动化,从重复到创新,技术演进的历程中,伴随着开…

Guns 查询列表_入门试炼03

一、插入数据进行测试: INSERT INTO guns.sys_house (id, house_user, house_address, house_date, house_desc) VALUES (1949033474, 雨昕, 北京大兴区, 2019-05-30 17:20:25, 北京次渠南); INSERT INTO guns.sys_house (id, house_user, house_address, house_da…

Guns根据条件查询数据_入门试炼04

一、找到Controler,对方法进行修改即可实现 二、修改list方法 修改钱的方法: /*** 获取房屋管理列表**wrapper 条件*/RequestMapping(value "/list")ResponseBodypublic Object list(String condition) {return houseService.selectList(nul…

Storm精华问答 | 最火的流式处理框架——Storm

戳蓝字“CSDN云计算”关注我们哦!Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。 今天就为大家带来Storm诞生到发展再到实践,赶快学习起来吧!1Q:Storm的诞生。A:在2011年Storm开…

Guns 添加功能实现_入门试炼05

找到添加页面,进行修改 源代码: 默认这些表平淡中的字段都需要,手写,不需要手写的可以删除,用别的策略代替即可 第一处: id 数据库设置的是自增的因此不需要,删除 第二处:房屋交付…

浪潮云ERP到底属于什么水平?

戳蓝字“CSDN云计算”关注我们哦!极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的!常常听到企业应用市场三巨头,用友、金蝶、浪潮,但如果问…

Guns 编辑功能实现_入门试炼06

一、编辑功能默认实现 未修改前的样图: 案例演示: 将刘英3 、北京大兴区2、次渠2,更新为刘英5 、北京大兴区5、次渠5 选中需要修改的那条数据,点击修改按钮。 未提交表单前: 更新完成后: 想学习更多…

小米回应有品特殊激励需放弃年终奖……外媒说,荷兰运营商KPN允许华为有限参与5G网络建设;传苹果挖角英特尔5G工程师...

关注并标星星CSDN云计算极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的!每周三次,打卡即read更快、更全了解泛云圈精彩newsgo go go AT&T实现2Gbps的…

Guns 删除功能_入门试炼07

一、删除功能默认实现 选中需要删除的数据执行删除操作即可 删除前截图: 删除后截图: 从截图中可以看出,删除的那条数据已经不在了。 想学习更多微服务、分布式、中间件、数据库、项目快速构建等系列技术 请跳转Gblfy个人专栏: www.gblf…

第一次更名为OpenInfra的“她”,给我们带来了哪些惊喜?| 技术头条

戳蓝字“CSDN云计算”关注我们哦!技术头条:干货、简洁、多维全面。更多云计算精华知识尽在眼前,get要点、solve难题,统统不在话下!在美国丹佛阴冷的天气中,开源业界最顶级的技术峰会,前身为Open…