编程加速服务器_FPGA加速驱动新时代的数据洪流,下篇

目 录

  1. 人工智能计算加速器产品系列的相关布局
  2. FPGA开发的痛点与潜在方案
  3. 结语

在《FPGA加速驱动新时代的数据洪流,上篇》中,老石介绍了英特尔应对大数据时代的整体战略布局,特别是基于FPGA的各类智能网卡和网络解决方案。在本篇中,老石会继续介绍英特尔FPGA在人工智能和其他热点领域的布局和大动作,以及总结梳理一些FPGA开发会遇到的痛点和潜在的解决方案。

1

人工智能计算加速器产品系列的相关布局

在本次数据中心创新峰会上,英特尔宣布了Xeon处理器的详细路线图,即基于英特尔14nm工艺的Cascade Lake(2018年底出货),基于14nm工艺的Cooper Lake(2019年出货),以及基于10nm工艺的Ice Lake(2020年出货)。

这三款Xeon处理器都在内部集成了对深度学习加速器的原生支持,从而更好的针对人工智能应用进行计算和加速。除此之外,英特尔还展示了“泛数据中心”业务群中针对人工智能应用的全栈芯片产品组合。

1c0aa83c9b02814ada3bba8a22878628.png

在人工智能的计算和加速领域,FPGA也被广泛用作硬件加速模块来使用,并被部署于数据中心本身以及很多边缘计算的场合。

对于FPGA在数据中心领域的应用,最有名的例子就是微软在其数据中心对FPGA使用进行的一系列针对人工智能计算的开创性的探索。

例如,微软在它最新公布的“脑波项目(Project Brainwave)”中,使用了英特尔FPGA,构建了实时深度学习平台。它利用了FPGA的低延时、高并行、低功耗的特点,实现了对Bing搜索服务、微软Azure云平台等多项业务的跨越式加速。关于微软的FPGA项目已有很多文章进行介绍,本文不再展开。

另外,英特尔于2017年发布了用于Xeon服务器的新一代标准化的“可编程加速卡(Programmable Acceleration Cards – PACs)”,以及配套的加速栈开发软件和用户接口,如下图所示,并已经得到了包括戴尔、富士通、浪潮等服务器大厂的采用和配套支持。这款加速卡可以使用户在多个领域进行定制计算加速,包括人工智能、大数据、高性能计算等。

df58be424d1de4fc9d6d9238d11154a2.png

FPGA的应用也逐步扩展到网络边缘和端点,例如智能安防、视频采集和处理、自动驾驶和机器人等等,直接在数据来源进行计算加速,并进行人工智能模型的推断和处理,见下图。

3404dc9f90c338ab6d380371dc151dea.png

边缘计算+人工智能通常是国内外初创企业切入市场的主要领域。这一方面是由于数据中心市场太过庞大,因此被巨头牢牢把持难以进入,另一方面也是由于在这个领域更容易通过创新的算法和方案获得一席之地。

我国的两个主要代表企业就是地平线和深鉴科技。其中,前者已获得英特尔领投的A+轮近一亿美元投资,并通过此次投资将FPGA 事业部负责人Dan McNamara安排加入了地平线的董事会;而后者已在A+轮融资后被另一个FPGA大厂Xilinx全资收购。由此,可以十分清晰的看到FPGA公司对边缘计算和人工智能领域的积极布局。

ce471505ee893245060792192e347c9f.png

2

FPGA开发的痛点与潜在方案

至此可以看到,英特尔已经在泛数据中心领域开展了全面的布局和规划。其中,FPGA在驱动大数据传输和计算这两个关键领域均扮演着重要角色,并且覆盖了从云端到网络边缘的各个部分。

然而,尽管FPGA被某些国内媒体热捧为“万能芯片”,真正的实现对FPGA的广泛使用还是存在很多难点亟待克服。

第一,学界和业界仍然没有开创性的方法简化FPGA的开发,这可以说是现阶段制约FPGA广泛使用的最大障碍。

与CPU或GPU成熟的编程模型和丰富的工具链相比,高性能的FPGA设计仍然大部分依靠硬件工程师编写RTL模型实现。RTL语言的抽象度很低,往往是对硬件电路进行直接描述,这样一方面需要工程师拥有很高的硬件专业知识,另一方面在开发复杂的算法时会有更久的迭代周期。因此,FPGA标榜的可编程能力与其复杂的编程模型之间,形成了鲜明的矛盾。

近五到十年来,高层次综合(High Level Synthesis - HLS)一直是FPGA学术界研究的热点,其重点就是希望设计更加高层次的编程模型和工具,利用现有的编程语言比如C、C++等,对FPGA进行设计开发。在这期间有趣的成果层出不穷,其中有代表性的HLS初创公司有多伦多大学Jason Anderson教授及其学生创办的LegUp Computing,以及UCLA丛京生教授创办的Falcon Computing等(见下图)。

1d3da0bc1e69973afb8ac9cb1d09f0a9.png

在工业界,两大FPGA公司都选择支持基于OpenCL的FPGA高层次开发,并分别发布了自己的API和SDK等开发工具。这在一定程度上降低了FPGA的开发难度,使得C语言程序员可以尝试在FPGA平台上进行算法开发,特别是针对人工智能的相关应用。

尽管如此,程序员仍然需要懂得基本的FPGA体系结构和设计约束,这样才能写出更加高效的OpenCL模型。另外,基于OpenCL的FPGA设计移植性不是很好,且严重基于厂商提供的开发工具和底层模块的性能,调试起来也不甚便利。

在数据中心网络应用领域,两大FPGA公司也开始支持名为P4的网络编程语言。P4语言大约于2014年由斯坦福大学的Nick McKeown教授提出,主要用来描述网络交换、路由选择和数据包处理规则,非常适合数据中心里高速网络通信的应用场景。关于P4的具体内容在本文中不再展开,其内容值得再写一篇文章详细探讨。其实相比全通用的HLS设计而言,类似于P4的针对某类特定应用的HLS工具或许有更大和更快的发展前景。

类似的还有英特尔最新发布的OpenVINO(Open Visual Inference & Neural Network Optimization - 开放的视觉推理和神经网络优化)开发套件。

顾名思义,OpenVINO专为计算机视觉和深度学习在边缘计算的应用场景进行优化,其最大特点是支持英特尔的全栈视觉加速方案,包括CPU、GPU、FPGA以及Movidius VPU等,并支持多种深度学习框架。其中,在FPGA上使用OpenVINO进行开发,可以取得高达19倍的性能提升,如下图所示。

67ee0daf63a085465d7f252628b3c705.png

第二,FPGA并非适用于各种应用场景。特别是对于一些边缘计算和嵌入式应用,它们对价格、功耗、性能以及可靠性的统筹要求很高,其中往往价格会是主要的考虑因素。这样基于FPGA的方案相比于GPU、SoC或者ASIC的方案并没有很大的优势,这是由于FPGA并非针对某一特殊应用场景而设计优化。

为了解决这个问题,英特尔近日收购了“结构化ASIC”设计公司eASIC,并计划将其整合到公司的FPGA事业部中。结构化ASIC设计可以看成是FPGA与ASIC的折中,见下图。

eca96dfa180288496112cb58014ee3ac.png

结构化ASIC的主要特点有以下两点:

  1. 通过牺牲FPGA的一部分可编程性,换取低功耗、低成本和高性能;
  2. 通过牺牲ASIC对设计和布局的深入优化,换取更快的设计流片时间。

由此可见,对于很多对成本和功耗敏感的应用场景,这种结构化ASIC的设计方法有着很强的竞争力。

有需要购买Xilinx altera TI ADI品牌器件的朋友,请联系VX293580331 原装正品 终身质保 价格最低!欢迎咨询与推荐!

3

结语

本文总结了在英特尔“以数据为中心(Data-Centric)”的创新峰会上发布的和FPGA相关的主要技术内容,并由此延伸探讨了FPGA在人工智能和大数据时代的机遇和挑战。

可以说,如今FPGA在泛数据中心应用领域再次焕发新生,各种全新机遇接踵而至。同时我们看到,机遇往往伴随着挑战,只有勇于应对挑战,才能在新的时代不断前进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/502522.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

respond with a status of 40_高中英语作文高分秘籍!50组高级替换词+40个高级句型+88个高级词组,还不快记下!...

很多同学都发现,高中阶段对于写作的考查要求更高,一篇没有错误但平淡无奇的文章是拿不到高分的,保证正确性的前提下,写作必须要有出彩之处才能得到阅卷老师的青睐,今天就为大家分享高中写作50组高级替换词40个高级句型…

iphone分屏功能怎么用_iPhone上10个隐藏小技巧,怎么用怎么爽

离上一期iPhone技巧已经过了四个多月时间了,不少朋友在后台一直催小雷赶紧出下一期。为了不让你等太久,所以今天小雷就奉上新的一期(也是防止你们等得不耐烦了以至于想捶我)。这期干货实在太多,如果其中有一些你们之前get过的话,就…

太阳能板如何串联_太阳能光伏系统单晶和多晶模组的差异?农村家庭自用如何科学选择...

太阳能光伏想必大家都耳熟能详,因其环保且属于可再生能源,目前在农村很多居民屋顶都已经铺设了光伏发电系统,即节省了电费开支又能并入国家电网,所以近些年来我国的光伏产业得到了很好的发展,是目前发展最快的清洁能源…

数据查询和业务流分开_TiDB HTAP 助力小红书业务升级

作者介绍:张亿皓,小红书基础技术部资深开发工程师,负责数据库相关的研发和落地工作。TiDB 在小红书业务场景的应用简介2017 年,小红书已经开始在生产业务中使用 TiDB ,真正成体系的去做 TiDB 的落地是在 2018 年&#…

php server自定义函数,php:SQL Server用户自定义的函数种类详解

关于SQL Server用户自定义的函数,有标量函数、表值函数(内联表值函数、多语句表值函数)两种。题外话,可能有部分朋友不知道SQL Serve用户自定义的函数应该是写在哪里,这里简单提示一下,在Microsoft SQL Server Managerment Studio…

vlan为什么能隔离广播域_路由交换技术-VLAN原理及配置

VLAN原理及配置1. 背景网络中计算机的数量越来越多,传统的以太网开到面临冲突严重,广播泛滥及安全性无法保障等问题VLAN(virtual local area network)即虚拟局域网,是将一个物理的局域网在逻辑上划分为多个广播域的技术,通过在交换…

刀片 显卡 排行_AMD发布RadeonRX6000系列游戏显卡 4599元起

10月30日消息,据国外媒体报道,AMD日前发布了Radeon RX 6000系列游戏显卡,该系列显卡包括AMD Radeon(镭龙) RX 6800显卡和RX 6800 XT显卡,以及新旗舰RX 6900 XT显卡。AMD Radeon RX 6000系列显卡(图片来自AMD官网)AMD Radeon RX 68…

等保2.0安全管理制度对比_一手资料!等保2.0云计算安全与风险评估

一、等保2.0对云计算发展提出“新要求”与等保1.0的标准体系相比,等保2.0在适用性、时效性、易用性、可操作性上得到进一步扩充和完善,以适应云计算、物联网、工业控制系统等新技术的发展。如下表给出了等保2.0发生的重要变化。针对等保2.0标准提出的新要…

mt4 指标 涨跌幅 颜色k线_通达信精选指标——彩色K线指标

通达信精选指标——彩色K线指标VAR1:LLV(L,10); VAR2:HHV(H,25); 趋势:EMA((C-VAR1)/(VAR2-VAR1),10); AA:趋势>REF(趋势,1); BB:趋势<REF(趋势,1); 买入:DRAWICON(CROSS(AA,BB),L-0.1,23); 卖出:DRAWICON(CROSS(BB,AA),H0.1,15); {红} STICKLINE(AA,C,OPEN,3.5,0),COLOR…

matlab如何建立时间温度曲线,matlab如何绘时间曲线?

2007-02-12针对春夏秋冬四季的气候特点&#xff0c;应该如何进补四季的饮食宜忌中国古代医学家在漫长的生活实践中&#xff0c;逐步体会到人与自然界存在着非常密切的关系。自然界一年四季的变化&#xff0c;直接影响着人体的生理功能和病理变化&#xff0c;这就是“天人相应”…

erp系统原理和实施第五版pdf_【图片】生产制造企业ERP系统选型及实施“避坑”指南!【企业管理软件吧】...

随着企业经营环境的变化、信息技术的不断发展&#xff0c;基于ERP系统的信息化管理模式必将朝着更加科学化、集成化、智能化、网络化的方向发展。实施ERP是一场“变革”&#xff0c;那也就必然存在着失败的可能。对于众多制造企业而言&#xff0c;在ERP系统应用方面需要进一步加…

检测电脑硬件的软件_【软件分享】PowerDVD | PotPlayer | AIDA64

PowerDVD软件介绍&#xff1a;PowerDVD是一款知名的蓝光影音播放软件&#xff0c;支持8K超清、4K蓝光与HDR影像及VR360影片播放。全方位支持播放多种热门影音格式&#xff0c;包括影片、光碟、ISO 档案以及相片&#xff0c;无论是在 PC 或 TV 设备播放都没问题。搭载独家TrueTh…

sqlserver如何从周一计算周_纯零基础,花10周时间,完全搞定Python,有没有可能?...

最简单适合小白练手的 10 个Python小项目&#xff0c;十天就能搞定Python。今天我推荐大家一本书&#xff1a;《面向零基础的Python小项目》&#xff0c;如果你集中精力&#xff0c;花10周&#xff0c;也就是两个半月时间&#xff0c;搞定Python&#xff0c;真的不再是一句空谈…

cannot load php5,Cannot load php5apache2_4.dll into server解决办法

我们正在装置好Apache,但装置PHP设置装备摆设完成以后,再次启动apache的时间涌现了毛病 the requested operation has failed; Apache没法启动,检察Ap]一.原因1:我们在安装好Apache服务器,一开始正常,但安装PHP配置完成之后,再次启动apache的时候出现了错误 the requested oper…

graphics 位深度_热门上海乐家人才公寓深度解析又是一个神

热门上海乐家人才公寓深度解析又是一个神提前来电预约看房可售楼处员工优惠5000元到20000元&#xff0c;免费专车接送/自驾报销路费&#xff0c;并可售楼处员工价格优惠&#xff01;老带客户带新客户&#xff0c;还可奖励iPhonePro&#xff0c;新客户有更多优惠&#xff01;更多…

JAVA头部声明异常,Java 异常详解

一.异常与错误的区别再讲异常之前我们就应该要知道异常和错误的区别Error类和Exception类的父类都是throwable类&#xff0c;他们的区别是&#xff1a;Error类一般是指与虚拟机相关的问题&#xff0c;如系统崩溃&#xff0c;虚拟机错误&#xff0c;内存空间不足&#xff0c;方法…

什么是面向对象_什么是面向对象?新手程序员必掌握的技能

面向对象是指基于逻辑对象的概念构建的编程语言&#xff0c;系统或软件方法。它通过创建&#xff0c;利用和操纵可重用对象来执行特定任务&#xff0c;过程或目标。什么是面向对象&#xff1f;面向对象程序设计是种具有对象概念的程序编程典范&#xff0c;同时也是一种程序开发…

弹出键盘布局上移_评测 | 别买了HHKB键盘不知道这些新功能!

⇪ 点击“蓝字”关注我们 ⇪ 关于HHKB静电容键盘的新品系列&#xff0c;小U已经与大家分享了不少“评测”&#xff0c;虽然距离新品发布已经有一段时间&#xff0c;但大家的热情依旧不减呀&#xff0c;每一次都能从小伙伴们的反馈中看到新的小惊喜。那么今天&#xff0c;咱们…

如何访问docker内php,主机怎么访问docker里的程序

主机怎么访问docker里的程序需求&#xff1a;1&#xff1a;本机访问docker中的应用2&#xff1a;其他机器访问docker中的应用3&#xff1a;dockerB中访问dockerA中的应用已知环境&#xff1a;主机IP&#xff1a;192.168.220.123容器A已启动&#xff0c;IP&#xff1a;172.17.0.…

苹果手机屏幕镜像搜索不到电视_最全小米电视投屏教程(建议收藏)

【dogkeji-科技犬】今天&#xff0c;小米电视官方带来了最全小米电视投屏教程&#xff0c;包括手机镜像投屏、电脑镜像投屏、APP直接投屏三种方案&#xff0c;建议收藏&#xff01;手机镜像投屏如果你使用的是小米手机投屏&#xff0c;只需两步&#xff1a;1、首页点击遥控器菜…