异构计算:软硬件结合全栈助力AI大爆发

9月20日上午,杭州云栖小镇E1-2会场,备受业界关注的2018年杭州云栖大会异构计算专场召开。

近年来,人工智能持续爆发,对算力提出了更高的要求。异构计算作为大计算时代的解决方案,意在打破传统通用计算的限制,融合不同指令集和体系架构的计算单元,完美支持大计算场景。

让每一个芯片都发挥最大效能

首先,阿里云弹性计算负责人,阿里云研究员余锋,带来了精彩的开场。余锋以摄影来打开话题:每一个镜头都会有特别的定位,在某个场景下合适但是另外场景会力不从心,异构计算的精髓也是如此,即让每一个芯片都发挥最大效能,扬长避短。

 

余锋说:异构计算带来的计算效率提升是指数级的,但是需要有配套工具,基础设施等等。阿里云正在逐渐让这个门槛变低,并且和业内一起构建技术生态,让异构计算普惠行业,帮助合作伙伴和客户不断创新。

GN6实例 F3实例全面商业化

议题阶段,首先登场的是阿里云高级产品专家潘岳。潘岳首先介绍了正在全面商业化推进的GN6实例和F3实例。GN6实例搭载NVIDIA Volta架构的Tesla V100计算卡,相对于上一代产品可以提供12倍的运算能力提升。而基于阿里云FaaS(FPGA as a service)舜天平台的F3实例搭载Xilinx 16nm Virtex UltraScale+器件VU9P,对比上一代产品,逻辑容量增加4倍,DSP能力提升8倍。

 

两大平台:昊天 和 舜天,全面助力企业创新

随后,潘岳首次揭秘了阿里云异构计算两大平台:昊天EGS平台和舜天FaaS平台;分别对应异构计算领域两大热门芯片方案:GPU和FPGA。潘岳指出,阿里云异构计算平台技术在阿里巴巴内部已经完成和多项业务的顺利融合,历经大范围高压测试,已然非常成熟。除此之外,异构计算全系产品与阿里云生态深度无缝融合,可以和传统的通用计算共用云上的全套服务。

 

在改善用户使用体验上,阿里云异构产品持续提供多种工具,来让异构产品更易用,这其中包括了方便开发部署的容器镜像工具,实时监测GPU状态的运维工具,以及神经网络框架优化的增值服务等。此后,潘岳分享了阿里云FPGA云服务器落地的业务场景。最后,在异构生态建设上,潘岳强调,阿里云积极引入国内外众多的解决方案供应商,共同构建完善异构生态体系,为企业客户提供高性能的加速解决方案。

昊天平台揭秘

论坛的第二个议题由阿里云资深技术专家龙欣带来,对昊天EGS平台进行了详细的剖析。龙欣指出阿里云异构计算的GPU云服务,在算力水平扩展趋势背景下,已经从GPU加速器的单点突破,向全面的平台体系演进。

 

今天的演讲第一次披露了阿里云昊天EGS平台的服务体系:昊天平台在集群计算上,为不同规模的客户提供了从GPU集群运维监控,到底层CUDA驱动,再到中间框架加速层快速一键部署,和GPU集群分布式业务层定制化调优的全面专业服务。演讲还分享了昊天平台在底层基础设施层的技术架构:GPU虚拟机的热升级技术、与AMD联合开发的公共云首个基于SRIOV的GPU热迁移技术、神龙GPU技术与超级计算GPU集群技术。

成熟客户案例立体呈现

来自微博的资深技术专家黄波,从客户的角度,详细介绍了基于阿里云异构计算平台的深度学习案例。同时,黄波先生还从自身体验出发,总结了云端深度学习的优势:弹性,集群化管理,高性能,和专业服务等等。

 

舜天平台揭秘

第四个登场的是阿里云资深技术专家张振祥,带来了对阿里云FaaS舜天平台的详细剖析。议题指出阿里云FaaS舜天平台是云上输出FPGA高性价比算力的使能器,大幅降低了FPGA的应用门槛。围绕着“易用性、稳定性、可扩展性和安全性”的设计理念,舜天平台做了大量的软硬件创新。

 

张振祥强调,以舜天平台为依托,阿里云愿与业界的合作伙伴和客户并肩携手,打造FPGA异构计算的健康而强大的生态圈。随着云计算和人工智能的进一步普及,FPGA的器件和技术将获得进一步的提升和改善,更好地适用大算力的应用场景,服务更多的垂直市场。演讲过程中,现场反应热烈,业界同仁对共建生态圈体感强烈。

舜天平台助力阿里高性能时序数据库

最后,阿里巴巴技术专家钱赟介绍了基于阿里云舜天平台的高性能时序数据库。从实际案例出发,再次验证了舜天平台的性能极致,资源易用,IP安全,同时又可以大幅降低计算成本等特性。

 

阿里云在异构计算上的逐步深入和成熟,正在帮助越来越多的企业在云上实现创新和突破。比如刚刚在MS COCO大赛获得4项世界冠军的旷视科技就是阿里云异构计算的深度用户。客户的成功一直是阿里云的诉求和共同目标,一起来用异构计算开启大计算时代吧。


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/520837.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

弹性计算平台技术:云服务器“安全”“稳定”“弹性”的基石

9月19日上午9点,杭州云栖小镇E1-3会场,2018年杭州云栖大会弹性计算平台技术专场拉开帷幕。 弹性计算系列产品是云时代的基石产品之一,一直备受外界关注。作为弹性计算团队在本届云栖大会的开场大戏,平台技术专场吸引了超过200位与…

RabbitMQ+haproxy+keeplived 高可用负载均衡+镜像集群模式_集成高性能高可用组件 Keepalived_03

服务器IPhostname节点说明端口管控台地址账号密码192.168.0.115mq-01rabbitmq master5672http://192.168.0.115:15672guestguest192.168.0.117mq-02rabbitmq slave5672http://192.168.0.117:15672guestguest192.168.0.118mq-03rabbitmq slave5672http://192.168.0.118:15672gue…

AirPods Pro 到底「Pro」在哪里?

2019 嵌入式智能国际大会即将来袭!购票官网:https://dwz.cn/z1jHouwEAirPods Pro一出,又被网友疯狂恶搞。有吐槽AirPods Pro,只是AirPods的复制版本的。有吐槽AirPods Pro,像个吹风机的。有吐槽像植物大战僵尸的。2018…

python pow和**_「Python学习笔记」Python函数高级应用

Python, 函数本身也是一个对象函数既可以赋值,也可以用作其他函数的参数,还可作为其他函数的返回值。使用函数变量Python的函数也是一种值:所有函数都是function对象,这意味着可以把函数本身赋值给变量,就像把整数、浮…

黑科技揭秘:如何通过阿里云超算,使得汽车仿真效率提升25%

在汽车行业,过去有一句俗话,一辆车从设计到下线,“至少要11辆真实碰撞试验”,今天,在现代化的汽车制造业,通过长期发展的设计和仿真软件,几乎所有的环节,都可以做到设计与仿真一体化…

更改应用程序图标_苹果更新 TestFlight 应用图标,增加更多拟真细节

TestFlight 是苹果公司针对开发者分发测试软件的应用,开发者可通过 TestFlight 向最多1万名测试者分发待测试应用。测试者在测试使用软件的同时,还可以向开发者提供使用意见或遇到的问题。最近,标志情报局发现,TestFlight 应用程序…

在一夜暴富之前,我先一夜秃了头

戳蓝字“CSDN云计算”关注我们哦!作者 | 朱小五and王小九责编 | 阿秃与天斗,其乐无穷;与地斗,其乐无穷;与发际线斗,虽败犹荣……年轻人,今天的你比昨天更秃了吗?口说无凭&#xff…

负载均衡工具 haproxy 单机安装部署完整流程

负载均衡是系统设计最常见的一种方式,Nginx、HAProxy、LVS、F5用得比较普遍,不过Nginx只能在HTTP层负载,而HAProxy即可以在7层做负载,也可以在4层做负载,LVS配置有点太麻烦。 HAProxy是免费、极速且可靠的用于为TCP和基…

黑科技揭秘:阿里云如何做到从业务宕机到恢复业务运行只用一分半钟时间

2018杭州云栖大会主论坛上,阿里云打造的混合云容灾方案惊喜亮相,并直接在现场进行了全过程的演示,凸显出阿里云技术的强大心智。 整个混合云容灾演示在5分钟内呈现了阿里云秒级RPO,分钟级RTO企业应用容灾的端到端流程,…

恭喜你!在25岁前看到了这篇最最靠谱的深度学习入门指南

戳蓝字“CSDN云计算”关注我们哦!人工智能(AI)和机器学习(ML)在当下的火热程度我就不多说了,但是真正懂这方面的人又有多少呢?本文将带你了解人工智能和机器学习的基本知识。同时,你…

华为智能家居app未能连接上远程云服务_【InForSec通讯】智能家居云平台实体间交互状态安全分析 | Usenix2019...

论文题目:Discovering and Understanding the Security Hazards in the Interactions between IoT Devices, Mobile Apps, and Clouds on Smart Home Platforms论文作者: Wei Zhou, Yan Jia, Yao Yao&#…

黑科技揭秘:百种异常随机注入,专有云为何稳如泰山

关键应用服务中断引发一系列连锁反应,起因仅是一块磁盘被写满?为什么这么巧,两个小概率的问题偏偏一起发生,造成保护失效?为什么我们做了测试演练,然而真正发生问题依然踩坑?”2018杭州云栖大会…

负载均衡工具 haproxy 集群安装部署完整流程

负载均衡是系统设计最常见的一种方式,Nginx、HAProxy、LVS、F5用得比较普遍,不过Nginx只能在HTTP层负载,而HAProxy即可以在7层做负载,也可以在4层做负载,LVS配置有点太麻烦。 HAProxy是免费、极速且可靠的用于为TCP和基…

阿里云 MaxCompute 2018-09 新功能发布

2018年9月大数据计算服务 MaxCompute 又发布新功能啦! 【新功能】MaxCompute窗口函数支持WINDOW_CLAUSE 参考文档 适用客户 数据开发人员在进行数据开发过程中,用到调用window函数窗口时,SQL里反复写上OVER语句会显得冗余,MaxC…

要不要赶个时髦,去建设一个「 中台 」?

戳蓝字“CSDN云计算”关注我们哦!作者 | 奎哥责编 | 阿秃很多技术人总是抱怨 新技术/新框架/新概念 太多了,总是学不完,抱怨实在是学不动了。哈哈,这不,最近「 中台 」这么火热,要不要停止抱怨&#xff0…

strcpy用于调用的参数太少_C和汇编如何互相调用?嵌入式工程师必须掌握

ARM系列文章,请点击以下汇总链接:《从0学arm合集》一、gcc 内联汇编内联汇编即在C中直接使用汇编语句进行编程,使程序可以在C程序中实现C语言不能完成的一些工作,例如,在下面几种情况中必须使用内联汇编或嵌入型汇编。…

在阿里云上试用 Knative

在今年的Google Cloud Next大会上,Google发布了Knative, 这是由Google、Pivotal、Redhat和IBM等云厂商共同推出的Serverless开源工具组件,它与Istio,Kubernetes一起,形成了开源Serverless服务的三驾马车。 本文来自阿里巴巴中间件…

阿里云参加ONS EU 2018,飞天洛神亮相网络顶会

9月25日,荷兰阿姆斯特丹,为期3天的网络科技界盛会Open Networking Summit拉开序幕。来自世界各地的网络技术领域专家齐聚一堂,参与并分享各自分支领域的经验和成果。阿里云在会上展示了虚拟网络系统飞天洛神,智能网络管理平台齐天…

linux中如何在文件中查找文件,linux下find(文件查找)命令的用法总结

每一种操作系统都有成千上万的文件组成,对于linux这样“一切皆文件”的操作系统来说更不例外,大家应该都能很轻松使用windows下的文件查找功能,但是对linux这一功能可能并不是很熟悉,其实想玩linux的你更要牢牢掌握这个命令&#…

主动安全,新华三融合生态之力!

戳蓝字“CSDN云计算”关注我们哦!作者 | 晶少责编 | 阿秃出品 | CSDN云计算(ID:CSDNcloud)“如今网络安全形势错综复杂,解决方案不可能由一家公司独当天下,面对这样的情况,我们就要选择自身擅长…