Graphcore 联合百度飞桨提交 MLPerf Training 2.0,IPU 性能再下一城

作者 | 宋慧

出品 | CSDN 云计算&AI 科技大本营

为 AI 与机器学习提供更高性能的支持,是芯片厂商的竞争特点。最近,AI 芯片厂商 Graphcore 联合国内知名的深度学习平台百度飞桨,共同提交了 MLCommons 的 AI 基准评测 MLPerf Training 2.0,提交的模型集合评测结果比以往测试和其他芯片平台,都有较大的提升,再次证明了 IPU 芯片的过硬实力。

CSDN 曾报道 Graphcore IPU 的发展: GPU还是IPU?IPU 芯片厂商 Graphcore 的 2021 ,与英伟达、Google、英特尔的 SIMD 的芯片架构不同,Graphcore 的 IPU 是 MIMD 架构的图处理器,Graphcore 的 IPU 多核最多已达 1472 核,每个核自有 SRAM,是多核分布式、片上内存分布式的多指令多数据的处理器。因此,Graphcore IPU 基于 AI 计算图的处理器,可以支持运行矢量处理器运行效果不佳的应用场景。

联合提交 MLPerf 测试模型,算力与性能继续提升

Graphcore 在 2022 年第一季度发布了最新的基于 Bow 芯片的 Bow Pod 平台,也是本次 MLPerf 2.0 主要提交的计算平台,Bow Pod16、Bow Pod64、Bow Pod128、Bow Pod256,为提交测试的各类模型,都提供了最新和最强的算力支持。例如 Bow Pod16 整体算力为 5.6 PetaFLOPS,到 Bow Pod256 整体接近 90 PetaFLOPS,几乎达到了数据中心的算力规模。

本次提交的测试模型是 ResNet-50、BERT 和 RNN-T,其中,ResNet-50 和 BERT 是标准提交的集合,另外语音方面在开放分区提交了 RNN-T(Recurrent Neural Network Transducer),性能指标可以直接供商业用户使用参考。

测试结果 1、ResNet-50 测试耗时,最短 2.67 分钟

Graphcore Bow Pod 在 ResNet-50 上的提交结果

在 2021 年底 Graphcore 提交的 ResNet-50 测试中,NVIDIA 的 DGX A100 和 Graphcore  IPU-POD16 的对比上,Graphcore 第一次超过 NVIDIAIPU-POD16 耗时 28.3 分钟。本次提交结果继续进步,缩短到 19.64 分钟。在 Bow Pod256 上,训练时间仅需 2.67 分钟,要知道几年前的模型训练时间都是以小时为单位起步的。Graphcore 技术负责人对 CSDN 介绍,性能的成绩得益于硬件层面 Graphcore Bow IPU 采用的 Wafer-on-Wafer 3D 堆叠技术,软件层面的通信库、内存优化,编译器优化,以及训练模型的优化等这些技术点的提升。

测试结果 2、BERT 测试,性能线性提升

与去年提交结果的对比,从 IPU-POD16 到 Bow Pod16 的训练时间提升了 31%,吞吐量的提升约为 1.6 倍,其中 1.3 倍来自硬件提升,1.26 倍来自软件提升。另外,Bow Pod256 提升了接近 30%,通常情况下,系统越大,越难提升,因此 Graphcore 在大尺度系统上做了很多通信库、集合通信(collective communication)优化,最终在大尺度系统上也达到了同比例提升。另外,BERT 和 ResNet 的提升幅度类似,训练时间提升了接近 37%,吞吐量提升了 1.6 倍。

本次测试和以往不同的,是 Graphcore 与百度飞桨联合提交。百度飞桨使用 Bow Pod16 和 Bow Pod64 进行了 BERT 在封闭分区的提交,结果与 Graphcore 使用自研的训练推理引擎 PopART 进行提交的结果几乎一致,说明了 Graphcore 软件栈能够快速对接新的 AI 框架。而百度飞桨在测试中,也体现了框架的接入高效性,没有任何性能侵入式的设计。

芯片之上,Graphcore 继续深耕软件与生态能力

本次的联合提交测试,也是 Graphcore 与百度飞桨生态共建的重要一站。从共聚、共研到共创,百度飞桨的硬件生态正在快速发展,与以往算子开发、映射开发不同,Graphcore 以子图或者整图的方式,也为飞桨提供了创新思路。

 

据介绍,飞桨与 Graphcore 在 AI Ecosystem 的共创方面还有很多新的方向,如百度飞桨与 Graphcore 的软件栈,以及 Graphcore 的模型花园偏应用层面的开发工具等合作,并在百度的内部以及国内其他的行业,落地产业开展真实应用。此外,百度飞桨与 Graphcore 也计划在 AI Studio 上后续开设 Graphcore 的硬件应用专区,基于这个平台更好地共同拓展与国内开发者,以及国际开发者的合作。

硬件的发展之外,Graphcore 在软件层面也在持续发力。就像下图中的模型,除了黄色的是历届提交的 MLPerf 模型,在实践中 Graphcore 还积累了更多模型可供用户参考使用。比如在计算机视觉上,除了 CNN 卷积神经网络,还包括 ResNet-50、EfficientNet、MoblieNet,更多的类似 Transformer,DINO、Swin Transformer 等业界最新流行的模型。在物体检测方面 YOLOv3、v4,在目标分割以及医疗影像方面的 Unet,Graphcore 也在持续跟进、快速迭代。

 

另外,据介绍,Graphcore 在自然语言处理 NLP、强化学习、语音、时间图神经网络、聚类图神经网络上都在发力。在 HPC 领域,分子动力学、大气模拟、Covid-19、智能气象里 ET0 的计算,也都可以通过 Graphcore 的 IPU 硬件加速带来更高性能提升。在 AI 领域之外,金融行业销售预测、推荐引擎和生成式模型 DALL-E 以及 DALL-E 2,Graphcore 也在同步开发和研究。除了与百度飞桨的深度合作,Graphcore 也在与欧洲的 AI 公司 Aleph Alpha 在大模型大算力联合创新。

Graphcore 还在打造 AI 超级计算机 Good™ Computer(古德计算机),古德计算机是为100万亿参数量的模型打造,Good™ Computer将会达到约8192个路线图IPU,提供超过10 Exa-Flops的AI算力,也考虑继续往3D Wafer-on-Wafer演进(目前Graphcore采用3D Wafer-on-Wafer的Bow芯片,AI算力为350T)。其中存储需达到4PB,以及10 PB每秒的内存带宽,离不开Graphcore Poplar软件的迭代,以支持大算力和大模型的要求。

AI 芯片行业的爆发式发展,从本次联合提交 MLPerf 测试,能看到 AI 行业中的各方在寻求更加开放的合作与共赢,而生态的繁荣,也会让 AI 走得更远。CSDN 将继续关注 Graphcore 与 AI 芯片的最新发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/511366.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

创新推出 | Serverless 调试大杀器:端云联调

简介:端云联调功能,不仅提升了 Serverless 应用的开发者的开发效率并且带来了良好的开发体验;让本地开发环境突破网络限制,真正实现和云端环境融为一体,一文带你了解,端云联调功能是如何解决应用调试难题的…

密立根油滴实验的计算机仿真实验报告,H-D光谱实验的计算机仿真

对H-D光谱实验进行计算机仿真,由计算机控制的摄谱仪进行氢氘光谱摄谱,对谱线寻峰,计算出里德伯常量、氢氘质量比和同位素位移,并画出了氢原子的能谱图。维普资讯 http://www.wendangwang.com第2 7卷第9期物理实验PH Y SI CS EXPERI EN TA T 1 N M 0Vo . 7 NO 9 12 .Se p., 0 20…

独家交付秘籍之招式拆解(第一回)

简介:上一回说到经历种种交付难题的王小锤一行人,意外发现一本交付秘籍,打开了新世界。本次他们带着具体交付场景来到阿里云,与交付宗师阿莫探讨秘籍中的招式以及招式背后的秘密。 作者:吕莫、新钰 前情介绍 大家好…

白鲸开源再获数千万元融资,完善 DataOps 开源生态,打造下一代云原生智能DataOps平台

Apache DolphinScheduler是首个由国人主导并贡献到Apache的大数据工作流调度领域的顶级项目。作为已经十分流行的开源调度项目,已有48位Committer和21位PMC,360 Contributors 积极参与到社区的共建中。自开源以来,Apache DolphinScheduler稳步…

国内唯一,阿里云容器服务进入 Forrester 领导者象限

简介:近日,国际权威咨询机构 Forrester 发布《 The Forrester WaveTM: Public Cloud Container Platforms, Q1 2022 》报告,报告显示,阿里云进入全球公共云容器平台"领导者"象限,这是中国云计算厂商首次进入…

K8s Ingress Provider 为什么选择 MSE 云原生网关?

简介:在虚拟化时期的微服务架构下,业务通常采用流量网关 微服务网关的两层架构,流量网关负责南北向流量调度和安全防护,微服务网关负责东西向流量调度和服务治理,而在容器和 K8s 主导的云原生时代,Ingress…

在 Kubernetes 上执行 GitHub Actions 流水线作业

作者 | Addo Zhang来源 | 云原生指北GitHub Actions 是一个功能强大、“免费” 的 CI(持续集成)工具。与之前介绍的 Tekton 类似,GitHub Actions 的核心也是 Pipeline as Code 也就是所谓的流水线即代码。二者不同的是,GitHub Act…

将信息系学生的计算机文化学,计算机等级考试(国家)-关系数据库操作语言sql(四)...

计算机等级考试(国家)-关系数据库操作语言sql(四) (8页)本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦!10.90 积分关系数据关系数据库库操作操作语语言言SQL(四四)设计题设计题 在SQL Server 2000中&a…

系统困境与软件复杂度,为什么我们的系统会如此复杂

简介:读 A Philosophy of Software Design 有感,软件设计与架构复杂度,你是战术龙卷风吗? 作者 | 聂晓龙(率鸽) 来源 | 阿里技术公众号 读 A Philosophy of Software Design 有感,软件设计与架…

节省 58% IT 成本,调用函数计算超过 30 亿次,石墨文档的 Serverless 实践

简介:石墨文档使用函数计算搭建文档实时编辑服务,由函数计算的智能调度系统自动分配执行环境,处理多用户同时编写文档带来的峰值负载,函数计算的动态扩缩容能力保障应用的可靠运行。 作者 | 金中茜 对石墨文档来说,“…

剖析 Netty 内部网络实现原理

作者 | 张彦飞allen来源 | 开发内功修炼Netty 是一个在 Java 生态里应用非常广泛的的网络编程工具包,它在 2004 年诞生到现在依然是火的一塌糊涂,光在 github 上就有 30000 多个项目在用它。所以要想更好地掌握网络编程,我想就绕不开 Netty。…

免费体验,阿里云智能LOGO帮你解决设计难题

简介:超实用!零基础搞定一个高大上的智能logo设计 新年过后,往往是大家一年中士气最足的时候,散去了年末的疲惫和emo,重燃对新一年的热情和希望。 想创业的朋友们同样意气风发,趁着新年的劲头想大干一场。…

第十一届吴文俊人工智能科学技术奖颁奖盛典召开,66个项目成果摘得中国智能科学技术奖励最高殊荣

7月16日上午,我国智能科学技术最高奖“吴文俊人工智能科学技术奖”颁奖盛典在北京隆重举行,66个获奖项目及个人受到表彰奖励。中国工程院院士、浙江大学教授潘云鹤荣获“吴文俊人工智能最高成就奖”,并颁授荣誉奖牌和100万人民币奖金。欧洲科学院院士、华…

企业拥抱开源之前,必须了解的七件事

简介:新的时代,开源的发展越来越蓬勃,开源和云的关系越来越复杂,耦合度越来越高,云是开源软件允许的最佳环境之一,也为开源软件插上安全高效的腾飞引擎。本文试图从企业软件的历史,结合开源软件…

荔枝音质高保真AI降噪技术分享

“荔枝音频处理目标就是两个字:清静——清晰、安静。让用户听得更清晰、更真切、更好。”荔枝集团技术副总裁刘晓宇谈及音频技术要攻克的几个难点时一针见血地提到。 随着疫情下直播、在线社交、在线课堂、在线会议等快速发展和元宇宙产业不断壮大,音频…

19年兰州大学计算机分数线,兰州大学2019年在广东省录取分数线

免费申请学习规划请选择在读年级学前小学初中高中大学留学其他已为10472位学员提供学习规划*验证码*短信验证码{"text1":{"label":"薄弱科目","placeholder":"请输入你的薄弱科目","required":1,"formType&q…

最佳实践丨构建云上私有池(虚拟IDC)的5种方案详解

简介:云上私有池系列终篇终于来了,本文将重点介绍构建云上的私有池(虚拟IDC)的多种方案和各自的优缺点,并给出相关的性价比优化建议。 本文作者:阿里云技术专家李雨前 摘要 围绕私有池(虚拟I…

阿里云万郁香:多样付费选择构筑成本最优的弹性体验

简介:云上成本优化三部曲:云上资源归属拆解、确定资源需求及购买优先级、选择最佳的付费方式。 2021年12月21日,阿里云弹性计算年度峰会在上海举行,本次峰会通过全实景直播的形式为大家呈现。峰会上,阿里云弹性计算高…

智能分层、满足更高工作负载,亚马逊云科技加速云端存储服务创新

编辑 | 宋慧 出品 | CSDN 云计算 分布式存储 Amazon S3、弹性计算 Amazon EC2,都是亚马逊云科技的当家产品。在云原生、人工智能、数据分析领域继续发挥技术优势,夯实云技术领先的地位之后,亚马逊云科技在存储领域的研究和发展也没有止步不前…

计算机开机黑屏,开机黑屏,电脑无法进入系统

win10开机进安全模式我相信经常用电脑的童鞋也遇到过这样的问题,就是桌面上什么都没有,电脑也开着。怎么了?通常,不显示桌面有很多原因。如何解决这个问题?等等,别担心,小...相信经常使用电脑的…