GPU还是IPU?IPU 芯片厂商 Graphcore 的 2021

作者 | 宋慧

出品 | CSDN 云计算&AI 科技大本营

AI 人工智能毋庸置疑是目前最火的 IT 技术领域之一,而主攻图形计算的 NVIDIA GPU(图形处理器)又是现今 AI 领域的当红炸子鸡。不过 AI 芯片领域又迎来了新的挑战者,2016 年创立于英国的 Graphcore 设计并推出了 AI 专用芯片 IPU,在短短几年时间即完成 E 轮 2.22 亿美元融资,并在开拓全球多个市场。

在刚刚过去的 2021 年,Graphcore 在继续加速增长,一年时间内员工就从 400 人增至 700 人,几乎翻倍,而中国团队则从 20 人增至 80 人。2022 年初,CSDN 访问了 Graphcore 大中华区总裁兼全球首席营收官卢涛,对于 Graphcore IPU 的核心架构的设计思路,以及 AI 领域前沿的应用案例,他分享了最新的进展与见解。

IPU vs GPU:解耦后,更快更灵活

提到 AI 底层芯片,业界首先关注的,就是芯片性能与跑分的数据。Graphcore 全系列的芯片在 2021 年 11 月参加了 MLCommons 的 AI 基准评测 MLPerf 1.1 的训练模型评测,其中 IPU-POD16 在 ResNet 模型测试中,性能超过了 NVIDIA 旗舰的 DGX A100 80G  GPU 系统,另外,Graphcore IPU-POD64 也拿下了单一主机服务器下自然语言训练模型 BERT 最快的系统称号。

 

在 MLPerf 1.1 基准测试中,除了对 ResNet、BERT 等模型的支持,Graphcore 也在探索更多新的计算机视觉模型,如 EfficientNet,还有 2021 年下半年热门的基于 Transformer 的视觉模型 ViT,以及更大的主流 GPT 模型等。

卢涛对 CSDN 分享了,Graphcore IPU 的架构设计中,与 GPU 设计的三大核心差异点。第一,Graphcore IPU 的计算核心有多达 1400 多个处理器内核,每个内核可运行 6 个线程。第二,与 GPU 的存储架构不同的是,IPU 采用处理器片内分布式存储架构,如 Graphcore GC200 拥有 900MB 处理器内存储,而 GPU 采用显存或高宽带显存 HBM,是片外的大型存储。最后,在跨芯片多核通信调度设计上,GPU 是以多核多线程呈现,开发者需要处理不同线程之间的通信与数据同步问题,而 Graphcore IPU 设计了 BSP(Bulk Synchronous Parallel)的软硬件结合算法,让芯片内 1000 多个内核,以及多芯片可以跨 IPU 连接。

与 GPU、CPU 等芯片对比,Graphcore IPU 另一个重要的设计思想,是实现 CPU 与 AI 处理引擎的解耦,依据 AI 的不同场景,灵活和优化配置 CPU 与 IPU 的比例。为此,Graphcore 设计了一系列的系统级优化,例如对于谷歌的 BERT 模型,通常 NVIDIA 或 Intel 都是固定比例的架构,如 CPU 与 GPU 的 1:4 数量比,或 Intel 的 CPU 与 AI 加速引擎的 1:2 数量比。而 CPU 与 Graphcore 的 IPU 可以是 1:32,而基于计算机视觉,比例则又可以是 1:8。

解耦之后更加灵活的底层芯片性能,让 Graphcore 敢于设计并探索更多 AI 的前端场景。2021 年,Graphcore 在已有的、可用于初建或较小的机器学习的 IPU-POD16、IPU-POD64 之后,重磅推出了 IPU-POD128、IPU-POD256 两个可以应用于超大规模、云化的大型超算 AI 集群或计算系统的新品。现在,IPU-POD128、IPU-POD256 两个平台已下柜销售,用户可以直接商用部署。

 

除了硬件之外,Graphcore 也在软件层面持续丰富和完善自身的技术与软件生态。在 Graphcore 的 Poplar SDK 中,在硬件相关的驱动、协议栈,和机器学习框架 XLA、图编译器、PopART 等之外,2021年 Graphcore Poplar SDK 增加了对 PyTorch Lightning、百度飞桨、Hugging Face 的支持,其中百度飞桨在 Graphcore IPU 上已经实现训练与推理的全面支持。此外,对开发工具、硬件管理与 IPU 虚拟化的支持也在增强。

商用市场为核心,拥抱开放的生态

底层芯片之上,丰富的生态一直是芯片厂商重要的目标。在 AI 生态方面,Graphcore 已经与 PyTorch Lightning、百度飞桨、阿里云 HALO、Jupyter Notebook、Hugging Face、Weights & Biases、Spell、Gradient 等成为合作伙伴。

 

在基础设施层,2021 年 VMware 的 Project Radium 宣布将支持 Graphcore IPU 以作为其硬件分解倡议的一部分,云原生的 Docker、Kubernetes 均支持 IPU,这也可以看出人工智能在关注机器学习框架和模型之后,开始更细致地去改进底层资源的部署与调度,以及任务分配。

服务器 OEM 合作伙伴方面,在戴尔和浪潮之后,Graphcore 在 2021 年新增了 Atos、NEC、Supermicro、2CRSi 4 个服务器合作伙伴。存储方面,2021 年 Graphcore 和国际主流的商用存储设备,如 DDN、Pure Storage、Vast Data、WekaIO 均达成了合作。

卢涛表示,目前,对稳固和性能要求更高的商用市场,是 Graphcore 的核心目标,此外,Graphcore 将最大程度的拥抱开放的生态,并用技术为中国市场服务,实现科技惠民。

Graphcore IPU 的主场,从前沿科学到民生应用

除了产品与生态的建设,卢涛也分享了 Graphcore 在 2021 年最新的案例与应用,遍及前沿科学研究和惠及民生的应用领域。例如 Graphcore 与安捷数科合作,利用 IPU 进行气象预测、精准灌溉、防灾减灾等;与巴黎大学在宇宙学应用方面合作;与深势科技合作完成分子动力学模拟软件 DeePMD-kit 向 IPU 硬件的迁移,探索基于分子动力学模拟的科学计算、药物设计、材料设计和新型能源等场景。

在金融保险方面,牛津-英仕曼使用 Graphcore IPU 进行股价预测;Tractable 利用 IPU 进行 AI 保险理赔方面的辅助工作。在电信领域,Graphcore 与韩国电信合作发布了 IPU 云。关于城市环境可持续发展,Graphcore 和升哲科技基于 IPU 进行城市相关可持续发展应用。在医疗、生命科学领域,Graphcore 和斯坦福大学医学院合作,使用 IPU以“医疗+隐私计算”为核心方向进行了相关的研究和探索。

卢涛透露,2022 年,除了新的硬件产品发布计划之外,Graphcore 将与国内公有云厂商合作发布 IPU 产品。AI 应用领域的研究也将会进一步加深,例如 AI 辅助科研、自动驾驶等。

卢涛和 Graphcore 深知,Graphcore 一直被冠以 AI 芯片领域的新入局者,不过,在 2022 年和更远的未来,Graphcore 希望转变这一认知,在性能、创新、TCO、软件易用性多个维度建立市场领导力。

从挑战者到领导者,Graphcore 还有哪些转变,我们拭目以待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/512400.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

云原生大数据架构中实时计算维表和结果表的选型实践

简介: 随着互联网技术的日渐发展、数据规模的扩大与复杂的需求场景的产生,传统的大数据架构无法承载。 作者 | 志羽 来源 | 阿里技术公众号 一 前言 传统的大数据技术起源于 Google 三架马车 GFS、MapReduce、Bigtable,以及其衍生的开源分布…

冬奥开幕在即,现场通信网络技术深度揭秘!

作者 | 小枣君来源 | 鲜枣课堂还有9天,举世瞩目的北京冬奥会就将拉开大幕。本次冬奥会,是继2008年之后,中国再一次承办这种世界最顶级体育盛会。这两年全球疫情肆虐,抗疫形势波折多变。北京冬奥能够如期举办,意义极为重…

Flink 在 58 同城的应用与实践

简介: 58 同城的实时 SQL 建设以及如何从 Storm 迁移至 Flink。 本文整理自 58 同城实时计算平台负责人冯海涛在 Flink Forward Asia 2020 分享的议题《Flink 在 58 同城应用与实践》,内容包括: 实时计算平台架构实时 SQL 建设Storm 迁移 Fli…

当云原生遇到混合云:如何实现“求变”与“求稳”的平衡

简介: 多年来,随着云计算技术的蓬勃发展和落地,越来越多的企业选择采用云计算技术来帮助自己快速完成业务数字化转型,以便能更好地适应市场变化,进而赢得更大的市场空间。 作者|郝树伟 Flexera 的《RightScale2021 云…

之前写的 JSX 的条件语句竟然存在那么多 Bug?

作者 | 零一来源 | 前端印象今天的主题是&#xff1a;关于 JSX 的条件语句&#xff0c;你不知道3件事一、&&隐藏大坑在 JSX 里写条件语句&#xff0c;&& 应该是用的最多的了&#xff0c;例如&#xff1a;function Demo () {// ...省略一些代码return (<div&…

如何高效学习 Kubernetes 知识图谱?

简介&#xff1a; Kubernetes 知识图谱遵循云原生人才学习路径搭建课程体系框架&#xff0c;及人才发展路线设置不同阶段&#xff0c;由浅入深&#xff0c;帮助云原生人才学习容器基础、Kuternetes 网络、存储、资源对象、服务发现、应用编排与管理等 Kubernetes 完整技术栈内容…

中科院信工所经验_2021中科院信息工程研究所电子信息专业考研经验指导分享...

一、在计算机如此火热的今天&#xff0c;为什么选择要读研&#xff1f;我是一个乐观主义者&#xff0c;上大学以来我一直庆幸自己在高考结束填志愿的时候选择了计算机专业&#xff0c;更庆幸报考了湖南大学信息科学与工程学院&#xff0c;高考仅仅一分的优势把我送到了最美的学…

极验创始人吴渊:恶意流量威胁新趋势,揭秘网络黑产3大核心本质

记者 | 邓晓娟出品 | CSDN云计算&#xff08;ID&#xff1a;CSDNcloud&#xff09;天下没有免费的午餐&#xff0c;更没有免费的流量。以电商为例&#xff0c;最疯狂的时候&#xff0c;某电商平台单个获客成本接近400元。作为互联网的稀缺资源&#xff0c;流量的成本不断冲击着…

如何将一棵LSM-Tree塞进NVM

简介&#xff1a; 随着非易失内存产品的商业化推广&#xff0c;我们对于其在云原生数据库中大规模推广的潜力越来越有兴趣。X-Engine是阿里云数据库产品事业部PolarDB新型存储引擎团队研发的一个LSM-tree存储引擎&#xff0c;目前在阿里云PolarDB产品上提供对外服务。我们以X-E…

再见了,我的散装研发管理平台;再见了,4台ECS!

简介&#xff1a; 目前云效全家桶的功能相对来说比较适合个人开发或者中小团队的群体&#xff0c;如果你此时正在为搭建这类管理平台做选型&#xff0c;同时预算和人力都捉襟见肘&#xff0c;那么不妨试试云效这个产品&#xff01;一起白嫖一起爽&#xff01;尤其服务器资源在阿…

15拆分成3个不同的自然数_17个数学重点知识点汇总,一篇搞定小升初

更多电子版学习资料请关注公众号&#xff1a;小学资源园地1体积和表面积三角形的面积底高2。公式 S ah2正方形的面积边长边长 公式 S a2长方形的面积长宽 公式 S ab平行四边形的面积底高 公式 S ah梯形的面积(上底下底)高2 公式 S(ab)h2内角和&#xff1a;三角形的内角和180度。…

走进统信软件,读懂国产操作系统新生态建设

回顾国际 2021 操作系统领域发展&#xff0c;有起伏有波澜&#xff1a;开源操作系统 Linux 迎来 30 岁&#xff0c;全球超级计算机 500 强和超过 70% 的智能手机都运行其上&#xff1b;CentOS 突然宣布 CentOS 8 停止维护&#xff0c;不少企业不得不面临迁移难题…… 反观国产…

Serverless 工程实践 | Serverless 应用开发观念的转变

简介&#xff1a; Serverless 架构带来的除了一种新的架构、一种新的编程范式&#xff0c;还包括思路上的转变&#xff0c;尤其是开发过程中的一些思路转变。有人说要把 Serverless 架构看成一种天然的分布式架构&#xff0c;需要用分布式架构的思路去开发 Serverless 应用。诚…

中科院计算机所硕士导师,中科院计算技术研究所研究生导师介绍:毕经平

中科院计算技术研究所研究生导师介绍&#xff1a;毕经平简历:2002年7月于中国科学院计算所获得博士学位&#xff0c;同年9月被破格提拔为计算所副研究员&#xff0c;2008年3月被任命为博士生导师&#xff0c;2009年1月获得卢嘉锡青年人才奖作者佚名次阅读2014-05-15代表论著:1)…

bash: 未预期的符号 `( 附近有语法错误_安规群中关于泄漏电流测试、接地符号等相关的6个问题,快来围观大神的回答吧!...

【本文属"世界认证地图"原创&#xff0c;未经允许&#xff0c;请勿转载哦~~~】问题一群员提问&#xff1a;接地这样符合GB4706.1-2005的标准要求吗&#xff1f;图片由群友提供群友解答&#xff1a;接地符号标错地方&#xff0c;应该如下图图片由群友提供专家解答&…

多项“首次”落地 腾讯云数据库助力金融机构国产化

日前&#xff0c;IDC发布了《2021年上半年中国关系型数据库软件市场跟踪报告》&#xff0c;数据显示&#xff0c;我国关系型数据库市场规模迅速增长。2021上半年&#xff0c;中国关系型数据库软件市场规模为11.9亿美元&#xff0c;整体市场同比增长37.2%。IDC预测&#xff0c;2…

庖丁解牛-图解MySQL 8.0优化器查询转换篇

简介&#xff1a; 在《庖丁解牛-图解MySQL 8.0优化器查询解析篇》一文中我们重点介绍了MySQL最新版本8.0.25关于SQL基本元素表、列、函数、聚合、分组、排序等元素的解析、设置和转换过程&#xff0c;本篇我们继续来介绍更为复杂的子查询、分区表和JOIN的复杂转换过程。 作者 |…

hivesql修改字段类型_Hive SQL语法总结

Hive是一个数据仓库基础的应用工具&#xff0c;在Hadoop中用来处理结构化数据&#xff0c;它架构在Hadoop之上&#xff0c;通过SQL来对数据进行操作&#xff0c;了解SQL的人&#xff0c;学起来毫不费力。Hive 查询操作过程严格遵守Hadoop MapReduce 的作业执行模型&#xff0c;…

Cube 技术解读 | 支付宝新一代动态化技术架构与选型综述

简介&#xff1a; 支付宝客户端的动态化技术经历三个阶段&#xff1a;现阶段也就是第三阶段是实体组件部分光栅化的hybrid模式&#xff0c;Cube 就是该模式下的产物。 如标题所述&#xff0c;笔者将持续更新《Cube 技术解读》系列文章。本文为Cube系列首篇文章&#xff0c;后续…

阿里云数字巡展:“云上峰会”背后的秘密武器

简介&#xff1a; 近日&#xff0c;阿里云官网上线了叫做“数字巡展”的新产品&#xff0c;专为各行业在数字化创新提供解决方案。数字巡展&#xff0c;立足于设计创新&#xff0c;融合定制化虚拟空间、沉浸化技术体验、数字化企业营销三大核心能力&#xff0c;通过创意和技术优…