气象气候应用在Intel最新处理器Icelake上的性能测评

浪潮HPC实验室

一、Intel第三代至强可扩展处理器(Icelake)性能大升级

Intel于今年发布了第三代至强可扩展处理器系列产品(代号Ice Lake),与上一代至强可扩展处理器系列产品(代号Cascade Lake)相比,第三代至强可扩展处理器的改变是从里到外的,其主要升级点包括:

(1) 制造工艺从14nm升级到了10nm,理论晶体管密度提升了2.7倍;
(2) 微架构升级,IPC大幅提升20%;
(3) 最高核心数从之前的28核提升到了40核,AVX2/AVX512指令集持续优化,L3缓存也从每核1.375MB增加到了1.5MB;
(4) IO性能获得大幅提升,内存从6通道升级到了8通道,改善内存访问延迟。PCIE协议也从之前的PCIe 3.0升级到了PCIe 4.0。此外,UPI总线带宽也有小幅的提升。

这些硬件性能的提升是否也会对应用的性能起到正面的促进作用呢?特别是针对气象气候这类需要大量的CPU核做大规模并行计算才能完成任务的应用。我们知道,一般气象气候类应用的BF Ratio都比较高,即气象气候类应用的性能非常依赖于内存带宽,以及浮点计算能力。因此,对于气象气候领域的应用而言,第三代至强可扩展处理器这些升级无疑是让人充满惊喜和期待的,尤其是其AVX指令集的优化带来的浮点计算速度的提升和内存通道的增加带来的内存带宽的释放。那么第三代至强可扩展处理器对于气象气候应用的性能提升相对于Intel 之前的处理器到底怎么样呢?在此我们选取气象气候领域常用的几个天气预报和气候预报模式,包括WRF中尺度天气预报模式、MPAS-A跨尺度大气模式、CESM地球系统模式进行了评测分析。

在下面的测试对比中,我们针对不同的应用,在浪潮的HPC实验室里面构建了测试环境,计算节点分别使用了第二代至强可扩展处理器系列中的6230、6248、以及6258R等三款处理器;第三代至强可扩展处理器系列中的8358处理器,来做对比分析。

二、中尺度预报模式WRF性能对比

WRF简介
中尺度预报模式 WRF(Weather Research and Forecasting model)是由美国大气研究中心(NCAR)、美国大气海洋局(NOAA)和美国空间气象局(AFWA)等共同开发的。 WRF 模式可用于数值天气预报的研究与业务化、物理参数化方案研究、数据同化、驱动空气质量模式、中小尺度气候模拟以及海洋大气模式的耦合等。

WRF测试算例
表1给出了 WRF 算例的网格范围和计算规模。模拟区域为两层嵌套,空间分辨率分别为 12km 和 4km,水平方向格点数分别为 425300 和 1150802,时间步长为 30s 和 10s,垂直方向均为 35 层。预报时间为 3h。模式每 3h 输出一次数据。
在这里插入图片描述

WRF性能测试结果

我们分别在6230处理器平台和8358处理器平台上测试了WRF使用224核运行时的性能。WRF算例在6230处理器平台的运行时间为695 s,在8358处理器平台的运行时间为489 s,与6230处理器平台相比,WRF在8358处理器平台性能提升42%(图1)。这主要是因为WRF为计算密集型和内存带宽限制型应用,得益于第三代至强可扩展处理器架构的八内存通道设计,使内存带宽得以释放。此外浮点计算速度的增加以及低延迟的内存访问,使得在8358处理器平台上运行 WRF,性能会有很大的提升。
在这里插入图片描述
图1 6230处理器平台和8358处理器平台WRF性能对比

三、跨尺度预报模式MPAS-A性能对比

MPAS-A简介
MPASA (Model for Prediction Across ScalesAtmosphere)模式是由美国国家大气研究中心(NCAR)主导研发的全球非静力平衡的跨尺度预测模式。该模式采用非结构质心 Voronoi 多边形网格和 ArakawaC 离散化方案。非结构化网格避免了结构经纬度网格中两极的奇异点和极区网格过密的问题。另外, MPASA 可由低分辨率区域较为平滑地过渡到高分辨率区域,使得模拟关键区域有较高分辨率同时还避免了边界处物理量的突变。

MPAS-A测试算例
在我们的测试中,MPAS-A算例使用的是全球60 km分辨率网格(图2),积分步长为360 s,预报时间为2 h。
在这里插入图片描述
图2 MPAS-A非结构网格

MPAS-A性能测试结果

我们分别在6230处理器平台和8358处理器平台上测试了MPAS-A使用320核运行时的性能。MPAS-A算例在6230处理器平台运行时间为26.5 s,在8358处理器平台运行时间为15.5 s,与6230处理器平台相比,MPAS-A在8358处理器平台上的性能提升了71%(图3)。MPAS-A与WRF相似,也是内存带宽限制型应用。因此8358处理器内存通道的增加也有助于提升MPAS-A的性能。

图4为MPAS-A算例在6230处理器平台和8358处理器平台运行时单计算节点内的实时浮点计算速度和内存带宽对比。从图中可以看出,与在6230处理器平台相比,MPAS-A在8358处理器平台上的浮点计算速度和内存带宽都大幅提升,从而使得在8358处理器平台上的MPAS-A性能大幅提升。另外,从BF Ratio来看,在6230处理器平台MPAS-A的BF Ratio值约为2.55,而在8358处理器平台MPAS-A的BF Ratio值约为2.40。这与6230处理器平台相比BF Ratio值略有下降,其中的原因主要是与8358处理器平台每核心L3缓存增加从而降低了LLC miss率有关。
在这里插入图片描述
图3 6230处理器平台和8358处理器平台MPAS-A性能对比
在这里插入图片描述

图4 MPAS-A算例在6230处理器平台和8358处理器平台运行时单计算节点内的实时浮点计算速度和内存带宽对比

四、地球气候系统模式CESM性能对比

CESM简介
CESM由美国国家科学基金会和美国能源部支持开发,由国家大气研究中心的气候和全球动力实验室维护的一个气候系统模式。CESM由模拟地球大气,海洋,陆地,陆冰、海冰、径流和波浪7种子模块组成,中间通过一个耦合器连接,用来模拟地球的过去,现在和未来的气候状态。

CESM测试算例
在本次测试中,CESM所使用的算例为全耦合模式,网格是f19_g16,预报时间为1年。
在这里插入图片描述
CESM性能测试结果
我们选取第三代至强可扩展处理器8358,并在由其构建的HPC集群上对CESM进行了测试和优化。与第二代至强可扩展处理器系列相比,CESM在8358处理器平台上有了较大的性能提升。单节点性能提升分别为94.1%(6230处理器)、82.7%(6248处理器)和64.5%(6258R处理器)。这主要是因为CESM的BF Ratio接近1,内存带宽不受限制,且应用主要受限于IO和通信的影响,故性能提升不能达到理想的线性提升,会有一定的降低,但也可以达到82.7%(6248处理器)和94.1%(6230处理器)。
在这里插入图片描述
图5 不同处理器平台下的CESM性能对比

五、测评总结

结合Intel 今年新发布的第三代至强可扩展处理器(Icelake)的内存通道增加,以及AVX2/AVX512指令集的进一步优化等种种令人惊喜的升级,和气象气候领域应用高BF Ratio的特点,我们在第三代至强可扩展处理器8358构建的HPC集群上对几种常用气象气候应用包括WRF、MPAS-A、以及CESM进行了测试分析,并与Intel之前的第二代至强可扩展处理器进行了对比。从性能来看,使用相同核数时,与在Cascadelake 6230处理器平台相比,在Icelake 8358处理器平台WRF性能提升42%,MPAS-A性能提升71%。这主要是因为WRF为计算密集型和内存带宽限制型应用、MPAS-A为内存带宽限制型应用。正是得益于Icelake的八内存通道设计,使得内存带宽得以释放,此外浮点计算速度的提升以及低延迟的内存访问,促使在8358处理器平台上WRF和MPAS-A的性能都获得了大幅提升。而对于气候模式CESM,内存带宽不受限制,但同样得益于Icelake的内存带宽和浮点计算速度的大幅提升,性能更是分别提升了82.7%(6248处理器)和94.1%(6230处理器)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/514087.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

评审恩仇录——我为什么愿意执行代码评审

简介: 代码评审带来的好处不言自明, 但企业业务快速发展的诉求与代码评审推动落地两者之间, 往往存在矛盾。在如今快速发展的互联网时代,数字化、智能化已经是基础能力,单纯只靠人肉审查的时代已经过去了,基于各种自动化检查能力的…

AI+混合云模式,如何最大化挖掘数据价值?

9月8日,IBM举行了“科技一席谈”线上媒体访谈会,此次访谈以“数据与AI”为主题,由IBM 大中华区科技事业部、客户成功管理部总经理朱辉,IBM 中国混合云与 AI 华东及华南大区总经理许伟杰作主题分享。 在数字化转型的时代&#xff…

阿里云贾扬清:大数据和人工智能一体化是必然趋势

简介: 拥抱“融合”是大数据演进的新方向,⼤数据⼈⼯智能⼀体化是⼤数据发展的必然⽅向,而人工智能是⼤数据业务发展的终极出⼝ 。 12月13日,阿里云计算平台负责人贾扬清在Flink Forward Asia 2020 峰会上指出,拥抱“融…

云效安全那些事儿—访问控制与数据安全

简介: 云效 Codeup 提供了代码 GPG 签名,拒绝未签名的提交;支持代码属主验证,约束提交记录属主。 在质量管控上,云效 Codeup 精细化读写权限管控,支持代码提交卡点机制,保障提交质量。 接下来我…

深信服何朝曦:托管云为用户上云提供第三种选择

9月17日,以“万物皆可云”为主题的信服云创新峰会成功举办。会上,深信服科技股份有限公司CEO何朝曦分享了运用云计算技术帮助用户进行数字化转型的观点。他认为兼具公有云和私有云优势的托管云,可以帮助非科技型企业和中小企业获得“数字化平…

java 使用c .dll_Windows下java调用c的dll动态库--Dev_Cpp编译c生成dll

1.eclipse下建立一个HelloJNI.java内容如下:package JNI;public class HelloJNI{static{System.out.println("开始");System.loadLibrary("goodluck");System.out.println("结束");}public native static int get();public native st…

阿里云助力江苏省财政厅力推统一公共支付平台

简介: 为深化“放管服”改革,贯彻“互联网政务服务”要求,江苏省财政厅加快推进江苏省统一公共支付平台建设,实现全省政府非税收入、政务服务在线收缴和财政电子票据的集中统一处理,不仅节约了因“重复建设”产生的财政…

Midway Serverless 发布 2.0,一体化让前端研发再次提效

简介: 2021 年 3 月,Midway Serverless 推出了第二个大版本。就像两年前说的一样,开源只是开始,终态远没有到来。Midway 体系希望能够在当前的十字路口,不断向前演进,让前端可以去发展,朝着应用…

binaryviewer java_用java实现java的2进制文件字节序转换到C/C++的2进制文件字节序

展开全部package admit.action;/*用JAVA读取各种计算机文件系统的文件列表 当你安装了jdk,在32313133353236313431303231363533e78988e69d8331333332613732jdk的类库里,有一个标准的File类,通过该类,可以很方便的实现浏览各种文件…

ZDNS宣布完成B轮融资,根服务器之外,顶级域名系统迎重要机遇

从互联网诞生,由于IPv4技术中UDP报文数据容量限制,到2021的今天,全球也仅有13个根服务器(俗称“主根”),其中10个主根由美国持有,英国、瑞典、日本各持有1个。而中国只运营根镜像服务器。虽然目…

应用容灾中,MySQL数据表是否需要跨云同步?

简介: 容灾系统的重要目标在于保证系统数据和服务的“连续性”。当系统发生故障时,容灾系统能够快速恢复服务和保证数据的有效性。为了防止天灾人祸、不可抗力,在同城或异地建立对应的IT系统,其中最核心的工作是数据同步。本文选取…

java浮点数数转二进制的数吗_深入理解计算机系统(2.7)-二进制小数和IEEE浮点标准 - Java 技术驿站-Java 技术驿站...

整数的表示和运算我们已经讲完了,在实际应用中,整数能够解决我们大部分问题。但是某些需要精确表示的数,比如某件商品的价格,某两地之间的距离等等,我们如果用整数表示将会有很大的出入,这时候浮点数就产生…

Docker 终失 C 位,开源少年缘何黑化

作者 | 马超出品 | CSDN(ID:CSDNnews)开源真是火了,近些年成功的IT项目像TensorFlow、RocketMQ、TDEngine都是开源项目,而且这种火爆还出了圈,连带着RISC-V这种准开源的芯片也成为了各方争抢的香饽饽。但是…

中油即时通信电脑版_市场营销之即时通讯营销

✎IM营销又叫即时通讯营销(instantmessaging),是企业通过即时工具im推广产品和品牌,以实现目标客户挖掘和转化的网络营销方式。封面设计丨Sweety 责编丨花花第60篇丨每日一篇好文:2645字丨5分钟阅读即时通讯营销常用的主要有以下两种情况:第一…

java组合框的事件有哪些_博为峰Java技术文章 ——JavaSE Swing列表框选取事件的处理...

博为峰小博老师:在JList类中有addListSelectionListener()方法,可以检测用户是否对JList的选取有任何的改变。在ListSelectionListener接口中只定义一个方法,那就是valueChanged(ListSelectionEvente),所以必须实现这个方法&#…

使用 Arthas 排查 SpringBoot 诡异耗时的 Bug

简介: 公司有个渠道系统,专门对接三方渠道使用,没有什么业务逻辑,主要是转换报文和参数校验之类的工作,起着一个承上启下的作用。最近,在优化接口的响应时间,优化了代码之后,但是时间…

关于数据库,你可能最想知道的几件事

【CSDN 编者按】随着技术不断更新,数据库的发展可谓全面开花,也吸引了越来越多人的关注,但大家真的都足够了解数据库吗?作者 | 易璜珵 责编 | 侯淼淼出品 | 《新程序员》互联网飞速发展的时代里,数据库、中间件和…

java反编译工具_JDA Java反编译工具的下载和使用手册

JDA(javadecompile analysis)是一款以dex为核心的java反编译工具,同时支持apk、dex、jar文件的反编译,支持动态重命名。该软件主要是用来反编译分析代码而不是反编译出来完全正确的java代码,运行需安装jdk1.8及以上版本版本(jdk1.7应该也行)。…

OpenKruise v0.8.0 核心能力解读:管理 Sidecar 容器的利器

简介: OpenKruise 是阿里云开源的云原生应用自动化管理套件,也是当前托管在 Cloud Native Computing Foundation (CNCF) 下的 Sandbox 项目。它来自阿里巴巴多年来容器化、云原生的技术沉淀,是阿里内部生产环境大规模应用的基于 Kubernetes 之…

请把ios文件解压出来是什么意思_【张小亮】最新版本行会3。中文版本。解压即玩。...

电脑游戏目录【回复:电脑游戏】手机游戏目录【回复:手机游戏】【张小亮】最新版本行会3。中文版本。解压即玩。【名称】行会3【大小】4.12 GB【版本】v0.9.9【系统】电脑游戏【下载】本文中【往下滑】【安装】1。请下载【好压】这款解压软件进行解压。2。…