HPC 集群计算类型的注意事项

HPC 集群计算类型的注意事项

HPC 工作负载在 CPU ,内存,网络和存储资源需求方面有不同的要求。

您可以从以下内容开始:

  • 核心计数
  • 每个核心的内存
  • 网络带宽和等待时间
  • 处理器时钟速度

目标是选取返回最佳性价比的计算配置。 HPC 工作负载可以与单个核心作业一样简单,也可以与需要数百到数千个核心的作业一样复杂。 HPC 聚集了计算能力 (集群) ,可以提供更高的性能并解决大问题。

大多数 HPC 工作负载都低于 1000 个核心范围。 有些工作负载需要大量核心,直至 (包括) 10k-50k。 HPC 工作负载的执行时间可能很简单,仅持续几秒,也可能很复杂,需要几天时间。

例如, EDA (电子设计模拟) 工作负载具有组件级别的模拟作业,这些作业每天需要运行数百万个此类作业,但每个作业需要单个核心和大约 10 秒。 其他如光学近距离校正可能需要多个小时甚至几天,具体取决于芯片的大小和 HPC 集群的大小。

通常, HPC 集群包含一组虚拟机,并使用该集群来运行多个工作负载。 这一切都取决于工作负载资源需求和持续时间。

为了解决此范围的特征, IBM Cloud® 以不同方式提供各种 VPC 虚拟机 (VM) 配置:

  • 均衡配置,可提供每个核心的平均 4 GB 内存,并且在网络带宽中的范围为 4-64 Gbps
  • 计算密集型配置,可提供每个核心的 2 GB内存和 4-80 Gbps 网络
  • 内存密集型配置,可提供 8-每个核心 28 GB 内存和 2-80 Gbps 网络

对于所有配置,每个虚拟机的核心计数范围为 2-128。 有一种特殊的超高内存虚拟机类型,可能适用于每个核心需要更多内存的工作负载。 此类型最多可以达到 200 个核心,每个核心可高达 28 GB。

单个 NIC 上的网络带宽可以达到最大 16 Gbps。 如果需要更高的带宽,那么可能需要更多高达 80 Gbps 的 NIC 配置。 在这些情况下,需要为虚拟机配置 5 个 NIC。

缺省情况下,将在 IBM Cloud 虚拟机上启用超线程技术,因此每个物理核心都将获得 2 vCPUs 。 但这很容易被禁用。

请注意:大多数 HPC 应用程序的性能最佳,每个物理核心有一个进程或线程。

对于可以适合单个虚拟机上的通信密集型工作负载,最好选择最佳匹配项,最多可使用 128 个核心虚拟机实例,而不是在多个虚拟机实例之间拆分具有较小核心计数的工作负载。 这使进程能够利用通过单个虚拟机上的共享内存进行的更快通信,而不是通过以太网网络跨多个虚拟机进行的通信。

从角度来看,在同一虚拟机上运行的两个进程可能能够以微秒 (例如, 0.3 微秒) 的一小部分进行通信,而在两个虚拟机实例中,可能需要 30 微秒以上的时间。 通过单个虚拟机中的共享内存时,通信速度提高 100 倍。

非常经济有效的配置是 cx2-128x256,它允许每个核心 128 个核心和 2 GB 内存。 这可以涵盖广泛的 MPI 工作负载。

请注意:可以设置可扩展的 MPI 作业,这些作业需要配置为最多 80 Gbps 的多个虚拟机,但这需要多个 NIC ,并且可能不需要这些 NIC。 建议选择一个配置,通过单个 NIC 为每个核心提供最佳网络带宽。 bx2-16x64 可能是 MPI 基准测试的良好起点。

特定工作负载的基准评测

电子设计自动化 (EDA)

IBM Systems 和 IBM Research 在此行业领域开展工作,并已成功将 IBM Cloud 用于此类工作负载。 下图显示了最多 30 K 个核心的刻度测试。 为了展示如何将云区域用作单个数据中心,我们构建了一个大型 HPC 集群,用于聚集三个 IBM Cloud 位置的资源。 安装还将 IBM Spectrum Scale 用作基于临时的高性能文件系统以及 IBM Spectrum LSF 用于 HPC 集群配置。 我们已将 BX2-48x192 用于 IBM Spectrum LSF 工作程序节点,并将 MX2d-16x128 用于 IBM Spectrum Scale下的存储节点。

缩放

天气 (WRF 模型)

IBM Cloud 显示线性性能,性能良好,可扩展为数千个核心。 用于此基准的虚拟机配置为 bx2-16x64。 WRF 模型对网络等待时间不敏感,因为它将许多变量打包到每条消息中,从而产生相当大的消息,而没有多少小的消息。

在这里插入图片描述

红线表示具有 InfiniBand HDR 的 HPC 环境,提供最高带宽,最短等待时间,并且是此类工作负载的最佳配置。 绿色线条显示 IBM Cloud 以及用于基准测试的 Lon2 数据中心。 蓝线是 Summit 超级计算机。 总之,具有类似于 WRF 模型的特征的任何工作负载都应该使用 IBM Cloud进行扩展。 如您所见, IBM Cloud 显示了针对最先进的 HPC 系统的合理性能。

DoE (能源部) 基准评测

SNAP 和 Quicksilver 是 DoE 用于对特定商品技术系统进行基准测试和决策的两个应用程序。

下图显示了 IBM Cloud 如何与最先进的 HPC 系统进行比较的结果。

在 IBM Cloud上,基准程序使用了两种不同的配置:

  • bx2-8x32
  • bx2-16x64

如您所见, SNAP 结果显示 bx2-8x32 提供了更高的性能,因为每个核心的有效网络带宽比率更高; 其中 Quicksilver 与 bx2-16x64 表现良好,因为它具有中等的通信需求,并且大多是在全局域中跟踪粒子运动的近邻节点。

在这里插入图片描述
在这里插入图片描述

尽管缩放效果不如天气模型,但 IBM Cloud 可以使用线性曲线合理缩放多达数千个核心。

虚拟机用例

IBM Cloud 的虚拟机概要文件类型选项取决于有关核心,内存和网络需求的工作负载详细信息。

单节点虚拟机用例

这应该是第一次评估,因为它可以提供在 IBM Cloud上运行此类作业的最佳价格和性能。

您可以从以下一组虚拟机概要文件中进行选择:

  • CX2-16x32 到 CX2-128x256
  • BX2-16x64 到 BX2-128x512
  • MX2-16x128 到 MX2-128x1024

根据每个核心所需的内存,您可以选择 MX2 配置,该配置在 MX2-128x1024 概要文件上最多支持 1 TB。

如果每个核心所需的内存低于 2 GB ,那么相应的 CX2 概要文件可能会为您提供最佳的价格和性能。 如果工作负载可以在单个虚拟机上运行,那么与共享内存进行更快通信的优点有助于提高性能。

此类工作负载的一些示例:

  • 局部地区天气预报,分辨率不高,模型大但规模不大
  • OpenFOAM 计算流体动力学, 2 百万到 1000 万个网格单元之间问题的大小
  • 电子设计自动化 (EDA) 中的设计规则检查 (DRC) 作为芯片设计的一部分
  • EDA 单组件模拟和验证作业

使用多个虚拟机向外扩展用例

这是第二类工作负载,其中要求具有多个要执行的虚拟机。 甚至对于此类别,根据网络带宽和等待时间需求,大量 HPC 工作负载将在 IBM Cloud上扩展。

在某些情况下,可能需要对应用程序代码进行小型更新以将其调整好,以便在类似云的环境中运行,并且这些更改并非特定于 IBM Cloud ,而是希望向任何云提供者分类群发。

IBM 具有深厚的 HPC 专业知识,可提供特定建议,帮助您获得 HPC 云环境的最佳性价比。

IBM Cloud 已在以下示例中成功:

  • EDA 中的光学近似值校正 (OPC)
  • EDA 中的全芯片集成电路验证器 (ICV)
  • 任何 Hadoop 映射/减少或 Spark 工作负载
  • 无法在单个虚拟机上运行的 MPI 工作负载

此类工作负载的建议是从 BX2-16x64 开始,因为它在迄今为止的测试中提供了最佳性能。 根据您的结果,您可以深入了解可能更适合特定工作负载的替代选项。 某些工作负载可能具有网络等待时间敏感性,并且 IBM Cloud 配置可能没有前景; 但是,即使在这些情况下,请与产品所有者和销售团队进行互动,以便 HPC 专家可以评估您的特定需求并提供帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/160031.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Centos8上部署MySQL主从备份

虚拟机环境如下: Node1192.168.1.110Centos8 Node2192.168.1.111Centos8 1.在Node1和Node2上安装数据库; yum install -y mysql* 2.关闭防火墙服务,关闭开启自启; systemctl stop firewalld systemctl disable firewall…

2022年06月 Scratch(二级)真题解析#中国电子学会#全国青少年软件编程等级考试

Scratch等级考试(1~4级)全部真题・点这里 一、单选题(共25题,每题2分,共50分) 第1题 角色初始位置如图所示,下面哪个选项能让角色移到舞台的左下角? A: B: C: D: </

VirtualBox配置共享文件夹,如果你一直安装增强功能失败,又没有尝试过改内核版本。。。

1 背景 想设置电脑本地和virtualbox虚拟机之间的共享文件夹&#xff0c;这样在电脑本地对共享文件的修改&#xff0c;就可以在虚拟机中被感知。 如果想配置共享文件夹&#xff0c;前提是必须安装virtualbox的增强功能。 我的虚拟机是7.0.10版本 安装的centOS8.5 可以看我之前的…

内网穿透隐秘隧道搭建

别低头&#xff0c;皇冠会掉&#xff1b;别流泪&#xff0c;贱人会笑。 本文首发于先知社区&#xff0c;原创作者即是本人 0x00 前言 构建内网隐蔽通道&#xff0c;从而突破各种安全策略限制&#xff0c;实现对目标服务器的完美控制。 当我们从外网成功获得攻击点的时候&…

计算机基础知识56

choices参数的使用 # 应用场景&#xff1a; 学历&#xff1a;小学、初中、高中、本科、硕士、博士、1 2 3 4 5 6 客户来源: 微信渠道、广告、介绍、QQ、等等 性别&#xff1a;男、女、未知 # 对于以上可能被我们列举完的字段我们一般都是选择使用…

HubSpot驱动业务增长:客户拓展的完美引擎!

随着数字化时代的来临&#xff0c;企业面临着前所未有的挑战&#xff0c;尤其在拓展客户方面&#xff0c;传统的方法已经难以适应新的市场环境。在这个背景下&#xff0c;数字化时代的客户拓展变得更为复杂&#xff0c;企业需要更智能、更综合的解决方案来脱颖而出。 HubSpot作…

虚拟机VMware+Ubuntu系统的自定义安装教程(详细图文教程)

VMware可以帮助你在一个操作系统的环境下安装和运行另一个操作系统&#xff0c;从而提高IT效率&#xff0c;降低运维成本&#xff0c;加快工作负载部署速度&#xff0c;提高应用性能&#xff0c;提高服务器可用性&#xff0c;消除服务器数量剧增情况和复杂性。 目录 一、VMwar…

virtualbox 扩展磁盘后在win10 虚拟机看不到新扩展的空间

造成标题中问题的原因是&#xff0c;扩展的是win10.vdi 的空间&#xff0c;虚拟机使用使用的下边那个以uuid命名的空间&#xff0c;将这个磁盘的虚拟分配空间也调整到150G . 然后在win10的磁盘管理里就可以看到新加的空间了。之后再点相应的盘进行扩展卷操作即可。

SUDS: Scalable Urban Dynamic Scenes

SUDS: Scalable Urban Dynamic Scenes&#xff1a;可扩展的城市动态场景 创新点 1.将场景分解为三个单独的哈希表数据结构&#xff0c;以高效地编码静态、动态和远场辐射场 2.利用无标签的目标信号&#xff0c;包括RGB图像、稀疏LiDAR、现成的自监督2D描述符&#xff0c;以及…

【django+vue】连接数据库、登录功能

笔记为自我总结整理的学习笔记&#xff0c;若有错误欢迎指出哟~ 【djangovue专栏】 1.【djangovue】项目搭建、解决跨域访问 【djangovue】连接数据库、登录功能 django连接数据库1.安装MySQL驱动程序2.创建数据库3.配置settings.py文件4.创建表5.添加数据 登录功能1.django实现…

编译QT Mysql库并集成使用

安装MSVC编译器与Windows 10 SDK 打开Visual Studio Installer&#xff0c;如果已经安装过内容了可能是如下页面&#xff0c;点击修改&#xff08;头一回打开的话不需要这一步&#xff09;&#xff1a; 然后在工作负荷中勾选使用C的桌面开发&#xff0c;它会帮我们勾选好一些…

什么?Postman也能测WebSocket接口了?

01 WebSocket 简介 WebSocket是一种在单个TCP连接上进行全双工通信的协议。 WebSocket使得客户端和服务器之间的数据交换变得更加简单&#xff0c;允许服务端主动向客户端推送数据。在WebSocket API中&#xff0c;浏览器和服务器只需要完成一次握手&#xff0c;两者之间就直接…

成长在于积累——https 认证失败的学习与思考

1. 引言 本周二长城项目在收尾过程中&#xff0c;出现了一个车端无法进行注册的问题&#xff1a;curl提示证书认证失败&#xff08;其实已经能确认问题方向了&#xff0c;运维人员去确认证书问题即可&#xff09;。虽然最终的原因是由于长城运维人员导致的。但是这个过程让我颇…

opencv- CLAHE 有限对比适应性直方图均衡化

CLAHE&#xff08;Contrast Limited Adaptive Histogram Equalization&#xff09;是一种对比度有限的自适应直方图均衡化技术&#xff0c;它能够提高图像的对比度而又避免过度增强噪声。 在OpenCV中&#xff0c;cv2.createCLAHE() 函数用于创建CLAHE对象&#xff0c;然后可以…

宝宝照片保存大法!一键制作照片书

亲爱的家长们&#xff0c;你们是否为宝宝成长过程中的各种美好瞬间而感到兴奋和感动&#xff1f;宝宝的笑容、第一次学步、第一次叫妈妈爸爸……这些珍贵的瞬间&#xff0c;我们都想把它们永远保存下来。现在&#xff0c;我们有一款神奇的工具&#xff0c;一键制作照片书&#…

还不知道指针和引用的区别,一篇文章教会你

1、引用的概念 1.引用不是新定义一个变量&#xff0c;而是给已存在变量取了一个别名 2.编译器不会为引用变量开辟内存空间&#xff0c;它和它引用的变量共用同一块内存空间 比如:孙悟空&#xff0c;可以叫他孙悟空&#xff0c;也可以叫齐天大圣。本质他们就是一个人 2、引用的定…

【C++初阶】STL详解(五)List的介绍与使用

本专栏内容为&#xff1a;C学习专栏&#xff0c;分为初阶和进阶两部分。 通过本专栏的深入学习&#xff0c;你可以了解并掌握C。 &#x1f493;博主csdn个人主页&#xff1a;小小unicorn ⏩专栏分类&#xff1a;C &#x1f69a;代码仓库&#xff1a;小小unicorn的代码仓库&…

vs调试输出,不显示线程已退出

如题&#xff1a;一堆线程退出的信息&#xff0c;招人烦。 其实在vs设置里可以关闭&#xff1a; 工具-->选项-->调试-->输出窗口&#xff1a;

java--ArrayList快速入门

1.什么是集合&#xff1f; 集合是一个容器&#xff0c;用来装数据的&#xff0c;类似于数组。 2.有数组&#xff0c;为啥还学习集合 ①数组定义完成并启动后&#xff0c;长度是固定了。 ②集合大小可变&#xff0c;开发中用的更多。 3.ArrayList<E> 是用的最多、最…

LINUX入门篇【8】----计算机组成原理以及OS知识的总结

前言&#xff1a; 从而本篇文章开始&#xff0c;我们将进入LINUX的进程篇&#xff0c;但学习进程之前&#xff0c;我们首先需要重新认识我们的计算机&#xff0c;并且正确认识到控制进程的OS&#xff0c;即操作系统是怎样在计算机运行的过程中起到作用的。下面就让我们一同去了…