InfiniBand网络-赋能高性能计算的卓越引擎

 b095beb833dab8d414dc18e326c702b5.jpeg

InfiniBand:赋能高性能计算网络的卓越引擎

   

0916a8743dec294e1b7e2ebb2e66eee3.jpeg


InfiniBand作为一种先进的内网计算平台,已成为驱动高性能计算(HPC)、人工智能(AI)以及超大规模云基础设施演进的核心力量,其展现出无可比拟的性能优势。专为满足服务器级连接需求而设计,InfiniBand在服务器间的高速通信、存储设备与网络设施之间的高效互联中扮演着至关重要的角色。这一技术凭借其卓越性能和可靠表现,不仅被InfiniBand行业协会广泛接纳并积极推广,更是在全球超级计算机500强榜单(TOP500 list)中占据了主导地位,成为首选互连解决方案。

在TOP500系统排名中,高达44.4%的系统选择InfiniBand作为核心互连技术,显著领先于以太网的40.4%。接下来,我们将深度探讨InfiniBand与以太网的差异性及其在高性能网络环境中的独特价值。

AI算力研究:英伟达B200再创算力奇迹,液冷、光模块持续革新


InfiniBand与以太网的对比分析

InfiniBand技术概述

InfiniBand,作为由IBTA制定的通信规范标准,致力于打造适用于数据中心服务器、通讯基础设施、存储解决方案及嵌入式系统间互连的交换体系。其对标准化的高度重视,确保了在高性能计算网络环境中,各组件能实现无缝集成和高效信息传输,从而提升整体性能。

InfiniBand凭借其显著的高带宽及低延迟特性而闻名遐迩,目前支持诸如FDR 56Gbps、EDR 100Gbps、HDR 200Gbps乃至NDR 400Gbps/800Gbps(通过4x链路宽度连接时的数据传输速率),并有望在未来进一步提升速度阈值。此外,InfiniBand具备出色的可扩展性,可在单个子网内轻松支持数万个节点,因此成为高性能计算(HPC)环境的理想选择。

同时,借助服务质量(QoS)和故障转移功能,InfiniBand成为了非易失性内存快速结构化接口(NVMe-oF)存储协议以及包括以太网、光纤通道(FC)和TCP/IP在内的多种网络架构中的关键组件。对于追求卓越性能与极致扩展性的数据中心而言,采用InfiniBand无疑是明智之举。

以太网技术概述

源自施乐公司、英特尔公司和DEC共同构思的以太网标准,已经成为全球范围内使用最为广泛的局域网(LAN)数据传输通信协议。自20世纪70年代起,以太网作为一种有线通信技术被开创出来,用于连接各种局域网(LAN)或广域网(WAN)内的设备。得益于其极高的适应性,无论是打印机还是笔记本电脑等不同类型的设备都能够通过以太网实现相互连接,应用场景广泛覆盖建筑楼宇、居民住宅乃至小型社区。用户友好的配置方式使得只需通过路由器和以太网连线即可简便构建LAN网络,进而整合各类如交换机、路由器和个人计算机等设备。

尽管无线网络在众多场合得到广泛应用,但以太网凭借其卓越的稳定性和抗干扰能力,仍在有线网络领域占据主导地位。经过多年的发展和改进,以太网不断提升和完善自身功能。目前,IEEE旗下802.3标准组织已发布了100GE、200GE、400GE和800GE等多个以太网接口标准,这充分展示了业界对以太网技术的持续推动和优化的决心与努力。

InfiniBand与以太网在高性能网络环境中的对比分析

InfiniBand技术,最初为解决高性能计算环境中的数据传输瓶颈而生。如今,它已发展为一种广泛应用的互连标准,完美适应现代多样化需求。与以太网相比,InfiniBand在带宽、延迟、网络可靠性及架构等方面具有显著优势。

网络带宽

InfiniBand的飞速发展,尤其在优化高性能计算和减轻CPU负担方面表现突出。相较之下,以太网尽管在终端设备连接中被广泛使用,但在应对高带宽需求时,其迫切性并不如InfiniBand显著。

网络延迟性

InfiniBand运用Cut-Through交换技术,将数据传输延时压缩至100纳秒以下,显著加速网络响应。相较之下,以太网由于在交换机中加入IP、MPLS、QinQ等服务,增加了处理环节,致使转发延时相对较高。

网络可靠性

InfiniBand,凭借其第1层至第4层的明确协议设计及端到端流控制机制,确保了无损网络通信,为高性能计算领域带来卓越的可靠性。相较之下,以太网缺乏此类基于调度的流控制机制,依赖更大的芯片缓存区暂存消息,不仅成本上升,还加剧功耗。

网络管理

InfiniBand借鉴了软件定义网络(SDN)理念,使其网络架构更为简洁高效。每个第二层网络内部都配备了一个子网管理器,用于配置节点并智能计算转发路径信息。与此相反,以太网需要依赖MAC地址条目、IP协议以及ARP协议等多个层次实现网络互联,从而增加了网络管理的复杂性。此外,以太网依靠定期发送更新包来维护路由表,并通过VLAN机制划分虚拟网络边界,限制网络规模;然而这种机制可能导致环路等问题出现,因此通常还需要STP等额外协议来进行环路避免。

深入解析InfiniBand产品系列

InfiniBand 交换机和光纤网卡

对比分析表明,相较于以太网,InfiniBand网络在高性能计算领域展现出了无可比拟的优势。对于计划在高级数据中心部署InfiniBand交换机的用户而言,有必要深入了解其详细性能特点和迭代历程。

历经多年快速发展,InfiniBand标准已从最初的SDR 10Gbps、DDR 20Gbps、QDR 40Gbps,逐步演进到FDR 56Gbps、EDR 100Gbps,并进一步发展为HDR 200Gbps及NDR 400Gbps/800Gbps等更高速率规格,这些重大突破得益于RDMA(远程直接内存访问)技术的集成应用。

bd4b06cc5f6d7059208f87aba8e0d706.jpeg

飞速(FS)为此提供了一系列先进InfiniBand解决方案,其中包括NVIDIA Quantum™-2 NDR InfiniBand 400G数据中心交换机以及NVIDIA Quantum™ HDR InfiniBand 200G数据中心交换机,这两款产品均支持管理型和非管理型两种配置模式,以满足不同客户对灵活性的需求。此外,为了确保全方位服务支持,针对400G交换机,飞速(FS)还提供了为期一年、三年或五年的服务选项,旨在帮助用户实现高效稳定的数据中心运行环境。

05871feaf972a6162b0a3cf0ceba754b.jpeg

InfiniBand光模块

40b3b94e4232a58ab50fd784c582ba68.jpeg

InfiniBand DAC高速线缆

293f4a9983b67ee7b86e085c0488da47.jpeg

InfiniBand AOC有源光缆

7775be78428a9bfbdd989ac7a689834d.jpeg

InfiniBand技术标准概览及优势分析

InfiniBand NDR(下一代数据速率)

InfiniBand NDR系列,包含400Gbase/800Gbase传输速率的光收发器与DAC,专为Mellanox NDR 400Gb交换机如MQM9700/MQM9790系列打造。在GPU加速计算环境下,这些组件能提供卓越的性能连接,并有潜力节省高达50%的成本。它们尤其适合高性能计算(HPC)、云计算、模型渲染以及基于InfiniBand 400Gb/800Gb网络的存储应用。

InfiniBand HDR(高数据速率)

飞速(FS)推出的InfiniBand HDR产品线涵盖了多样化的高速互联产品,例如200Gb/s和400Gb/s QSFP56 IB HDR多模光纤(MMF)有源/无源光缆(AOC)、有源/无源直连铜缆(DAC)、光学收发器路由器以及200G交换机等。这些模块和电缆能够无缝衔接MQM8700/MQM8790等交换机与NVIDIA GPU(如A100/H100/A30)和CPU服务器,以及ConnectX-5/6/7 VPI等存储网络适配器。此类解决方案不仅可实现最高达50%的成本节约,而且在涉及GPU加速的高性能计算(HPC)集群应用——包括模型渲染、人工智能(AI)、深度学习(DL)以及InfiniBand HDR环境下的NVIDIA应用网络通信时表现出卓越性能。

InfiniBand EDR(增强数据速率)

InfiniBand EDR系列为您呈现100Gbase QSFP28 EDR AOC、EDR DAC、AOC及光收发器,专为GPU加速计算量身定制。高效经济且性能卓越,满足您的多元需求。让我们共同探索无限可能,开启智能互联新篇章。

InfiniBand FDR(十四倍数据速率)

InfiniBand FDR系列涵盖40Gbase QSFP+ FDR10 AOC、DAC及光模块,以及56Gbase QSFP+ FDR DAC和AOC。所有产品皆可与Mellanox EDR交换机完美融合,实现无缝连接。

InfiniBand在网络高效能计算中的显著优势

随着数据通信、互联网技术和可视化展示需求不断提升,计算能力、存储容量和网络效率的需求也日益增长。在此背景下,InfiniBand网络凭借其高带宽服务、低延迟特性以及将协议处理和数据移动从CPU转移到互连层以降低计算资源消耗的独特优势,成为高性能计算数据中心的理想选择。此技术已广泛应用于Web 2.0、云计算、大数据处理、金融服务、虚拟化数据中心和存储应用等领域,实现了显著的性能提升效果。

在速度领域,InfiniBand已超越100G以太网的界限。其支持从100G/200G到400G/800G的灵活InfiniBand交换机配置,完美满足HPC架构对高性能的需求。通过高带宽、高速率和低延迟的协同作用,InfiniBand交换机显著提升了服务器性能和应用运行效率。

InfiniBand拥有卓越的扩展性,能在网络层2上支持高达48,000个节点。与以太网相比,其降低了对ARP广播机制的依赖,有效避免了广播风暴并减少额外带宽浪费。更值得一提的是,多个子网能灵活地与交换机关联,从而进一步提升网络的灵活性。

飞速(FS)深知高性能计算的关键性,因此推出了一系列基于Quantum InfiniBand交换设备构建的InfiniBand产品。这些产品支持高达16Tb/s的无阻带宽,且端口间延迟低于130ns,确保HPC数据中心的高可用性和多服务支持。尽管以太网网络通过跨设备分配工作负载仍具有高效的数据传输能力,但FS还提供一系列多速率以太网交换机,协助客户打造灵活且高效的网络环境。

选择合适的网络

在挑选网络技术时,InfiniBand和以太网各有千秋,各擅胜场。若着眼于显著提升数据传输速度、优化网络资源利用效率,以及有效降低CPU在网络数据处理上的负担,InfiniBand网络凭借其核心技术优势,在高性能计算领域独树一帜,成为关键的解决方案。

在数据中心环境中,如果通信延迟并非关键,且更看重网络的灵活性和扩展性,那么以太网网络将提供一种稳定且高度适应的基础设施支持。

InfiniBand网络,凭借其卓越的性能和创新的架构设计,为HPC数据中心用户开启了前所未有的业务效能优化新篇章。它消除了多层级结构带来的延迟问题,确保关键计算节点能无缝升级接入带宽,从而在提升整体运营效率上发挥了决定性作用。随着其应用范围的持续扩大和技术认可度的不断提升,我们预期,未来的InfiniBand网络将在更多复杂且要求严苛的应用场景中,得到广泛应用和部署。

 

-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/48477.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

bs4模块使用(二)

遍历文档树 怎样从文档的一段内容找到另一段内容? html_doc """ <html><head><title>The Dormouses story</title></head><body> <p class"title"><b>The Dormouses story</b></p>&…

基于SpringBoot+Vue的财务管理系统(带1w+文档)

基于SpringBootVue的财务管理系统(带1w文档) 基于SpringBootVue的财务管理系统(带1w文档) 财务管理系统的开发运用java技术、springboot框架&#xff0c;MIS的总体思想&#xff0c;以及Mysql等技术的支持下共同完成了该系统的开发&#xff0c;实现了财务管理的信息化&#xff0…

ReLU-KAN:仅需要矩阵加法、点乘和ReLU*的新型Kolmogorov-Arnold网络

摘要 由于基函数&#xff08;B样条&#xff09;计算的复杂性&#xff0c;Kolmogorov-Arnold网络&#xff08;KAN&#xff09;在GPU上的并行计算能力受到限制。本文提出了一种新的ReLU-KAN实现方法&#xff0c;该方法继承了KAN的核心思想。通过采用ReLU&#xff08;修正线性单元…

运维团队如何高效监控容器化环境中的PID及其他关键指标

随着云计算和容器化技术的快速发展&#xff0c;越来越多的企业开始采用容器化技术来部署和管理应用程序。然而&#xff0c;容器化环境的复杂性和动态性给运维团队带来了前所未有的挑战。本文将从PID&#xff08;进程标识符&#xff09;监控入手&#xff0c;探讨运维团队如何高效…

【网络】socket和udp协议

socket 一、六个背景知识1、Q1&#xff1a;在进行网络通信时&#xff0c;是不是两台机器在进行通信&#xff1f;2、端口号3、端口号vs进程PID4、目的端口怎么跟客户端绑定的呢&#xff1f;也就是怎么通过目的端口去找到对应的进程的呢&#xff1f;5、我们的客户端&#xff0c;怎…

区间加减使得数组变成指定类型

这个问题要怎么去考虑呢&#xff0c;首先我们将两个数组做差得到相对大小&#xff0c;问题就变成了把我们构造的数组通过区间加一或者区间减一变成全部都是0的最小次数 这里就涉及到我们的一个技巧&#xff0c;我们需要把负数序列和正数序列分开处理&#xff0c;如何能得到最小…

【C++】一、Visual Studio 2017使用教程:内存窗口、预处理文件、obj文件,调试优化

文章目录 概述编译期&#xff08;Compile&#xff09;查看预处理后的文件查看obj文件开启编译器调试优化 链接期&#xff08;Linking&#xff09;报错信息概述自定义入口点 调试内存窗口值转16进制查看查看汇编代码 注意 概述 记录一下Cherno的vs配置下载地址 https://thecher…

Unity 调试死循环程序

如果游戏出现死循环如何调试呢。 测试脚本 我们来做一个测试。 首先写一个死循环代码&#xff1a; using System.Collections; using System.Collections.Generic; using UnityEngine;public class dead : MonoBehaviour {void Start(){while (true){int a 1;}}}Unity对象设…

Qt 4.8.7 + MSVC 中文乱码问题深入分析

此问题很常见&#xff0c;然而网上关于此问题的分析大多不够深刻&#xff0c;甚至有错误&#xff1b;加之Qt5又更改了一些编码策略&#xff0c;而很多文章并未提及版本问题&#xff0c;或是就算提了&#xff0c;读者也不重视。这些因素很容易让读者产生误导。今日我彻底研究透了…

html5——CSS背景属性设置

目录 背景颜色 background-color 背景图像 背景定位 背景样式简写 背景尺寸 ​编辑渐变属性 背景颜色 background-color 背景图像 background-image background-image:url(图片路径); 背景重复方式&#xff1a; background-repeat 属性&#xff1a; repeat&#…

Qt中在pro中实现一些宏定义

在pro文件中利用 DEFINES 定义一些宏定义供工程整体使用。&#xff08;和在cpp/h文件文件中定义使用有点类似&#xff09;可以利用pro的中的宏定义实现一些全局的判断 pro中实现 #自定义一个变量 DEFINES "PI\"3.1415926\"" #自定义宏 DEFINES "T…

Apache Flink 任务提交模式

Flink 任务提交模式 Flink可以基于多种模式部署&#xff1a;基于Standalone 部署模式&#xff0c;基于Yarn部署模式&#xff0c;基于Kubernetes部署模式以上不同集群部署模式下提交Flink任务会涉及申请资源&#xff0c;各角色交互过程&#xff0c;不同模式申请资源涉及到的角色…

2024信息创新与安全技术比赛规程及任务书

2024信息创新与安全技术比赛规程任务书 模块一&#xff1a;信创操作系统应用任务一&#xff1a;系统安装任务二&#xff1a;系统基本操作&#xff0c;以下操作都在Client-1进行。任务三&#xff1a;软件管理 模块二&#xff1a;办公软件技术应用任务一&#xff1a;文档编辑任务…

【栈和队列】算法题 ---- 力扣

通过前面栈和队列的学习&#xff0c;现在来看这些算法题目 一、有效的括号 本题让判断括号是否有效 第一眼看可能没一点思路&#xff0c;但仔细分析一下&#xff1b; 我们学习过栈数据结构&#xff0c;知道栈先进后出的原则&#xff0c;那我们就可以使用啊&#xff1b;把题目的…

MaxSite CMS v180 文件上传漏洞(CVE-2022-25411)

前言 CVE-2022-25411 是一个影响 Maxsite CMS v180 的远程代码执行漏洞。攻击者可以通过上传一个特制的 PHP 文件来利用这个漏洞&#xff0c;从而在受影响的系统上执行任意代码。 漏洞描述 该漏洞存在于 Maxsite CMS v180 的文件上传功能中。漏洞利用主要通过允许上传带有危…

嵌入式人工智能(10-基于树莓派4B的DS1302实时时钟RTC)

1、实时时钟&#xff08;Real Time Clock&#xff09; RTC&#xff0c;全称为实时时钟&#xff08;Real Time Clock&#xff09;&#xff0c;是一种能够提供实时时间信息的电子设备。RTC通常包括一个计时器和一个能够记录日期和时间的电池。它可以独立于主控芯片工作&#xff…

C语言函数:编程世界的魔法钥匙(2)-学习笔记

引言 注&#xff1a;由于这部分内容比较抽象&#xff0c;而小编我又是一个刚刚进入编程世界的计算机小白&#xff0c;所以我的介绍可能会有点让人啼笑皆非。希望大家多多包涵&#xff01;万分感谢&#xff01;待到小编我学有所成&#xff0c;一定会把这块知识点重新介绍一遍&a…

[Day 32] 區塊鏈與人工智能的聯動應用:理論、技術與實踐

AI中的神經網絡技術 神經網絡&#xff08;Neural Networks&#xff09;是人工智能&#xff08;AI&#xff09;領域的一個重要分支&#xff0c;靈感來自於生物神經系統。本文將深入探討神經網絡的基本概念、結構、工作原理及其在AI中的應用&#xff0c;並通過Python代碼詳細解釋…

HarmonyOS Web组件(二)

1. HarmonyOS Web组件 官方文档 1.1. 混合开发的背景和好处 混合开发&#xff08;Hybrid Development&#xff09;是一种结合原生应用和Web应用的开发模式&#xff0c;旨在同时利用两者的优势。随着移动应用需求的多样化和复杂化&#xff0c;单一的开发方式往往难以满足所有…

sass版本更新,不推荐使用嵌套规则后的声明

目前在 Sass 中不推荐使用嵌套规则后的声明&#xff0c;在 为了通知用户即将进行的更改&#xff0c;并给他们时间进行更改 与之兼容的样式表。在未来的版本中&#xff0c;Dart Sass 将更改为 匹配纯 CSS 嵌套生成的顺序。Deprecation Warning: Sasss behavior for declarations…