IB与以太之争
以太网替代IB趋势明显。据相关报告:2024年TOP500的超算中,采用以太网方案占比48.5%,InfiniBand占比为39.2%,其中排名前6的超算中已有5个使用以太网互联。
开放系统战胜封闭系统仅是时间问题。我们已经看到,以太网借助其与生俱来的开放性迅速弥合了与InfiniBand的差距,如采用RoCEv2技术路线的星融元CX732Q-N(400G)超低时延交换机,已在多次严格的现场测试中表现出与InfiniBand交换机相当的性能。
以太网走向800G时代
从GPT-1到GPT-4,模型参数数量已从1.1亿增长到5000亿,甚至可能超过万亿。
然而,在部署超算集群的算力中心,先进芯片和先进算力并不对等,算力芯片只提供算力,而先进算力其实遵循着“木桶效应”——算力、存储和网络三个核心环节,出现一个短板会使整个系统的性能出现巨大的下滑。正因如此,800G以太网的推出势在必行。
近年来IEEE(电气电子工程师协会)、OIF(光网络互联论坛)等标准组织相继制定了400G网络的标准,为800G网络的发展奠定了基础。
800G 以太网发展大事记
年份 | 主要事件 |
---|---|
2022 | 首款 51.2T 交换芯片发布;网络行业迎来了重要的里程碑。这些交换芯片将支持64个800Gb/s端口,标志着800G以太网发展进入实体化落地阶段。与此同时,首批800G光模块的验证也在此期间开始。 |
2023 | 标准发布和开发验证;IEEE发布了IEEE 802.3df标准的第一版,该标准定义了800G以太网的物理层规范。与此同时,OIF还发布了224 Gb/s标准,为800G和1.6T系统构建112 Gb/s和224 Gb/s通道提供了指导方针。 |
2024-2026 | 预计将确认800G以太网的物理层标准,进一步完善和测试规范,以确保网络设备的互操作性和高性能。 |
星融元超低时延800G以太网交换机
CX864E-N是一款行业顶尖规格的单芯片盒式以太网交换机,专为AI训练/推理、高性能计算(HPC)和云计算/存储的需求设计,具有业界领先的低延迟和高可靠性,是AI时代下智算中心的首选。它拥有 51.2T 的超大交换容量和 64x800G 的端口密度,可构建超大规模数据中心,并在更优的投入成本下提供与 InfiniBand 网络相当的端到端性能。
CX864E-N符合UEC(超以太网联盟)标准,具有丰富全面的 API,便于与数据中心和HPC集群的无缝集成,其作为厂商中立的网络设备亦可兼容其他主流厂商的GPU和网卡硬件。
亮点
- 单芯片51.2T 高密端口以太网交换机,极简的硬件设计,在2RU 空间可提供 64x800G OSFP 或 128x400G/512x100G
- 全端口支持RoCE(基于融合以太网的RDMA)以及用于简化无损以太网配置管理的Easy RoCE
- 行业速度最快的交换机,兼容400G和800G,800GE 端口转发延迟低于 560 纳秒
- 满流量负载下64x800G SR8 端口的最大 TDP 为 2200
- 200+MB 的大型片上缓冲区可实现更好的 RoCE 无损以太网性能
- 10ns PTP 和 SyncE 性能,支持严格时间同步的 AI 并行计算
- 先进的 INT(带内网络遥测)提供更加实时精确的数据包延迟、丢包和路径数据,助力实现更先进的拥塞控制算法
- 搭载企业就绪的SONiC 发行版 AsterNOS,提供一站式的开放网络解决方案;功能容器化软件架构让操作系统更加强大、可靠,且易于二次开发和定制
- 兼容来自业界主流供应商的异构 GPU 和 SmartNIC
- 线速可编程,平滑支持不断演进的 UEC(超以太网联盟)标准
系列化交换机产品,构建中立、开放的一站式高性能AI网络
星融元成立于2017年,是国内领先的互联软硬件解决方案提供商。自成立以来,星融元上百名SONiC 研发专家组成的专业团队一直专注于打造世界上最好的SONiC 网络操作系统——最终成果便是 AsterNOS。基于此,星融元推出了1G-800G的系列化交换机,全面覆盖从PoE接入到大规模AI训练的网络互联场景。
经过多年的技术积淀和迭代,星融元已在国内外AI算力中心、云服务商、垂直行业、园区网等多场景头部客户实现落地,为移动云、国家电网、人民银行等海内外上千家客户提供完整网络互联方案,并在年初以第一名身份中标中国移动2023-2024年白盒交换机集采。
面向新时代下的新需求和新挑战,星融元仍将积极拥抱开放生态,持续为用户构建中立透明、易于运维、高性价比的AI基础网络。
关注vx公号“星融元Asterfusion”,获取更多技术分享和最新产品动态。