Arm发布 Neoverse V2 和 E2:下一代 Arm 服务器 CPU 内核

9月14日,Arm发布了新的处理器内核:V2和E2,在官网已经可以看到相关的TRM 手册了。。
在这里插入图片描述

在这里插入图片描述

四年前,Arm发布了Neoverse系列的CPU设计。Arm决定加大力度进军服务器边缘计算市场,专门为这些市场设计Arm CPU内核,而不仅仅是回收以消费者为中心的Cortex-A设计。因此,Arm开始以更积极的方式进军基础设施市场。这些努力为Arm及其合作伙伴带来了越来越丰厚的回报,得益于亚马逊的GravitonAmpere Altra CPU等产品,他们终于能够在服务器CPU市场中占据重要份额。
在这里插入图片描述
在这里插入图片描述

然而,随着Arm CPU最终实现了过去十年未能实现的市场渗透率,Arm需要确保不会满足于现状。在该公司的Neoverse核心设计的三个系列中——高效的E、灵活的N和高性能的V——该公司已经推出了第二代N核心,恰当地称为N2。现在,该公司正准备用下一代V和E核心更新Neoverse系列的其余产品,并于今天发布了Neoverse V2和Neoverse E2核心。这两种设计都将为HPC和其他服务器客户带来Armv9架构,并显着提高性能。
在这里插入图片描述

Arm Neoverse V2:Armv9助力高性能计算

领导Arm新CPU核心IP的是该公司的第二代V系列设计Neoverse V2。完整的V2平台代号为Demeter,标志着Arm高性能V系列内核的首次迭代,以及该内核系列从Armv8.4 ISA到Armv9的过渡。虽然这只是Arm第二次尝试服务器专用高性能核心,但请不要误会:Arm的目标是雄心勃勃。该公司声称Neoverse V2 CPU将提供市场上最高的单线程整数性能,超越AMD和英特尔的下一代设计。

虽然Arm本周发布的公告没有对新架构进行全面深入探讨,而且更令人恼火的是,该公司没有谈论具体的PPA指标,但Arm提供了对一些变化和功能的高级概述,这些功能将随V2平台一起提供。可以肯定的是,V2 IP现已完成并交付给客户(尤其是NVIDIA),但在2023年第一批基于该IP的芯片发布之前,Arm在某种程度上对V2的说法含糊其辞。

首先也是最重要的,Armv9的升级带来了最新Arm架构的全套功能。其中包括作为架构基础功能的安全性改进(对于云共享环境尤其方便)以及Arm较新的SVE2矢量扩展。

对于后者,Arm做出了一个有趣的改变,重新配置了矢量引擎的宽度;V1使用2个管道256位SIMD实现SVE(1),而V2则转向4个管道128位SIMD。最终结果是V2的累积SIMD宽度并不比V1宽,但执行流程已更改为并行处理大量较小的向量。这一变化使得SIMD管道宽度与Arm的Cortex部件相同(均为128位,SVE2的最小尺寸),但这确实意味着Arm不再充分利用可扩展性通过使用更大的SIMD来实现SVE的一部分。我希望一旦Arm进行了全面的V2深入研究,我们就会明白为什么Arm会采取这条路线,因为我很好奇这是否纯粹是一种效率游戏,还是更类似于整个Arm生态系统的同质化设计。

除此之外,值得注意的是,虽然Arm的演示幻灯片将bfloat16和int8 matmul列为功能,但这些并不是新功能。尽管如此,Arm仍承诺V2的SIMD处理将比V1提供更高的微架构效率。
在这里插入图片描述

更广泛地说,V2还将引入更大的L2缓存大小。V2设计支持每个核心高达2MB的私有二级缓存,是V1最大大小的两倍。V2还将进一步改进Arm的整数处理性能,但该公司目前尚未透露更多细节。从架构的角度来看,V1借鉴了Cortex-X1 CPU的设计,如果V2再次借鉴X2的设计,也不会太令人惊讶。在这种情况下,像Snapdragon 8 Gen1和Dimensity 9000这样的消费芯片应该可以提供一个关于预期结果的宽松参考。
在这里插入图片描述

对于Demeter平台,Arm将重复使用其CMN-700网状织物,该织物首次在V1代中引入。CMN-700仍然采用现代网格设计,在12x12配置中支持多达144个节点,并且适合与DDR5内存以及用于I/O的PCIe 5/CXL 2连接。因此,严格来说,V2并没有在结构层面带来任何新东西——甚至512MB的SLC也可以通过V1 + CMN-700设置完成——但这确实意味着CMN-700网格及其功能现在是V2前进的基线。
内存以及用于 I/O 的 PCIe 5/CXL 2 连接。因此,严格来说,V2 并没有在结构层面带来任何新东西——甚至 512MB 的 SLC 也可以通过 V1 + CMN-700 设置完成——但这确实意味着 CMN-700 网格及其功能现在是 V2 前进的基线。

Neoverse V2核心将成为下一代高性能Arm服务器CPU的基石。这里事实上的旗舰产品将是NVIDIA的Grace CPU,它将是2023年推出的首批(如果不是第一个)V2设计之一。NVIDIA此前曾宣布Grace将基于Neoverse设计,因此本周的公告Arm最终证实了长期以来的怀疑,即Grace将基于下一代Neoverse V核心。
在这里插入图片描述

NVIDIA则计划在几天内举办秋季GTC活动。因此,随着NVIDIA寻求在明年发布之前推广该芯片,我们很可能会听到更多有关Grace及其Neoverse V2基础的信息。

Neoverse E2:Cortex-A510与N2配合使用

除了Neoverse V2的发布之外,Arm还利用本周的简报发布了Neoverse E2平台。与V2的发布不同,这是一次规模小得多的公告,Arm仅提供了少量技术细节。最终,E2的辉煌日子将在晚些时候到来。

也就是说,E2平台正在交付给合作伙伴,着眼于与现有N2平台的互操作性。为此,Arm将Cortex-A510 CPU(Arm的小型/高效Cortex CPU内核)与CMN-700网格配对。此举旨在通过提供N2的替代CPU核心,为服务器运营商/供应商提供更大的灵活性,同时仍提供Arm网格的现代I/O和内存功能。强调这一点的是,E2系统背板甚至与N2背板兼容。

Neoverse Next: Poseidon, N-Next, and E-Next

最后,Arm本周发布的公告让我们可以一睹该公司所有三个Neoverse平台的未来路线图,不出所料,Arm正在开发每个平台的更新版本。
在这里插入图片描述

值得注意的是,所有三个平台都要求添加PCIe 6支持和CXL 3.0支持。这将来自Arm的CMN网状网络的下一个迭代,正如Arm今天所做的那样,该网络在所有三个平台之间共享。

与此同时,有趣的是看到Poseidon的名字再次出现在Arm的路线图中。回到Arm的第一个Neoverse路线图,Poseidon是Arm的500万/2021平台的名称,此后该位置被N2和V1/V2以各种形式占据。由于V2直到2023年才会登陆硬件,Poseidon/V3还需要数年时间,但Arm保留代号可能有一定意义(例如新的微架构)。

但首先推出的将是N-Next平台——可能是Neoverse N3。Neoverse N平台领先其他平台一代(N2于2020年首次发布),它将成为下一个需要更新的平台。N3将于2023年向合作伙伴推出,Arm广泛宣传新一代性能和效率改进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/80110.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CocosCreator3.8研究笔记(十八)CocosCreator UI组件(二)

前面的文章已经介绍了Canvas 组件、UITransform 组件、Widget 组件 。 想了解的朋友,请查看 CocosCreator3.8研究笔记(十七)CocosCreator UI组件(一)。 今天我们主要介绍CocosCreator 常用容器组件:Layout …

[npm]脚手架本地全局安装1

[npm]脚手架本地全局安装1 npm link 全局安装npm install 全局安装卸载全局安装的脚手架 该文章是你的脚手架已经开发完成的前提下,你想要本地全局安装该脚手架,便于本地使用脚手架的命令的情况 npm link 全局安装 如果本地开发的项目是个脚手架&#…

【C语言】进阶——指针

目录 ①(●◡●)前言 1.字符指针 ✌字符指针和数组笔试题 2.指针数组 和数组指针 👊指针数组 👊数组指针 👊&数组名和数组名 3.数组传参和指针传参 👊一维数组传参 👊二维数组传参 👊一级…

云原生之使用Docker部署Nas-Cab个人NAS平台

云原生之使用Docker部署Nas-Cab个人NAS平台 一、Nas-Cab介绍二、本地环境介绍2.1 本地环境规划2.2 本次实践介绍 三、本地环境检查3.1 检查Docker服务状态3.2 检查Docker版本3.3 检查docker compose 版本 四、下载Nas-Cab镜像五、部署Nas-Cab5.1 创建挂载目录5.2 创建Nas-Cab容…

利用idea新创建maven项目时的一些基本配置

1.修改项目默认的maven仓库 file->Settings->Build 2.设置项目的jdk版本 设置完点OK即可。 同样的我们还需要在项目配置中进行修改。 通过以上设置一般就可以解决jdk版本不兼容地方问题。

稀土系储氢合金 压力-组成等温线 PCI 的测试方法

声明 本文是学习GB-T 29918-2023 稀土系储氢合金 压力-组成等温线 PCI 的测试方法. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 5 方法2:电化学法 5.1 方法提要 以储氢合金作负极,烧结氢氧化亚镍作正极,氢氧化钾水溶液作电…

postgresql-视图

postgresql-视图 视图概述使用视图的好处 创建视图修改视图删除视图递归视图可更新视图WITH CHECK OPTION 视图概述 视图(View)本质上是一个存储在数据库中的查询语句。视图本身不包含数据,也被称为 虚拟表。我们在创建视图时给它指定了一个…

数字IC设计之时序分析基础概念汇总

1 时钟Clock 理想的时钟模型是一个占空比为50%且周期固定的方波。时钟是FPGA中同步电路逻辑运行的一个基准。理想的时钟信号如下图: 2 时钟抖动Clock Jitter 理想的时钟信号是完美的方波,但是实际的方波是存在一些时钟抖动的。那么什么是时钟抖动呢?时钟抖动&#…

苹果电脑Mac系统运行速度又卡又慢是怎么回事?

通常大家处理Mac运行速度慢的方法不是重启就是清空废纸篓,但是这两种方法对于Mac提速性能的效果是微之甚微的,想要彻底解决Mac运行速度慢,你应该试试一下三种方法~ 1、清理磁盘空间 硬盘空间过少是Mac运行变慢很大的一个因素,各…

【LeetCode刷题笔记】动态规划 — 70.爬楼梯

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; 更多算法知识专栏&#xff1a;算法分析&#x1f525; 给大家跳段街舞感谢…

Unity中 UI Shader的基本功能

文章目录 前言一、实现思路1、暴露一个 2D 类型的属性来接受UI的纹理2、设置shader的层级为TransParent半透明渲染层级&#xff0c;一般UI都是在这个渲染层级3、更改混合模式&#xff0c;是 UI 使用的纹理&#xff0c;该透明的地方透明 二、代码实现 前言 Unity中 UI Shader的…

Python爬虫逆向猿人学刷题系列——第七题

题目&#xff1a;采集这5页中胜点列的数据&#xff0c;找出胜点最高的召唤师&#xff0c;将召唤师姓名填入答案中 地址&#xff1a;https://match.yuanrenxue.cn/match/7 本题主要是考察字体的动态变化&#xff0c;同样也是从字体文件下手构造出映射关系就好&#xff0c;但本题…

【Training versus Testing】Positive intervals

GPT的解释&#xff1a; 这段话解释了在一维中&#xff0c;针对 "Positive intervals"&#xff08;正间隔&#xff09;假设类别 H 的成长函数 mq(N) 的计算方式&#xff0c;以及如何得出这个成长函数。 1. "Positive intervals" 指的是一维情境中的假设&a…

推荐书目:Python从入门到精通(文末送书)

目录 编辑推荐 内容简介 作者简介 前言/序言 本书特点 编辑推荐 “软件开发视频大讲堂”丛书是清华社计算机专业基础类零售图书畅销品牌之一。 &#xff08;1&#xff09;2008—2023年&#xff0c;丛书累计修订7次&#xff0c;销售400万册&#xff0c;深受广大程序员喜爱。…

Spring安全配置: 构建安全稳固的Java应用

&#x1f337;&#x1f341; 博主猫头虎&#xff08;&#x1f405;&#x1f43e;&#xff09;带您 Go to New World✨&#x1f341; &#x1f984; 博客首页——&#x1f405;&#x1f43e;猫头虎的博客&#x1f390; &#x1f433; 《面试题大全专栏》 &#x1f995; 文章图文…

2023国赛B题:多波束测线问题 评阅要点完整分析

本文所有分析仅代表个人观点&#xff0c;不代表官方&#xff0c;仅供参考 制作人&#xff1a;川川徒弟 demoo CSDN&#xff1a;川川菜鸟公众号&#xff1a;川川带你学AI 全文采用非编程做法  需要工具&#xff1a; geogebra、matlab工具箱   注&#xff1a; 本文全文不考虑…

前端Layui框架介绍

当涉及到前端UI框架时&#xff0c;Layui&#xff08;简称layui&#xff09;是一个备受欢迎的框架之一。在这篇博客中&#xff0c;我们将深入了解layui&#xff0c;包括其市场占有率、开发语言、使用场景、框架特点以及一些使用案例。 1. 市场占有率 Layui 是一款流行的前端UI框…

Mysql

视频链接 黑马Mysql 基础篇 通用语法及分类 DDL: 数据定义语言&#xff0c;用来定义数据库对象&#xff08;数据库、表、字段&#xff09;DML: 数据操作语言&#xff0c;用来对数据库表中的数据进行增删改DQL: 数据查询语言&#xff0c;用来查询数据库中表的记录DCL: 数据控…

网络原理,了解xml, json,protobuffer的特点

目录 外卖服务器场景带入 大佬们通用的规范格式 一、&#x1f466; 外卖服务器场景 外面服务器沟通有很多模式——展示商家列表等等&#xff0c;只是其中一个&#xff0c;因此需要一个统一的规划了——不同应用程序&#xff0c;里面的自定义格式是不一样的&#xff0c;这样的…

icmp报文及用go实现

目录 一、概述 二、ICMP报文格式详解 2.1 什么是ICMP 2.2 ICMP报文格式 2.3 ICMP报文类型 2.4 实际报文举例 三、使用go实现icmp请求以及接收响应内容 一、概述 本文主要旨在学习icmp报文格式&#xff0c;以及通过go语言来实现ICMP发包。 二、ICMP报文格式详解 2.1 什…