Amazon EC2 P5 实例正式可用,加速生成式 AI 和高性能计算应用

亚马逊云科技近日在纽约峰会上宣布 Amazon Elastic Compute Cloud(EC2)P5 实例正式可用。这是一款下一代 GPU 实例,由最新的英伟达 H100 Tensor Core GPU 提供支持,可以满足客户在运行人工智能、机器学习和高性能计算工作负载时对高性能和高扩展性的需求。与上一代基于 GPU 的实例相比,Amazon EC2 P5 实例可以将训练时间缩减6倍(从几天缩短到几小时),从而帮助客户节省高达40%的训练成本。

Amazon EC2 P5 实例提供8个英伟达 H100 Tensor Core GPU,具有640 GB 高带宽 GPU 内存,同时提供第三代 AMD EPYC 处理器、2TB 系统内存和30 TB 本地 NVMe 存储。Amazon EC2 P5 实例还提供3200 Gbps 的聚合网络带宽并支持 GPUDirect RDMA,从而能够绕过 CPU 进行节点间通信,实现更低的延迟和高效的横向扩展性能。

亚马逊云科技与英伟达携手开发下一代基础设施

亚马逊云科技和英伟达(NVIDIA)在今年3月宣布了一项多方合作,构建全球最具可扩展性且按需付费的人工智能基础设施,以便训练日益复杂的大语言模型和开发生成式 AI 应用程序。

当时,亚马逊云科技预发布了由英伟达 H100 Tensor Core GPU 支持的 Amazon EC2 P5 实例,可为构建和训练更大规模的机器学习模型提供高达20 exaFLOPS 的算力。亚马逊云科技和英伟达合作十多年来成果颇丰,推出了包括支持视觉计算、人工智能和高性能计算集群的各种 GPU 实例,如 CG1 实例(2010年)、G2(2013年)、P2(2016年)、P3(2017年)、G3(2017年)、P3dn(2018年)、G4(2019年)、P4(2020年)、G5(2021年)和 P4de(2022年)实例。

现在,机器学习模型的规模已经达到数万亿参数,这种复杂性大大增加了客户训练模型所需的时间,例如,最新的大语言模型训练时间长达数月之久。类似的趋势也出现在高性能计算领域。随着高性能计算客户数据收集准确度的提高以及数据集达到 EB 级规模,客户已经在寻找解决日益复杂应用程序的更快方法。

关于 Amazon EC2 P5 实例

Amazon EC2 P5 实例非常适合训练和运行越来越复杂的大语言模型和计算机视觉模型,以满足最苛刻的计算密集型生成式 AI 应用的需求,包括问答、代码生成、视频和图像生成、语音识别等。与上一代基于 GPU 的实例相比,Amazon EC2 P5 实例在这些应用中的训练时间缩短了6倍。那些可以在工作负载中使用较低精度 FP8 数据类型的客户,例如使用 Transformer 框架的语言模型,将通过英伟达 Transformer Engine 的支持获得高达6倍的性能提升。

高性能计算客户通过使用 Amazon EC2 P5 实例可以在药物发现、地震分析、天气预报和金融建模等领域更大规模地部署高要求的应用程序。此外,对于使用基于动态规划(Dynamic Programming)算法进行基因组测序或加速数据分析等应用的客户,Amazon EC2 P5 将通过新的 DPX 指令集提供支持。

Amazon EC2 P5 实例使客户能够探索以前看似无法解决的问题,更快地迭代解决方案,并加速进入市场。

第二代 Amazon EC2 UltraClusters 和 Elastic Fabric Adapter

Amazon EC2 P5 实例为多节点分布式训练和紧密耦合的高性能计算工作负载提供先进的横向扩展功能,其使用的第二代 Elastic Fabric Adapter(EFA)网络设备提供高达3200 Gbps 的网络速度,是 Amazon EC2 P4d 实例的8倍。

为了满足客户对大规模和低延迟的需求,Amazon EC2 P5 实例部署在第二代 Amazon EC2 UltraClusters 中,该集群目前可在超过2万个英伟达 H100 Tensor Core GPU 上为客户提供更低的延迟。作为云中最大规模的机器学习基础设施之一,Amazon EC2 UltraClusters 中的 Amazon EC2 P5 实例可提供高达20 exaFLOPS 的聚合计算能力。

Amazon EC2 UltraClusters 使用了 Amazon FSx for Lustre,这是一种完全托管的共享存储,构建在常用的高性能并行文件系统上。客户通过 Amazon FSx for Lustre,可以按需大规模快速处理海量数据集,并实现亚毫秒级延迟。Amazon FSx for Lustre 的低延迟和高吞吐量特性经过优化,可在 Amazon EC2 UltraCluster 上为深度学习、生成式 AI 和高性能计算工作负载提供支持。

Amazon FSx for Lustre 可以为 Amazon EC2 UltraCluster 中的 GPU 机器学习加速器持续提供数据,从而加速最苛刻的工作负载,包括大语言模型训练、生成式 AI 推理,以及基因组学和金融风险建模等高性能计算负载。

Amazon EC2 P5 实例现已正式可用

Amazon EC2 P5 实例现已在以下区域正式可用:美国东部(北弗吉尼亚)和美国西部(俄勒冈)。

客户也可以选择亚马逊云科技提供的各种内置生成式 AI 的云服务,它们都运行在具有成本效益的生成式 AI 云基础设施上,助力客户加快创新和重塑应用。更多信息请扫描下方二维码访问亚马逊云科技生成式 AI 页面。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/27724.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

10_Vue3 其它的组合式API(Composition API)

Vue3 中的其它组合式API 1.shallowReactive 与 shallowRef 2. readonly 与 shallowReadonly 3.toRaw 与 markRaw 4.customRef 5.provide 与 inject 6.响应式数据的判断

HTTP连接之出现400 Bad Request分析

1、400简介 400是一种HTTP状态码,告诉客户端它发送了一条异常请求。400页面是当用户在打开网页时,返回给用户界面带有400提示符的页面。其含义是你访问的页面域名不存在或者请求错误。主要分为两种。 1、语义有误,当前请求无法被服务器理解…

v-for循环生成的盒子只改变当前选中的盒子的样式

1.给盒子添加动态属性:class"[index isActive?active-box:choose-box]" <div v-for"(item,index) in zyList" :key"item.sid" :class"[index isActive?active-box:choose-box]" click"getKmList(item,index)"…

使用Python将Word文档转换为PDF的方法

摘要&#xff1a; 文介绍了如何使用Python编程语言将Word文档转换为PDF格式的方法。我们将使用python-docx和pywin32库来实现这个功能&#xff0c;这些库提供了与Microsoft Word应用程序的交互能力。 正文&#xff1a; 在现实生活和工作中&#xff0c;我们可能会遇到将Word文…

android获取屏幕分辨率的正确方法;获取到分辨率(垂直方向像素)的不正确

我通过下面的方法去获取屏幕分辨率的&#xff0c;但获取到的分辨率有时会不准确。原因是此方法有时候会忽略一些布局或控件的高度&#xff0c;从而得不到正确的高度。 public static String getDeviceResolution(Context context){//从系统服务中获取窗口管理器WindowManager w…

Python 调用自定义函数

新手入坑。 通常我们需要把公共函数提出来&#xff0c;作为公共资源调用。也避免了代码的重复书写。 比如我们在项目内创建我们的py脚本路径如下&#xff1a; 在公共方法中定义方法&#xff1a; class CommonMethods:def dataFormat(df):dataList []for row in range(0, df.…

mac安装open3d时候出现错误

在测试open3d是否正常顺利安装时&#xff0c;出现了如下错误&#xff1a; python -c "import open3d as o3d; print(o3d.__version__)" Traceback (most recent call last):File "<string>", line 1, in <module>File "/Users/huangzhe/…

根文件系统制作

1.官网下载工具 制作工具&#xff1a;busybox https://busybox.net/downloads/ 2.制作根文件系统 2.1准备工作 a.把压缩包放在FSP1M目录下&#xff0c;并解压 2.2正式开始 2.2.1配置交叉编译工具链 1. 打开Makefile文件 2. 修改ARCH &#xff1f;$(SUBARCH) &#xf…

将http协议升级为https协议——域名平台部分的设置

为远程群晖NAS的自定义域名免费申请SSL证书 文章目录 为远程群晖NAS的自定义域名免费申请SSL证书前言1. 向域名平台申请SSL证书1.1 购买“免费证书” 2. 进一步进行创建证书设置2.1 对证书的关联域名进行补充 3. 云解析DNS3.1 进行验证信息 前言 我们可以成功地将自己购买的域…

新手注意事项-visual studio 来实现别踩白块儿

自己之前为了熟悉easyx练习过一个简单的项目&#xff0c;别踩白块儿&#xff0c;链接在这里&#xff0c;别踩白块儿&#xff0c;当时比较稚嫩&#xff0c;很多东西都不会&#xff0c;可以说是只知道最基本的语法&#xff0c;头文件都不知道&#xff0c;一个一个查资料弄懂的&am…

select * 与 select xxx,xxx 性能问题

select * 与 select xxx&#xff0c;xxx 性能问题 SQL sql 1: SELECT * FROM TABLEsql 2: SELECT column1, colum2, column3, etc. FROM TABLE为啥说 sql 2 比 sql 1 好一些 字段多&#xff0c;不需要多字段会增加数据传输使劲和网络开销。 用 SELECT * 数据库需要解析更…

【LeetCode】287. 寻找重复数

287 . 寻找重复数&#xff08;中等&#xff09; 方法 快慢指针 思路 要解决这道题首先要理解如何将输入的数组看作为链表。对于数组 nums 中的数字范围在 [1, n]&#xff0c;考虑两种情况&#xff1a; 如果数组中没有重复的数字&#xff0c;以 [1, 3, 4, 2] 为例&#xff0c;将…

Java技术整理(4)—— Java基础篇

1、Java异常分类及处理 异常处理是为了解决在程序处理时发生错误而无法退出的问题。 &#xff08;1&#xff09;异常分类 Object —— Throwable&#xff08;所有错误或异常的超类&#xff09; Error&#xff1a; 是指 Java 运行时系统的内部错误和资源耗尽错误&#xff0c…

C++ | C++11新特性(上)

目录 前言 一、列表初始化 二、声明 1、auto 2、decltype 3、nullptr 三、STL容器的变化 四、右值引用与移动语义 1、左值与左值引用 2、右值与右值引用 3、右值引用与左值引用的比较 4、右值引用的场景及意义 &#xff08;1&#xff09;做参数 &#xff08;2&a…

影响亚马逊Listing转化率的14大因素你知道吗?

我们都知道亚马逊listing转化率对于链接的推新和维稳来说有多么重要&#xff0c;只要转化率的比值无法达到整体市场平均比值的及格线&#xff0c;你就很可能会慢慢被亚马逊的飞轮算法所淘汰。 那么&#xff0c;具体是哪些因素在影响着你的listing转化率呢?这里我们可以分为显…

LeetCode1732. 找到最高海拔

题干 有一个自行车手打算进行一场公路骑行&#xff0c;这条路线总共由 n 1 个不同海拔的点组成。自行车手从海拔为 0 的点 0 开始骑行。 给你一个长度为 n 的整数数组 gain &#xff0c;其中 gain[i] 是点 i 和点 i 1 的 净海拔高度差&#xff08;0 < i < n&#xff…

wm8960没有声音

最近在imx6ull上调试这个声卡&#xff0c;用官方的镜像是能发声的&#xff0c;换到自己做的镜像上&#xff0c;就没有声音。 记录一下过程&#xff1a; 内核和设备树。只要有下面的显示&#xff0c;就说明加载成功。 再看一下aplay的显示 到此&#xff0c;驱动都是正常的。但…

数学建模-元胞自动机

clc clear n 300; % 定义表示森林的矩阵大小 Plight 5e-6; Pgrowth 1e-2; % 定义闪电和生长的概率 UL [n,1:n-1]; DR [2:n,1]; % 定义上左&#xff0c;下右邻居 vegzeros(n,n); % 初始化表示森林的矩阵 imh ima…

适配器模式-java实现

意图 复用已经存在的接口&#xff0c;与所需接口不一致的类。即将一个类&#xff08;通常是旧系统中的功能类&#xff09;&#xff0c;通过适配器转化成另一个接口的实现。&#xff08;简单来说&#xff0c;就是复用旧系统的功能&#xff0c;去实现新的接口&#xff09; 我们举…

在R中比较两个矩阵是否相等

目录 方法一&#xff1a;使用all.equal()比较两个R对象是否近似相等 方法二&#xff1a;使用identical比较两个R对象是否精确相等。 方法一&#xff1a;使用all.equal()比较两个R对象是否近似相等 使用函数&#xff1a;all.equal(x,y) 比较两个R对象x和y是否近似相等 > M1…