自研芯片逾十年,亚马逊云科技Graviton系列芯片全面成熟

在云厂商自研芯片的浪潮中,亚马逊云科技无疑是最早践行这一趋势的先驱。自其迈出自研芯片的第一步起,便如同一颗石子投入平静的湖面,激起了层层涟漪,引领着云服务和云上算力向着更高性能、更低成本的方向演进。

早在2012年,自研Amazon Nitro系统的计划已经开启。目前亚马逊云科技已推出四大自研芯片产品家族:六代Amazon Nitro系统、四代通用处理器芯片Amazon Graviton、两代机器学习训练芯片Amazon Trainium和两代机器学习推理芯片Amazon Inferentia。

自2018 re:Invent 上推出第一代芯片以来,Amazon Graviton家族已经历了四代迭代。在企业降本增效的大趋势下,基于Amazon Graviton的Amazon EC2实例以及托管服务正成为越来越多客户的选择。

目前,亚马逊云科技基于Amazon Graviton的Amazon EC2实例种类达150多个,在全球已经部署的的Amazon Graviton处理器数量超过200万个,并拥有超过50,000客户,其中也涵盖了Amazon EC2前100客户90%以上。

今天我们就来看看Amazon Graviton在性能、商业落地方面的最新进展。


很多人可能好奇,作为云计算开创者的亚马逊云科技为什么要自己做芯片?我们可以从一个侧面探寻其动因。

在2022年的亚马逊云科技芯片创新日(Silicon Innovation Day)活动上,亚马逊高级副总裁兼杰出工程师James Hamilton回顾了亚马逊云科技自2012年开始的自研芯片历程。

Hamilton 表示,“最终,单台服务器的核心功能将集成为一个芯片系统。如果服务器上所有的创新将全部集中在芯片上。而我们不制造芯片,那么我们就没有创新。”

Hamilton强调了亚马逊云科技将继续加大在硬件研发方面的投入,推动下一代处理器的创新,以满足全球客户日益增长的需求。他坚信,随着技术的不断发展,亚马逊云科技将继续保持在云计算和硬件设计的前沿,引领行业走向更加高效、智能的未来。

回到Amazon Graviton,经过5年多的迭代,这一系列通用处理器芯片已经在技术、场景、商业各方面展现出日趋成熟的表现。

技术成熟:性能提升功耗下降无止尽

很多人不知道的是,在云计算厂商的身份外,亚马逊云科技自主完成所有自研芯片的开发工作,所有芯片均由Annapurna Labs团队设计和制造。

Annapurna Labs是亚马逊云科技于2015年收购的半导体微电子公司。早在收购之前,双方就在Nitro系统的开发方面紧密合作。对Annapurna Labs的收购加速了Nitro系统的开发,并加强了亚马逊云科技在硬件领域的创新实力。

目前,Annapurna Labs团队成员分布在全球多个地点,包括以色列的特拉维夫、加拿大的多伦多,以及德克萨斯州奥斯汀的实验室。

“我们的宗旨是为客户提供更多选择、更低成本和更高性能。” Annapurna Labs芯片工程总监Rami Sinno表示。“通过自主完成所有芯片的开发,避免依赖第三方,我们能够加速产品的交付进程。”

亚马逊云科技首席工程师Ali Saidi负责Amazon Graviton系列处理器的技术开发

负责Amazon Graviton技术开发的亚马逊云科技首席工程师Ali Saidi及其团队在Graviton系列的设计、制造和包装方面不断创新。譬如,在Graviton3中,研发团队将七个小型定制晶片和约550亿个晶体管整合到一个中央处理器(CPU)中。

围绕更佳性价比这一目标,每一代的Amazon Graviton都会比上一代有两位数的性能提升,且实现单位算力功耗的持续下降。譬如:

2021年推出的Amazon Graviton3,单核性能比Amazon Graviton2提升25%,浮点性能提升2倍,与同类型其他Amazon EC2实例相比,可节省60%的能源消耗。同时还首次在云计算芯片中采用性能更强、功耗更低的DDR5内存。

2023年推出的Amazon Graviton4较上一代产品性能提升高达30%,独立核心增加50%以上,内存带宽提升75%以上。

此外,通过Amazon Graviton4,亚马逊云科技实现首次面向实际应用设计CPU架构,即从传统的MicroBenchmark基准测试评价体系,转向以实际工作负载进行评价标准。通过真实工作负载雷达图,可以更好地衡量实际工作负载的优化效果。

场景成熟:支撑广泛的应用场景

历经四代产品迭代,目前Amazon Graviton支持广泛的应用场景,包括高性能计算、机器学习、人工智能、容器化应用构建、数据分析等等。比如:

在机器学习领域,Amazon Graviton在运行TensorFlow、PyTorch等深度学习框架时有出色表现,适合模型训练和推理任务,尤其在需要大量数据处理和矩阵计算的场景下。

在容器化应用构建领域,Amazon Graviton对多种容器编排工具(如ECS、EKS、Kubernetes等)和镜像仓库(如ECR、Docker Hub等)的支持,方便用户在Amazon Graviton上部署和管理容器化应用,适合微服务架构和DevOps环境。

在数据分析领域,Amazon Graviton可以在EMR、Spark等大数据分析框架上运行,支持批处理和流式数据分析等场景,适合实时数据分析和处理大规模数据集。流行的Spark框架在Graviton3上可以获得16.7%的成本节约。

亚马逊自身也是Amazon Graviton芯片的典型用户之一。2021年Prime Day期间,亚马逊首次使用Amazon Graviton2支持的Amazon EC2实例。2024年Prime-Day期间,亚马逊使用了超过25万个Graviton芯片为超过5800种不同的亚马逊电商服务提供支持。

商业成熟:新实例中“三分天下有其一”

第三方数据显示,在2023年推出的M7g系列实例中,采用Amazon Graviton的实例已经与英特尔、AMD三分天下,这进一步验证了Graviton芯片在通用实例中的受欢迎程度。

根据云成本管理和优化平台Vantage的一项调查,2024第一季度,在Amazon EC2 M7系列通用实例的成本支出方面,采用Graviton的M7g系列已经超过三分之一(34.5%)。

2024年第二季度,在Amazon RDS、Amazon ElastiCache和Amazon OpenSearch托管服务中,客户选择使用基于Amazon Graviton已超越了英特尔,越来越多客户选择基于Graviton的托管服务。

由于Amazon Graviton系列芯片对性价比的不断提升和广泛的应用场景,其也深受中国企业的青睐。

比如,全球领先IoT云平台涂鸦智能已经将整个公司40%以上的工作负载迁移到Amazon EC2 M6g和C6g新一代实例。跟上一代同配置的X86实例相比,CPU性能提升了100%,服务器单价降低20%,整体性价比提升2.5倍。

加速出海的互联网科技公司大宇无限通过使用 Amazon EMR on EKS,以及亚马逊云科技基于 ARM 架构的 Graviton2 实例,将运行大数据作业的整体性能提升了 30%,成本降低了 20%。

如今,亚马逊云科技的自研芯片之路已经走过十余年。透过已经全面成熟的Amazon Graviton系列芯片,亚马逊云科技实现深度整合硬件与软件,不仅大幅提升了云服务的体验与效率,更为全球用户带来了前所未有的云端算力性价比,开启了云计算领域的新篇章。

END

本文为「智能进化论」原创作品。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/62232.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

掌上单片机实验室 — RT - Thread+ROS2 浅尝(26)

前面化解了Micro_ROS通讯问题,并在 RT-Thread Studio 环境下,使用Micro_ROS软件包中的例程,实现了STM32F411CE核心板和ROS2主机的通讯。之后还尝试修改例程 micro_ros_sub_twist.c ,实现了接收 turtle_teleop_key 所发出的 turtle…

【Leetcode 每日一题】25. K 个一组翻转链表

25. K 个一组翻转链表 给你链表的头节点 head ,每 k 个节点一组进行翻转,请你返回修改后的链表。 k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍,那么请将最后剩余的节点保持原有顺序。 你不能只是单…

Android 图形系统之一:概览

Android 图形系统是一套完整的架构,用于管理从应用绘制到显示屏幕的整个流程。它涉及多个层次和组件,从应用程序到硬件,确保每一帧都能准确、高效地呈现到用户的设备屏幕上。 1. Android 图形系统的架构 Android 图形系统的架构可以分为以下…

【C语言】指针与数组的例题详解:深入分析与高级用法

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: C语言 文章目录 💯前言💯题目一详细分析与解答代码逐步解析 💯进一步优化和拓展1. 指针与数组的关系2. 指针运算的注意事项3. 常见的错误和陷阱4. 拓展:指针操作的应用场…

Windows修复SSL/TLS协议信息泄露漏洞(CVE-2016-2183)

打开服务器,运行gpedit.msc,打开“本地组策略编辑器”,依次打开计算机配置-管理模板-网络-SSL配置设置。 打开“SSL密码套件顺序”,更改为已启用,并修改套件算法,去掉TLS1.1版本算法。 TLS_ECDHE_ECDSA_WIT…

go-zero(八) 中间件的使用

go-zero 中间件 一、中间件介绍 中间件(Middleware)是一个在请求和响应处理之间插入的程序或者函数,它可以用来处理、修改或者监控 HTTP 请求和响应的各个方面。 1.中间件的核心概念 请求拦截:中间件能够在请求到达目标处理器之…

vscode ctrl+/注释不了css

方式一.全部禁用插件排查问题. 方式二.打开首选项的json文件,注释掉setting.json,排查是哪一行配置有问题. 我的最终问题:需要将 "*.vue": "vue",改成"*.vue": "html", "files.associations": { // "*.vue": &qu…

使用 Jina Embeddings v2 在 Elasticsearch 中进行后期分块

作者:来自 Elastic Gustavo Llermaly 在 Elasticsearch 中使用 Jina Embeddings v2 模型并探索长上下文嵌入模型的优缺点。 在本文中,我们将配置和使用 jina-embeddings-v2,这是第一个开源 8K 上下文长度嵌入模型,首先使用 semant…

电视网络机顶盒恢复出厂超级密码大全汇总

部分电视机顶盒在按遥控器设置键打开设置时,会弹出设置密码弹窗,需输入密码才能操作其中内容。 如下图所示: 部分电视机顶盒在选择恢复出厂设置时,会出现设置密码弹窗,只有输入操作密码后才能进行恢复出厂设置的操作。…

cmake原理

CMake原理与快速入门 CMake是一个跨平台的构建(build)工具,完成代码编译、链接、打包过程。在开发AI应用平台时,由于开发的平台是在边缘设备运行的,而边缘设备的算力不高,所以对平台的效率要求比较高&…

SFTP全解析:深入了解组件功能与适用场景

文章目录 一、组件功能二、适用场景三、SFTP优势四、SFTP原理五.SFTP与同类产品对比六、部署方案1.裸金属部署2.k8s容器化部署 七、高可用方案八、监控方案九、常见问题及解决方法 一、组件功能 安全文件传输协议SFTP(SSH File Transfer Protocol)是文件传输协议(F…

java——Spring MVC的工作流程

Spring MVC的工作流程是基于模型-视图-控制器(MVC)设计模式的一个典型实现,以下是其主要工作流程步骤: 客户端请求提交: 用户通过浏览器向服务器发送请求,该请求首先到达Spring MVC的前端控制器DispatcherS…

Mutex::Autolock 和 std::lock_guard 的区别

Mutex::Autolock 和 std::lock_guard 都是 C 中用于管理互斥锁(mutex)的一种方式,它们的目标是自动获取和释放锁,避免手动管理锁的复杂性,从而防止死锁和遗漏解锁等问题。尽管它们有相似的功能,但二者也存在…

<项目代码>YOLOv8 红绿灯识别<目标检测>

YOLOv8是一种单阶段(one-stage)检测算法,它将目标检测问题转化为一个回归问题,能够在一次前向传播过程中同时完成目标的分类和定位任务。相较于两阶段检测算法(如Faster R-CNN),YOLOv8具有更高的…

mac下安装Ollama + Open WebUI + Llama3.1

本文介绍mac下安装Ollama Open WebUI Llama3.1 8b具体步骤。 目录 推荐配置Ollama Open WebUI Llama3.1简介安装Ollama安装Open WebUI 推荐配置 m1以上芯片,16g内存,20g以上硬盘空间 Ollama Open WebUI Llama3.1简介 Ollama: 下载,管理…

Linux 无图形界面磁盘空间排查与优化实践20241127

Linux 无图形界面磁盘空间排查与优化实践 引言:磁盘空间问题的痛点与挑战 🔍 常见问题 当系统磁盘空间超过 90% 时,不仅可能导致性能下降,还可能让关键操作无法正常完成。这种情况下,如何高效且精准地排查磁盘占用来…

【AI】JetsonNano启动时报错:soctherm OC ALARM

1、问题描述 将JetsonNano烧写SD卡镜像为Ubuntu20.04后,启动时报错:soctherm OC ALARM,启动失败;然后系统一直重启 2、原因分析 “soctherm OC ALARM”是检测到系统温度超过安全阈值时发出的过热警告。 “soctherm”代表系统…

SycoTec 4060 ER-S德国高精密主轴电机如何支持模具的自动化加工?

SycoTec 4060 ER-S高速电主轴在模具自动化加工中的支持体现在以下几个关键方面: 1.高精度与稳定性:SycoTec 4060 ER-S锥面跳动小于1微米,确保了加工过程中的极高精度,这对于模具的复杂几何形状和严格公差要求至关重要。高精度加工…

d3-contour 生成等高线图

D3.js 是一个强大的 JavaScript 库,用于创建动态、交互式数据可视化。d3-contour 是 D3.js 的一个扩展模块,用于生成等高线图(contour plots)。 属性和方法 属性 x: 一个函数,用于从数据点中提取 x 坐标。y: 一个函…

Docker 部署 MongoDB

🚀 作者主页: 有来技术 🔥 开源项目: youlai-mall 🍃 vue3-element-admin 🍃 youlai-boot 🍃 vue-uniapp-template 🌺 仓库主页: GitCode💫 Gitee &#x1f…