揭秘英特尔AI芯片如何做到比H100训练快40%、推理快50%


英特尔,开始正面硬刚英伟达了。

深夜时分,英特尔CEO帕特·基辛格激动展示全新AI芯片Gaudi 3,引领未来科技潮流,开启智能新篇章。

4f302f807388c59a5df4fe0f250ada48.jpeg

他为什么开心到现场直接蹦迪?

看下Gaudi 3的性能结果,就一目了然了:

  • 训练大模型:比英伟达H100快40%
  • 推理大模型:比英伟达H100快50%

985535baa111da7af27ba09a17577f9a.jpeg

不仅如此,虽然基辛格没有在现场给出直接的数据,但他还表示:

Gaudi 3的性能将与英伟达H200相当,在某些领域的性能甚至会更好。

2adecf550c8fa40bd2ba529602d33614.jpeg

如此直面对标英伟达,到底效果如何,我们继续往下看。

硬刚英伟达的Gaudi 3

英特尔透露,Gaudi 3已在Llama上完成测试,展现出卓越性能,能够高效训练与部署AI大模型。其支持的文生图Stable Diffusion与语音识别Whisper等应用,均展现了强大的实力,为AI技术的发展注入了新动力。

2221dd5307e20d918b6a4444280a52f6.jpeg
c3f7d3376f6a26993225df07319d9e13.jpeg

基辛格现场展示集成最新英特尔芯片的AI PC,多任务处理能力卓越,如邮件处理迅疾如风,展现强大技术实力。

2f56b18e156345f48a18b71fb185be12.jpeg

再如语音处理

da22d85f0faeb5aff8a176568e3a13b7.jpeg

以及图像渲染

cb964d5a9d84c0d8dd7c1bd04a9c575c.jpeg

英特尔演示操作的同事还非常调皮地展示了用AI PC生成的卡通版基辛格:

89857d5aa2ff40e7c3d3fa7132b91a6a.jpeg

Gaudi 3采用先进的5纳米工艺,相较于历代Gaudi,性能显著提升,具体对比详见下表,展现其卓越性能。

6ea849eea309c6ef49b287199b16f71a.jpeg

5d668cc38fc4c54a3549c4f8839c4105.jpeg

英特尔宣布,备受瞩目的Gaudi 3芯片将于今年第三季度大规模供货,戴尔、惠普及超微电脑等业界巨头均将采用此芯片,共同开启新一轮计算革命。

至于具体的价格,目前英特尔方面还并未透露。

令人惊讶的是,Gaudi 3仅是英特尔Vision活动中发布的众多精彩产品之一,其创新实力不容小觑,更多精彩值得期待!

Xeon,步入第六代

没错,去年年底英特尔刚刚上市第五代Xeon,仅时隔数个月,第六代Xeon又来了!

(英特尔这次还真没有挤牙膏f56736de43c66cb08de791a2146f5ca5.jpeg

在现场,基辛格还亲切地叫它“little baby”

effff55f80fa9a7ad3a9c6a83a30a07f.jpeg

第六代Xeon惊艳登场,融汇Sierra Forest与Granite Rapids两大先进架构,引领计算新纪元,性能卓越,值得期待!

Sierra Forest精巧融入英特尔更小、低功耗的E-cores,呈现卓越能效;而Granite Rapids则汇聚强大性能的P-cores,构筑顶尖算力。两大架构相辅相成,为高效能与强性能树立新标杆。

基辛格在现场称二者像双胞胎

ff2f4a35087b8f6bc686d79c09848fc3.jpeg

英特尔Xeon 6处理器采用Sierra Forest架构,实现了机架密度的显著跃升,高达2.7倍的提升,为数据处理能力带来质的飞跃。

客户能以近3:1的比例替换旧系统,大幅降低能耗,帮助其实现可持续发展目标。

英特尔Xeon 6处理器搭载Sierra Forest架构,独具匠心,支持MXFP4数据格式软件,为数据处理带来前所未有的速度与效率。

相比使用FP16的第四代Xeon处理器,新方案可将token延迟时间缩短至原来的六分之一,轻松驾驭700亿参数的Llama-2模型,实现高效运算,引领技术新风尚。

ac901903387b87c8e7d184d576c16c90.jpeg

至于英特尔Xeon 6处理大模型的速度到底有多快,基辛格做了更加直接的对比。

他将第四代、第五代和最新的第六代Xeon放到了一起,来了一个现场速度的大比拼。

5abec59713338de848b2f300b50e94d0.jpeg

从直观的生成速度来看,第六代Xeon明显要比“前任们”快上许多。

具体到精确的延时数值,第六代Xeon运行Llama 2 70B只有82ms

871bed90ef8dabf360705ef2b3dabc8f.jpeg

同等条件下,第六代Xeon与“前任们”的延时数值对比如下:

015adcc2a8f446e48d680dc6742b9d73.jpeg

备受瞩目的Sierra Forest架构第六代Xeon处理器,已定于今年第二季度惊艳登场,引领行业革新潮流。

网友揭秘英特尔“秘方”

这场硬刚英伟达的发布会,同样也激起了不少网友们的热议。

例如Gaudi 3封装的一处细节,即使用HBM2e存储芯片,有网友对此表示惊讶:

他们使用的是HBM2e,这是英伟达A100在2020年使用的。

英特尔原计划采用最先进的HBM3e技术,然而受限于供应短缺,遗憾错失充足订单,错失此次技术革新的良机。

04f2bd07ab683341852d6971e6337711.jpeg

对此,这位网友进一步表示:

这是英特尔的秘方之一。

他们总能靠旧技术赶上/超越新技术,直到当前的技术在生产、获取和集成上变得更容易。

英特尔作为半导体产业的先驱,其制造优势在业界独树一帜,几乎囊括了芯片产业的全部资源和核心能力,是其在半导体领域保持领先地位的关键所在。

但何时能够和英伟达全面一较高下?这也是不少网友关注的问题:

英特尔强势挑战H100/H200,我们翘首以盼,究竟何时能与英伟达顶级“核弹”B200一较高下?期待这场巅峰对决!

或许答案只有交给时间来回答。

英特尔此次发布,无疑为AIGC时代的算力注入了新的活力,提供了更加高效、优质且经济的选择,是“快好省”的绝佳选项。


 

-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/809890.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【回溯】Leetcode 78. 子集【中等】

子集 给你一个整数数组 nums ,数组中的元素 互不相同 。返回该数组所有可能的子集(幂集)。 解集 不能 包含重复的子集。你可以按 任意顺序 返回解集。 示例1: 输入:nums [1,2,3] 输出:[[],[1],[2],[1,2…

算法打卡day32

今日任务: 1)738.单调递增的数字 2)968.监控二叉树 738.单调递增的数字 题目链接:738. 单调递增的数字 - 力扣(LeetCode) 文章讲解:代码随想录 (programmercarl.com) 视频讲解:贪…

(Java)数据结构——正则表达式

前言 本博客是博主用于复习数据结构以及算法的博客,如果疏忽出现错误,还望各位指正。 正则表达式概念 正则表达式,又称规则表达式(Regular Expression),是一种文本模式,包括普通字符&#xf…

初学网络编程

网络编程是指编写能够在网络环境中运行,进行数据通信的程序的过程。它涵盖了从建立网络连接、发送和接收数据,到关闭连接等一系列操作。网络编程是开发网络应用程序的基础,它使得不同的计算机和设备能够通过网络进行数据交换和通信。 三个核…

微机消谐装置能够有效消除电网中的谐波干扰

随着电力技术的飞速发展,电网系统的稳定性与安全性成为了电力工业关注的重点。在这个背景下,微机消谐装置以其卓越的性能和广泛的应用领域,逐渐成为了电网系统中不可或缺的一部分。 微机消谐装置是一种基于微处理器技术的先进设备&#xff0c…

ELK企业级日志分析系统(elasticsearch+logstash+kibana)

目录 一.ELK概述 1.定义 (1)ElasticSearch (2)Kiabana (3)Logstash (4)Filebeat 2.filebeat结合logstash带来好处 3.为什么要是用ELK? 4.完整日志系统基本特征 …

无界面 centOS 中使用 DrissionPage

无界面 centOS 中使用 DrissionPage 1. centos 安装 chrome2. python 代码DrissionPage简介 某电影网站使用了加密js,无法直接从主页上爬取电影信息,只好借助 selenium 等工具。selenium 需要在服务器上安装浏览器和对应的 driver。我的服务器是无界面 c…

Docker学习笔记(一):入门篇,Docker概述、基本组成等,对Docker有一个初步的认识

前言 记录时间 [2024-4-5] 在先前的文章中,笔者进行了Windows系统下YOLOv8模型的简单测试,并由此引发思考:是否能尝试将此模型运行在Linux中呢?又或者,运行在Docker中。关于Docker的学习就这么展开了。 本文便是有关D…

RX8130CE为用户提供带复位延迟和主备电管理的解决方案

实时时钟作为设备的精确时钟来源,其作用如同人的心脏,为设备提供准确稳定的心跳.而便携式设备由于应用场景多变,所以对内部元器件要求也相对较高,这就对作为核心器件的实时时钟模块提出不少挑战。世强代理品牌EPSON实时钟模块产品…

Web3:下一代互联网的崛起与革命性展望

随着科技的飞速发展,互联网正在经历一场前所未有的变革。Web3,作为互联网的下一代,正以其独特的魅力和潜力,引领着这场革命性的浪潮。本文旨在深入探讨Web3的概念、特点以及对未来的展望,为读者呈现一个全面而深入的We…

【Linux】开始了解重定向

送给大家一句话: 人真正的名字是:欲望。所以你得知道,消灭恐惧最有效的办法,就是消灭欲望。 – 史铁生 《我与地坛》 开始了解重定向 1 前言2 重定向与缓冲区2.1 文件描述符分配规则2.2 重定向的现象2.3 重定向的理解2.4 缓冲区…

【Python】探索Python中的aiohttp:构建高效并发爬虫

后来 我总算学会了 如何去爱 可惜你 早已远去 消失在人海 后来 终于在眼泪中明白 有些人 一旦错过就不再 🎵 HouZ/杨晓雨TuTu《后来》 在数据密集和网络密集的任务中,提高程序的执行效率是非常重要的。Python作为一门强大的编程语言…

jmeter生成随机数的详细步骤及使用方式

Apache JMeter 是一个用于测试性能的开源工具,它可以模拟多种类型的负载并测量应用程序的性能。在 JMeter 中生成随机数可以通过使用预定义的函数来实现。以下是生成随机数的详细步骤及使用方式: 安装 JMeter: 首先,你需要在你的计…

5.6 mybatis之RowBounds分页用法

文章目录 mybatis 中,使用 RowBounds 进行分页,非常方便,不需要在 sql 语句中写 limit,即可完成分页功能。但是由于它是在 sql 查询出所有结果的基础上截取数据的,所以在数据量大的sql中并不适用,它更适合在…

【Python】OPC UA 服务器扫描工具

引言 OPC UA(开放平台通信统一架构)是一种跨平台的、开放的数据交换标准,广泛用于工业自动化领域。在工业4.0的大背景下,OPC UA服务器在网络中的部署日益增多,如何快速有效地发现这些服务器成为了一个实际需求。本文将…

UI自动化测试重点思考(下)--装饰器/生成器/夹具的使用/描述符的作用/ddt驱动/多线程

UI自动化测试重点思考--装饰器 装饰器装饰器定义装饰器代码示例装饰器的执行如何将装饰器融合到pytest框架里面 生成器创建生成器生成器的定义如何将生成器融合到pytest框架里面 fixture(夹具)使用pytest fixture 中 scope 参数的详细解释 描述符的总结描…

【Sentinel的限流使用】⭐️SpringBoot整合Sentinel实现Api的限流

目录 前言 一、Sentinel下载 二、SpringBoot 整合 Sentinel 三、流控规则 章末 前言 小伙伴们大家好,上次使用OpenFeign时用到了 Hystrix实现熔断和限流的功能,但是发现该工具已经停止维护了,于是想到了Spring Cloud Alibaba开发的Sentin…

docker 容器迁移

目录 1、将容器打成镜像后迁移 2、导出和导入容器 1、将容器打成镜像后迁移 (1)将容器打成镜像 # 打成镜像 mycentos docker commit -m "my centos" -a "author" 2d1fba0978 mycentos # 打成镜像 mycentos,tag …

高创新 | Matlab实现OOA-CNN-GRU-Attention鱼鹰算法优化卷积门控循环单元注意力机制多变量回归预测

高创新 | Matlab实现OOA-CNN-GRU-Attention鱼鹰算法优化卷积门控循环单元注意力机制多变量回归预测 目录 高创新 | Matlab实现OOA-CNN-GRU-Attention鱼鹰算法优化卷积门控循环单元注意力机制多变量回归预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.Matlab实现OOA…

Discoverydevice.java和activity_discoverydevice.xml

一、Discoverydevice.java public class Discoverydevice extends AppCompatActivity {private DeviceAdapter mAdapter2;private final List<DeviceClass> mbondDeviceList new ArrayList<>();//搜索到的所有已绑定设备保存为列表private final List<Devic…