揭秘英特尔AI芯片如何做到比H100训练快40%、推理快50%


英特尔,开始正面硬刚英伟达了。

深夜时分,英特尔CEO帕特·基辛格激动展示全新AI芯片Gaudi 3,引领未来科技潮流,开启智能新篇章。

4f302f807388c59a5df4fe0f250ada48.jpeg

他为什么开心到现场直接蹦迪?

看下Gaudi 3的性能结果,就一目了然了:

  • 训练大模型:比英伟达H100快40%
  • 推理大模型:比英伟达H100快50%

985535baa111da7af27ba09a17577f9a.jpeg

不仅如此,虽然基辛格没有在现场给出直接的数据,但他还表示:

Gaudi 3的性能将与英伟达H200相当,在某些领域的性能甚至会更好。

2adecf550c8fa40bd2ba529602d33614.jpeg

如此直面对标英伟达,到底效果如何,我们继续往下看。

硬刚英伟达的Gaudi 3

英特尔透露,Gaudi 3已在Llama上完成测试,展现出卓越性能,能够高效训练与部署AI大模型。其支持的文生图Stable Diffusion与语音识别Whisper等应用,均展现了强大的实力,为AI技术的发展注入了新动力。

2221dd5307e20d918b6a4444280a52f6.jpeg
c3f7d3376f6a26993225df07319d9e13.jpeg

基辛格现场展示集成最新英特尔芯片的AI PC,多任务处理能力卓越,如邮件处理迅疾如风,展现强大技术实力。

2f56b18e156345f48a18b71fb185be12.jpeg

再如语音处理

da22d85f0faeb5aff8a176568e3a13b7.jpeg

以及图像渲染

cb964d5a9d84c0d8dd7c1bd04a9c575c.jpeg

英特尔演示操作的同事还非常调皮地展示了用AI PC生成的卡通版基辛格:

89857d5aa2ff40e7c3d3fa7132b91a6a.jpeg

Gaudi 3采用先进的5纳米工艺,相较于历代Gaudi,性能显著提升,具体对比详见下表,展现其卓越性能。

6ea849eea309c6ef49b287199b16f71a.jpeg

5d668cc38fc4c54a3549c4f8839c4105.jpeg

英特尔宣布,备受瞩目的Gaudi 3芯片将于今年第三季度大规模供货,戴尔、惠普及超微电脑等业界巨头均将采用此芯片,共同开启新一轮计算革命。

至于具体的价格,目前英特尔方面还并未透露。

令人惊讶的是,Gaudi 3仅是英特尔Vision活动中发布的众多精彩产品之一,其创新实力不容小觑,更多精彩值得期待!

Xeon,步入第六代

没错,去年年底英特尔刚刚上市第五代Xeon,仅时隔数个月,第六代Xeon又来了!

(英特尔这次还真没有挤牙膏f56736de43c66cb08de791a2146f5ca5.jpeg

在现场,基辛格还亲切地叫它“little baby”

effff55f80fa9a7ad3a9c6a83a30a07f.jpeg

第六代Xeon惊艳登场,融汇Sierra Forest与Granite Rapids两大先进架构,引领计算新纪元,性能卓越,值得期待!

Sierra Forest精巧融入英特尔更小、低功耗的E-cores,呈现卓越能效;而Granite Rapids则汇聚强大性能的P-cores,构筑顶尖算力。两大架构相辅相成,为高效能与强性能树立新标杆。

基辛格在现场称二者像双胞胎

ff2f4a35087b8f6bc686d79c09848fc3.jpeg

英特尔Xeon 6处理器采用Sierra Forest架构,实现了机架密度的显著跃升,高达2.7倍的提升,为数据处理能力带来质的飞跃。

客户能以近3:1的比例替换旧系统,大幅降低能耗,帮助其实现可持续发展目标。

英特尔Xeon 6处理器搭载Sierra Forest架构,独具匠心,支持MXFP4数据格式软件,为数据处理带来前所未有的速度与效率。

相比使用FP16的第四代Xeon处理器,新方案可将token延迟时间缩短至原来的六分之一,轻松驾驭700亿参数的Llama-2模型,实现高效运算,引领技术新风尚。

ac901903387b87c8e7d184d576c16c90.jpeg

至于英特尔Xeon 6处理大模型的速度到底有多快,基辛格做了更加直接的对比。

他将第四代、第五代和最新的第六代Xeon放到了一起,来了一个现场速度的大比拼。

5abec59713338de848b2f300b50e94d0.jpeg

从直观的生成速度来看,第六代Xeon明显要比“前任们”快上许多。

具体到精确的延时数值,第六代Xeon运行Llama 2 70B只有82ms

871bed90ef8dabf360705ef2b3dabc8f.jpeg

同等条件下,第六代Xeon与“前任们”的延时数值对比如下:

015adcc2a8f446e48d680dc6742b9d73.jpeg

备受瞩目的Sierra Forest架构第六代Xeon处理器,已定于今年第二季度惊艳登场,引领行业革新潮流。

网友揭秘英特尔“秘方”

这场硬刚英伟达的发布会,同样也激起了不少网友们的热议。

例如Gaudi 3封装的一处细节,即使用HBM2e存储芯片,有网友对此表示惊讶:

他们使用的是HBM2e,这是英伟达A100在2020年使用的。

英特尔原计划采用最先进的HBM3e技术,然而受限于供应短缺,遗憾错失充足订单,错失此次技术革新的良机。

04f2bd07ab683341852d6971e6337711.jpeg

对此,这位网友进一步表示:

这是英特尔的秘方之一。

他们总能靠旧技术赶上/超越新技术,直到当前的技术在生产、获取和集成上变得更容易。

英特尔作为半导体产业的先驱,其制造优势在业界独树一帜,几乎囊括了芯片产业的全部资源和核心能力,是其在半导体领域保持领先地位的关键所在。

但何时能够和英伟达全面一较高下?这也是不少网友关注的问题:

英特尔强势挑战H100/H200,我们翘首以盼,究竟何时能与英伟达顶级“核弹”B200一较高下?期待这场巅峰对决!

或许答案只有交给时间来回答。

英特尔此次发布,无疑为AIGC时代的算力注入了新的活力,提供了更加高效、优质且经济的选择,是“快好省”的绝佳选项。


 

-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/809890.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

算法打卡day32

今日任务: 1)738.单调递增的数字 2)968.监控二叉树 738.单调递增的数字 题目链接:738. 单调递增的数字 - 力扣(LeetCode) 文章讲解:代码随想录 (programmercarl.com) 视频讲解:贪…

初学网络编程

网络编程是指编写能够在网络环境中运行,进行数据通信的程序的过程。它涵盖了从建立网络连接、发送和接收数据,到关闭连接等一系列操作。网络编程是开发网络应用程序的基础,它使得不同的计算机和设备能够通过网络进行数据交换和通信。 三个核…

ELK企业级日志分析系统(elasticsearch+logstash+kibana)

目录 一.ELK概述 1.定义 (1)ElasticSearch (2)Kiabana (3)Logstash (4)Filebeat 2.filebeat结合logstash带来好处 3.为什么要是用ELK? 4.完整日志系统基本特征 …

Docker学习笔记(一):入门篇,Docker概述、基本组成等,对Docker有一个初步的认识

前言 记录时间 [2024-4-5] 在先前的文章中,笔者进行了Windows系统下YOLOv8模型的简单测试,并由此引发思考:是否能尝试将此模型运行在Linux中呢?又或者,运行在Docker中。关于Docker的学习就这么展开了。 本文便是有关D…

RX8130CE为用户提供带复位延迟和主备电管理的解决方案

实时时钟作为设备的精确时钟来源,其作用如同人的心脏,为设备提供准确稳定的心跳.而便携式设备由于应用场景多变,所以对内部元器件要求也相对较高,这就对作为核心器件的实时时钟模块提出不少挑战。世强代理品牌EPSON实时钟模块产品…

【Linux】开始了解重定向

送给大家一句话: 人真正的名字是:欲望。所以你得知道,消灭恐惧最有效的办法,就是消灭欲望。 – 史铁生 《我与地坛》 开始了解重定向 1 前言2 重定向与缓冲区2.1 文件描述符分配规则2.2 重定向的现象2.3 重定向的理解2.4 缓冲区…

5.6 mybatis之RowBounds分页用法

文章目录 mybatis 中,使用 RowBounds 进行分页,非常方便,不需要在 sql 语句中写 limit,即可完成分页功能。但是由于它是在 sql 查询出所有结果的基础上截取数据的,所以在数据量大的sql中并不适用,它更适合在…

【Python】OPC UA 服务器扫描工具

引言 OPC UA(开放平台通信统一架构)是一种跨平台的、开放的数据交换标准,广泛用于工业自动化领域。在工业4.0的大背景下,OPC UA服务器在网络中的部署日益增多,如何快速有效地发现这些服务器成为了一个实际需求。本文将…

UI自动化测试重点思考(下)--装饰器/生成器/夹具的使用/描述符的作用/ddt驱动/多线程

UI自动化测试重点思考--装饰器 装饰器装饰器定义装饰器代码示例装饰器的执行如何将装饰器融合到pytest框架里面 生成器创建生成器生成器的定义如何将生成器融合到pytest框架里面 fixture(夹具)使用pytest fixture 中 scope 参数的详细解释 描述符的总结描…

【Sentinel的限流使用】⭐️SpringBoot整合Sentinel实现Api的限流

目录 前言 一、Sentinel下载 二、SpringBoot 整合 Sentinel 三、流控规则 章末 前言 小伙伴们大家好,上次使用OpenFeign时用到了 Hystrix实现熔断和限流的功能,但是发现该工具已经停止维护了,于是想到了Spring Cloud Alibaba开发的Sentin…

高创新 | Matlab实现OOA-CNN-GRU-Attention鱼鹰算法优化卷积门控循环单元注意力机制多变量回归预测

高创新 | Matlab实现OOA-CNN-GRU-Attention鱼鹰算法优化卷积门控循环单元注意力机制多变量回归预测 目录 高创新 | Matlab实现OOA-CNN-GRU-Attention鱼鹰算法优化卷积门控循环单元注意力机制多变量回归预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.Matlab实现OOA…

如何在CentOS7.x上生成自签名SSL证书

在配置HTTPS连接时,SSL证书是确保数据传输安全性的关键组件。自签名证书是一种不通过证书颁发机构(CA)签发的证书,适用于测试和内部使用。以下是在CentOS 7.x系统上生成自签名证书的详细步骤。 1. 安装OpenSSL OpenSSL是一个强大…

【嵌入式学习】ARM day04.11

一、思维导图 二、练习 实现三个灯闪烁 汇编代码 .text .global _start _start: 使能GPIOE和F时钟LDR r0,0x50000A28LDR r1,[R0]ORR R1,R1,#(0X3<<4)STR R1,[R0]配置GPIOE和F的MODER寄存器LDR r0,0x50006000 GPIOELDR R1,0X50007000 G…

顶顶通呼叫中心中间件-回铃音补偿(mod_cti基于FreeSWITCH)

顶顶通呼叫中心中间件-回铃音补偿(mod_cti基于FreeSWITCH) 回铃音的用处 回铃音&#xff1a; 当别人打电话给你时&#xff0c;你的电话响铃了&#xff0c;而他听到的声音叫做回铃音。回铃音是被叫方向主叫方传送&#xff0c;也是彩铃功能的基础。我们平时打电话听到的“嘟 嘟…

【C++进阶】C++异常详解

C异常 一&#xff0c;传统处理错误方式二&#xff0c;C处理的方式三&#xff0c;异常的概念四&#xff0c;异常的使用4.1 异常和捕获的匹配原则4.2 函数调用链中异常栈展开匹配原则4.3 异常的重新抛出&#xff08;异常安全问题&#xff09;4.4 RAII思想在异常中的作用 五&#…

2024 Mathorcup高校数学建模挑战赛(B题)| 甲骨文识别 | 建模秘籍文章代码思路大全

铛铛&#xff01;小秘籍来咯&#xff01; 小秘籍团队独辟蹊径&#xff0c;以CNN卷积神经网络&#xff0c;计算机视觉等强大工具&#xff0c;构建了解决复杂问题的独特方案。深度学习, 混沌模型的妙用&#xff0c;为降低非法野生动物贸易提供新视角。通过综合分析&#xff0c;描…

IP广播对讲系统停车场解决方案

IP广播对讲系统停车场解决方案 一、需求分析 随着国民经济和社会的发展&#xff0c; 选择坐车出行的民众越来越多。在保护交通安全的同时&#xff0c;也给停车场服务部门提出了更高的要求。人们对停车场系统提出了更高的要求与挑战&#xff0c; 需要停车场系统提高工作效率与服…

01-Git 之快速入门操作本地仓库

https://learngitbranching.js.org/?localezh_CN在线练习git 1. Git 安装好Git以后, 先检查是否已经绑定了用户名和邮箱 git config --list1.1 为什么要使用版本控制&#xff1f; 从个人角度&#xff1a; 在做项目时&#xff0c;如果一点点去改代码会很乱&#xff0c;不利…

OpenCV4.9更多形态转换

返回&#xff1a;OpenCV系列文章目录&#xff08;持续更新中......&#xff09; 上一篇:OpenCV4.9处理平滑图像 下一篇:OpenCV4.9更多形态转换 基于这两者&#xff0c;我们可以对图像进行更复杂的转换。在这里&#xff0c;我们简要讨论 OpenCV 提供的 5 个操作&#xff1a; …

FreeBuf 全球网络安全产业投融资观察(3月)

综述 据不完全统计&#xff0c;2024年3月&#xff0c;全球网络安全市场共发生投融资事件53起&#xff0c;其中国内4起&#xff0c;国外49起。 3月全球络安全产业投融资统计表&#xff08;数据来源&#xff1a;航行资本、36氪&#xff09; 整体而言&#xff0c;国内4起投融资事…