英特尔推出中国特供版Gaudi 3芯片,性能暴降92%以应对美国出口管制|TodayAI

英特尔近期发布消息,其将在中国市场推出专为该地区定制的“特供版”Gaudi 3 AI芯片,以符合美国对AI芯片的出口管制。这一版本包括HL-328型号的OAM兼容夹层卡,预计将于6月24日发布;以及HL-388型号的PCIe加速卡,计划在9月24日推出。这些芯片保持了与原版相同的硬件配置,包括96MB的SRAM片上内存和128GB的HBM2e高带宽内存,带宽高达3.7TB/s,并支持PCIe 5.0 x16接口和标准解码。

由于出口管制,特供版的综合运算性能(TPP)被限制在4800以下,意味着其16bit性能不得超过150 TFLOPS,相比原版Gaudi 3在FP16/BF16性能可达1835 TFLOPS,特供版需降低约92%的AI性能。但性能降低也带来了功耗显著下降,特供版的PCIe卡和OAM卡的热设计功耗(TDP)均为450瓦,远低于原版的600瓦和900瓦。

挑战 Nvidia H100 的 Gaudi 3

在最近的Vision 2024活动中,英特尔在凤凰城发布了其最新的AI加速器芯片——Gaudi 3。此芯片号称在运行大型语言模型(如支持ChatGPT的模型)时性能卓越,被视为Nvidia当前广受欢迎的数据中心GPU H100的有力竞争者。尽管H100曾经供应紧张,现状已有所改善。

与Nvidia的H100芯片相比,英特尔宣称Gaudi 3在训练OpenAI的GPT-3 175B LLM和Meta的Llama 2 70亿参数版本时,训练时间可快50%。在推理性能(即运行训练模型以产生输出)方面,Gaudi 3同样声称比H100快50%。

面对H100在市场上的高占有率,英特尔特意瞄准了这一市场。尽管Nvidia已经宣布了更强大的AI加速器芯片H200和Blackwell B200,但这两款芯片尚未上市(H200预计将在2024年第二季度发布)。

与此同时,H100的供应问题曾让众多科技公司和AI研究者头疼,不得不争抢可用于训练AI模型的芯片。这导致像微软、Meta和OpenAI(据传)等科技公司寻求自主设计AI加速器芯片,这些定制硅片通常由英特尔或台积电生产。谷歌自2015年起就在内部使用其张量处理单元(TPU)。

鉴于这些问题,如果英特尔能够为Gaudi 3设定一个理想的价格(虽然英特尔尚未提供价格,但据报道H100的成本约为30,000至40,000美元)并保持充足的生产,Gaudi 3可能成为H100的一个具有吸引力的替代品。AMD也生产竞争力强的AI芯片,如AMD Instinct MI300系列,售价约为10,000至15,000美元。

英特尔表示,新芯片在其前代Gaudi 2的架构基础上进行了改进,特别是增加了两个相同的硅片,通过高带宽连接相连。每个硅片包含48兆字节的中央缓存内存,周围配备了四个矩阵乘法引擎和32个可编程张量处理器核心,总核心数达到64个。

据英特尔声称,Gaudi 3的AI计算性能是Gaudi 2的两倍,使用8位浮点基础设施,这对于训练变换模型至关重要。此外,该芯片还提供了使用BFloat 16数字格式计算的四倍提速。Gaudi 3还配备了128GB较便宜的HBM2e内存容量(这可能有助于价格竞争力),并具有3.7TB的内存带宽。

由于数据中心的高能耗,英特尔强调了Gaudi 3的能效,声称在Llama 7B和70B参数以及Falcon 180B参数模型上,推理能效比Nvidia的H100高出40%。英特尔Habana Labs的首席运营官Eitan Medina将这一优势归因于Gaudi的大矩阵数学引擎,他声称这种引擎与其他架构相比,需要的内存带宽显著较低。

在此之前,大家都关注了Nvidia的Blackwell架构及其B200 GPU的引人注目的发布,Nvidia声称这将是世界上最强大的AI芯片。因此,将英特尔目前能够生产的最佳芯片与Nvidia的最高性能AI芯片进行比较似乎很自然。

就制造技术而言,据IEEE Spectrum报道,Gaudi 3采用了台积电的N5工艺技术,这缩小了英特尔与Nvidia在半导体制造技术方面的差距。即将推出的Nvidia Blackwell芯片将使用定制的N4P工艺,据称在性能和效率上提供适度的改进。

Gaudi 3使用HBM2e内存(如上文提及)与使用更昂贵的HBM3或HBM3e的竞争对手芯片相比,提供了性能与成本效率的平衡。这一选择似乎强调了英特尔不仅在性能上竞争,还在价格上竞争的战略。

尽管Gaudi 3与B200的原始性能比较尚不能确定,直到芯片发布并由第三方进行基准测试后才能得知。

随着科技行业对AI计算的需求日益增加,IEEE Spectrum指出,英特尔Gaudi芯片的下一代,代号为Falcon Shores的产品,仍然备受关注。英特尔是否继续依赖台积电的技术,或利用自己的代工业务和即将推出的纳米片晶体管技术在AI加速器市场获得竞争优势,仍有待观察。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/817244.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从建表语句带你学习doris_表索引

1、doris建表概述 1.1、doris建表模板 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [DATABASE.]table_name (column_definition1[,column_deinition2,......][,index_definition1,[,index_definition2,]] ) [ENGINE [olap|mysql|broker|hive]] [key_desc] [COMMENT "tabl…

不花一分钱,四大方法教你免费申请SSL证书

在数字化时代,数据安全与隐私保护的重要性日益凸显。为了确保在线信息传输的机密性和完整性,数字证书,尤其是SSL/TLS证书扮演着至关重要的角色。为个人及企业用户提供了经济、高效的加密解决方案。随着市场对SSL证书的逐渐重视,免…

docker run启动一个开发备忘清单速查表 —— 筑梦之路

docker run -itd --name reference -p 3000:3000 registry.cn-beijing.aliyuncs.com/deanmr/reference:latest包含:运维,前端,后端,工具,命令,数据库 部分截图展示:

【Bugku】sqli-0x1

1.打开靶场,进入实验场景 2.按F12查看源代码,发现有一个/?pls_help路径,在url后加上查看。 3.得到的php源码 首先,代码通过 error_reporting(0) 和 error_log(0) 关闭了错误报告,这可以防止攻击者从错误信息中获取敏…

设计模式之大话西游

8年前深究设计模式,现如今再次回锅~ 还是大话设计模式 这本书还是可以的 大话西游经典的台词:“曾经有一份真挚的爱情摆在我面前,我没有珍惜,等我失去的时候,我才后悔莫及,人世间最痛苦的事莫过于此。如果上天能够给我一个再来一次的机会,我会…

【每周精选资讯 | 第 5 期】2024-04-08 ~ 2024-04-14

文章目录 前言内容百度智能云发布干帆大模型一体机,加速企业私有化部署大模型北大开源 aiXcoder-7B 代码大模型,专为企业私有部署设计WPS AI 企业版发布:多个大模型自由切换英特尔发布 AI 芯片 Gaudi 3,称性能超越英伟达 H100马云…

国外站群服务器有哪几种?

国外站群服务器种类繁多,它们各具特色,适用于不同的业务需求和场景。以下将为您科普几种常见的国外站群服务器及其特点。 首先,美国站群服务器以其丰富的IP资源和强大的网络技术著称。作为全球网络技术和数据中心发展的领先者,美国…

数据库SQL语言实战(二)

目录 检索查询 题目一 题目二 题目三 题目四 题目五 题目六 题目七 题目八 题目九(本篇最难的题目) 分析 实现(两种方式) 模板 总结 检索查询 按照要求查找数据库中的数据 题目一 找出没有选修任何课程的学…

YesPMP众包平台 | 活动有礼,现金奖励点击领取!

YesPMP众包平台在线发福利啦,4月16日活动火热开启,现金奖励等你来领,最高可领千元,赶快参与将奖励收入囊中,一起来了解活动细节吧! 一、活动内容: 活动一:【项目征集令】活动&…

Python Flask-Security- 构建安全而强大的Web应用

Flask-Security是一个基于Flask的安全扩展,为开发者提供了构建安全且强大的Web应用的工具。本文将深入探讨Flask- Security的核心功能、基本用法以及在实际应用中的一些高级特性,通过丰富的示例代码,助您更全面地了解和应用这一用于Web应用安…

2024年【危险化学品经营单位主要负责人】考试题库及危险化学品经营单位主要负责人新版试题

题库来源:安全生产模拟考试一点通公众号小程序 危险化学品经营单位主要负责人考试题库是安全生产模拟考试一点通总题库中生成的一套危险化学品经营单位主要负责人新版试题,安全生产模拟考试一点通上危险化学品经营单位主要负责人作业手机同步练习。2024…

python+playwright 学习-88 禁止加载图片等资源

前言 对于爬虫的小伙伴来说,有时候只需抓取页面的文本,不用加载图片,可以加快操作页面速度,那么我们可以设置禁止加载图片等资源。 禁止图片加载 根据url地址的后缀,图片资源后缀一般是png,jpg,jpeg,gif等格式。 from playwright.sync_api import sync_playwrightwith…

Gradle 实战 - 插件-ApiHug准备-工具篇-015

🤗 ApiHug {Postman|Swagger|Api...} 快↑ 准√ 省↓ GitHub - apihug/apihug.com: All abou the Apihug apihug.com: 有爱,有温度,有质量,有信任ApiHug - API design Copilot - IntelliJ IDEs Plugin | Marketplace ApiHug …

rv1103/buildroot系统中添加包如v4l2

v4l2: rv1103给出的包中已经有v4l,只需要在menuconfig中打开编译选项,步骤如下: 在luckfox的github网站中下载的源代码在~/linux/luckfox/luckfox-pico-main中目录结构如下: 打开编译选项 cd ./sysdrv/source/buildroot/buildroot-2023.02.…

一种驱动器的功能安全架构介绍

下图提供了驱动器实现安全功能的架构 具有如下特点: 1.通用基于总线或者非总线的架构。可以实现ethercat的FSOE,profinet的profisafe,或者伺服本体安全DIO现实安全功能。 2.基于1oo2D架构,安全等级可以达到sil3。 3.高可用性。单…

第十五篇【传奇开心果系列】Python自动化办公库技术点案例示例:深度解读Python 自动化处理图像在各行各业的应用场景

传奇开心果博文系列 系列博文目录Python自动化办公库技术点案例示例系列 博文目录前言一、行业应用场景介绍二、 **计算机视觉研究与开发示例代码**三、人工智能与机器学习示例代码四、医疗健康领域示例代码五、制造业与质量控制示例代码六、农业与环境科学示例代码七、电子商务…

小米汽车值得去吗?最终拒了 offer。

车企选择 今天逛某职场 App 时,无意间看到一篇寻求 offer 抉择意见的帖子: 这位同学刚从加班闻名(但 CEO 强调既学华为狼性,也学华为分配)的理想汽车离职。 经过了 6 轮面试,收到了小米 offer,但…

【合合TextIn】智能文档处理系列—电子文档解析技术全格式解析

一、引言 在当今的数字化时代,电子文档已成为信息存储和交流的基石。从简单的文本文件到复杂的演示文档,各种格式的电子文档承载着丰富的知识与信息,支撑着教育、科研、商业和日常生活的各个方面。随着信息量的爆炸性增长,如何高…

网络网络层之(2)ARP协议

网络网络层之(2)ARP协议 Author:Once Day Date: 2024年4月1日 漫漫长路,有人对你笑过嘛… 全系列文档可参考专栏:通信网络技术_Once-Day的博客-CSDN博客。 参考文档: 《TCP/IP详解卷一》arp(8) - Linux manual page (man7.org)彻底搞懂系…

C语言中的数据结构--链表的应用2(3)

前言 上一节我们学习了链表的应用,那么这一节我们继续加深一下对链表的理解,我们继续通过Leetcode的经典题目来了解一下链表在实际应用中的功能,废话不多说,我们正式进入今天的学习 单链表相关经典算法OJ题4:合并两个…