博通加速向Nvidia发起进攻 为何连iPhone 15都不能用“苹果智能”?

博通加速向Nvidia发起进攻

博通强调的一项优势是其 XPU 的能效。其功耗不到 600 瓦,是业内功耗最低的 AI 加速器之一。

Nvidia 的许多竞争对手都想抢占其市场主导地位。其中一个不断出现的名字是 Broadcom。仔细观察就会知道原因。其 XPU 功耗不到 600 瓦,使其成为业内最节能的加速器之一。

美国银行在本周给投资者的一份报告中表示,“将其视为人工智能的首选。”它并不是在谈论 Nvidia,尽管美国银行认为 Green Team 是 GPU 之战中无可争议的赢家。它指的是博通,该公司最近在其第二季度收益报告中宣布了 10 比 1 的股票分割和好于预期的收入。该公司预计 2024 财年的销售额将高于预期的 510 亿美元。

美国银行分析师预测该公司 2025 财年的销售额将达到 599 亿美元,同比增长 16%。分析师指出,博通去年收购VMWare 带来的效率提升、销售额的提升以及定制芯片的潜在增长是其 2025 年预测的关键指标。如果美国银行的预测正确,那么博通的市值可能会使其与其他几家科技巨头一起跻身万亿美元俱乐部,其中包括微软、苹果、Nvidia、亚马逊、Alphabet 和 Meta。

为了实现这一目标,它必须与 Nvidia 展开竞争,后者目前的市值领先博通 8040 亿美元,为 3.4 万亿美元。此外,Nvidia 的 CUDA 架构已在超大规模企业(如 Meta、微软、谷歌和亚马逊)的 AI 工作负载方面获得了近乎垄断的地位,这些企业是其最大的客户。它拥有一个庞大的软件、工具和库生态系统,这进一步锁定了客户,并为博通等竞争对手设置了很高的进入门槛。

这些公司都希望减少对 Nvidia 的依赖,因此博通将自己定位为替代方案,为云计算和 AI 公司提供定制的 AI 加速器芯片(称为 XPU)。在最近的一次活动中,博通指出,对其产品的需求正在滚雪球般增长,并指出两年前最先进的集群有 4,096 个 XPU。2023 年,它构建了一个拥有超过 10,000 个 XPU 节点的集群,需要两层 Tomahawk 或 Jericho 交换机。该公司的路线图是将其扩展到 30,000 多个,最终达到 100 万个。

博通强调的一项优势是其 XPU 的能效。其功耗不到 600 瓦,是业内功耗最低的 AI 加速器之一。

博通对芯片市场也有不同的看法,称芯片市场正从以 CPU 为中心转向以连接为中心。除了 CPU 之外,GPU、NPU 和 LPU 等替代处理器的出现需要高速连接,而这正是博通的专长。

为何连iPhone 15都不能用“苹果智能”?

传统内存都不够,兼容Apple Intelligence的设备都至少有8GB的​​RAM——6GB保障日常应用流畅运行,多出2GB跑端侧LLM。

今年的WWDC上,最令人惊喜的可能不是iOS 18,而是苹果的AI:Apple Intelligence。

不过,官方的说法是,Apple Intelligence将仅支持 iPhone 15 Pro、iPhone 15 Pro Max以及搭载M1或后续芯片的iPad和Mac设备。

翻译一下:目前在售的所有iPhone里面,只有15 Pro系列支持Apple Intelligence,连同期发售的15和15 Plus都不行!不过, 三年前发售的iPad Pro却可以!

为什么会出现这种情况呢?

近日,知名分析师郭明錤分析称,从这可以推断出,能否支持Apple Intelligence的关键应该是DRAM大小,而非AI算力 (TOPS)。

问题在内存,而不在算力!

参数上看,M1芯片的算力约为11 TOPS,而A16芯片的计算能力约为17 TOPS。不过,M1的DRAM最低为8GB,最高可达16GB,高于A16的6GB,这多出来的2GB,很有可能是“问题的关键”。郭明錤推测称:

“因此,目前的 Apple Intelligence 端侧AI LLM对DRAM 的需求约为2GB或更低。”

进一步,郭明錤表示,可以从另一角度验证Apple Intelligence对DRAM的需求:

“Apple Intelligence采用端侧3B LLM(应为 FP16,M1的NPU/ANE对FP16有很好的支持),经过压缩后(采用2-bit与 4-bit的混合配置),随时需要预留约0.7-1.5GB DRAM来运作Apple Intelligence的端侧LLM。”

与安卓手机司空见惯的16GB甚至24GB的“大号”DRAM相比,苹果设备通常提供的DRAM较少,大多不超过6GB。iphone 13等老款机型,DRAM更是只有4GB。

因此,不少分析师认为,苹果设定2GB“内存壁垒”或可促进消费者对旧设备的“更新换代”,即将到来iPhone 16系列机型中,苹果可能提供更高的DRAM选项。

郭明錤表示:

“未来 Apple Intelligence 的端侧AI肯定也会升级(最有可能升级到7B LLM),届时需要更大DRAM才能运作。

值得观察Apple是否会以此作为高低阶机种的产品区隔策略。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/28390.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT-4并非世界模型,LeCun双手赞同!ACL力证LLM无法模拟真实世界

一直以来,支持LLM的观点之一是模型可以集成海量事实知识,作为通往「世界模拟器」的基础。虽然也有不少反对意见,但缺乏实证依据。那么,LLM能否作为世界模拟器? 最近,亚利桑那大学、微软、霍普金斯大学等机构…

飞腾银河麒麟V10安装Todesk

下载安装包 下载地址 https://www.todesk.com/linux.html 安装 yum makecache yum install libappindicator-gtk3-devel.aarch64 rpm -ivh 下载的安装包文件后台启动 service todeskd start修改配置 编辑 /opt/todesk/config/config.ini 移除自动更新临时密码 passupda…

英伟达发布Nemotron-4 340B通用模型:专为生成合成数据设计的突破性AI

引言 2023年6月14日,英伟达发布了Nemotron-4 340B通用模型,专为生成训练大语言模型的合成数据而设计。这一模型可能彻底改变训练大模型时合成数据的生成方式,标志着AI行业的一个重要里程碑。本文将详细介绍Nemotron-4 340B的各个方面&#x…

Vue43-单文件组件

一、脚手架的作用 单文件组件:xxx.vue,浏览器不能直接运行!!! 脚手架去调用webpack等第三方工具。 二、vue文件的命名规则 建议用下面的两种方式。(首字母大写!!!&#x…

CDN简介

CDN 的基本概念 CDN(Content Delivery Network),即内容分发网络。 CDN是一种分布式网络架构:它由分布在不同地理位置的服务器组成网络,这些服务器协同工作以提供内容服务。 内容分发的核心目标 确保用户能够快速、可…

Matlab自学笔记三十一:结构数组的创建、索引和预分配内存

1.概念 结构(structure array)是一种具有容器特性的数据类型,它使用称为字段的数据容器对相关数据进行分组,每个字段可以包含任何类型或大小的数据,所有元素都具有相同数量的字段和相同的字段名称。(与元胞…

Java锁之舞:性能分析与优化之路

目录 一、同步锁性能分析 (一)性能验证说明 1. 使用同步锁的代码示例 2. 不使用同步锁的代码示例 3. 结果与讨论 (二)案例初步优化分析说明 1. 使用AtomicInteger原子类尝试优化分析 2. 对AtomicInteger原子类进一步优化 …

机器学习面试-常见题目

文章目录 一、框架问题1. 监督学习和无监督学习有什么不同?2. 什么是深度学习,它与机器学习算法之间有什么联系?3. 如何评估机器学习模型的有效性?4. 如何确保模型没有过拟合?5. 什么是核技巧,有什么用处&a…

4_机械臂坐标系简介

一、坐标系的标准命名 为了规范起见,有必要给机器人和工作空间专门命名和确定专门的“标准”坐标系。 图3-27为一种典型的工况,机器人抓持某种工具,并把工具末端移动到操作者指定的位置。图3-27所示的5个坐标系就是需要命名的坐标系。这五个坐…

7z及7zip-cpp最高压缩比的免费开源压缩软件

7z介绍 7z是一种主流高效的压缩格式,它拥有极高的压缩比。在计算机科学中,7z是一种可以使用多种压缩算法进行数据压缩的档案格式。该格式最初由7-Zip实现并采用,但这种档案格式是公有的,并且7-Zip软件本身亦在GNU宽通用公共许可证…

PCIe总线-RK3588 PCIe子系统简介(八)

1.PCIe子系统 RK3588 PCIe子系统如下图所示。总共拥有5个PCIe控制器。PCIe30X4(4L)支持RC和EP模式,其他4个仅支持RC模式。ITS port 1连接PCIe30X4(4L)和PCIe30X2(2L)控制器,PCIe30X4(4L)和PCIe30X2(2L)控制器使用PCIe3.0 PIPE PHY。ITS port 0连接PCIe3…

RIP路由附加度量值(华为)

#交换设备 RIP路由附加度量值 RIP(Routing Information Protocol)路由协议中的附加度量值是指在RIP路由原来度量值的基础上所增加的额外度量值,通常以跳数来表示。这个附加度量值可以是正值,也可以是负值,用于影响路…

关于STM32上用HID HOST调鼠标数据的解析

一、前言 关于这章主要是基于我前面的那篇文章 链接: 关于怎么用Cubemx生成的USBHID设备实现读取一体的鼠标键盘设备(改进版) https://blog.csdn.net/qq_29187987/article/details/139535648?spm1001.2014.3001.5501 引用的文章的简介 引用的这篇文…

数据库概述1

数据:描述事物的符号记录称为数据; 包括数字、图片、音频等; 数据库:长期储存在计算机内有组织、可共享的大量数据的集合;数据库中的数据按照一定的数据模型组织、描述和存储,具有较小的数据冗余、较高的数…

STM32学习笔记(一)--时钟树详解

(1)时钟概述;时钟是具有周期性的脉冲信号,最常用的是占空比50%的方波。(时钟相当于单片机的脉搏;STM32本身非常复杂,外设非常的多,为了保持低功耗工作,STM32 的主控默认不…

【Python】深入了解 AdaBoost:自适应提升算法

我们都找到天使了 说好了 心事不能偷藏着 什么都 一起做 幸福得 没话说 把坏脾气变成了好沟通 我们都找到天使了 约好了 负责对方的快乐 阳光下 的山坡 你素描 的以后 怎么抄袭我脑袋 想的 🎵 薛凯琪《找到天使了》 在机器学习的领域中&#x…

算法工程师 | 如何快速 了解,掌握一个算法!脚踏实地,迎着星辰,向前出发 ~

本文是一些碎碎念 希望对正在迈向 算法工程师道路的你 有所裨益 一般来说,代码 中会有很多 算法实现的细节,但论文可能并没有体现,所以能够尝试自己 仔细阅读论文,手动复现代码,基本上来说对 这个 算法 你有了全…

夏季城市环境卫生挑战多:TSINGSEE青犀智慧环卫方案助力城市垃圾站智能管理

一、背景分析 夏季,随着气温的攀升,城市垃圾的数量和种类也随之增加,这给环卫工作带来了极大的挑战。环卫垃圾站点作为城市垃圾处理的重要一环,其管理效率直接关系到城市环境的整洁与卫生。近年来,随着视频监控技术的…

【Redis】Redis常见问题——缓存更新/内存淘汰机制/缓存一致性

目录 回顾数据库的问题如何提高 mysql 能承担的并发量?缓存解决方案应对的场景 缓存更新问题定期生成如何定期统计定期生成的优缺点 实时生成maxmemory 设置成多少合适呢?项目类型上来说 新的问题 内存淘汰策略Redis淘汰策略为什么redis要内存淘汰内存淘…