我们距离AGI还有多远?

关于HBM那份纪要的其他反馈

上篇文章发了一篇HBM纪要小部分内容(星球更新了另一部分),收到很多业内大佬们的反馈,包括颗粒计算、封装订单划分等等,以及是不是某通某电的一个专家。其中倒是出现一个非共识的说法,引用下:

“XX现在其实还做不出,或者说技术还落后,技术底子还是差了点。反而另一家YY的HBM和DRAM进展不错在one厂完成了小规模量产,third期除了GKJ其他可以实现100%国产。两家给了国产几大设备厂大量研发攻坚任务,尤其是TSV高深宽比和孔内镀膜,技术难度和价值量最大。”

某家Broker sales评论美股

2月份的科技资金流入由PANW和NVDA引领,这两家公司成为我们客户当月买入最多的单一股票。此外,在被动投资科技方面非常活跃,因为QQQ达到了多年来的月度流入高点,我们客户的流入量也达到2021年9月以来最高。M7继续带领标普500的上涨是否可持续?在2023年的前三个季度,SPX的上涨(+11.7%)中94%来自M7的推动(+11.0%),这意味着剩下的493只股票基本每涨。但自2023年10月以来,M7的贡献下降到了35%,M7上涨了25.3%,为SPX的反弹贡献了6.4%,而剩下的493只股票上涨了16.1%,为SPX的反弹贡献了12.0%。从产业角度,现在可能是AI行情的初期,可以想想1990年代初的早期互联网时代、以及1990年代末的dot.com时代,每个阶段都持续了多年。实际上,围绕M7的乐观情绪有助于改善整体市场情绪,就比如最近的上涨已经扩大到M7之外的科技股。从资金看,美国共同基金在2月转为流入,SPX前50股票在2月至今的每一天都是positive call skew,意味着个人投资者的乐观情绪,在为看涨期权支付溢价。此外个人投资者在16个月连续卖出之后1月转为买入,2月继续呈现买入,且他们自2022年5月以来的95周中有93周都在积累现金,总计9660亿美元,如果利率开始下降,有很大的空间将资金转移到股票。但另一方面,不确定来自FOMC 3月20日的下一次会议。

MS拍的世芯Alchip的收入拆分

说实话,如果你去考古比如2010年前Wallstreet对谷歌meta apple之类的预测模型,和今天实际对比下,会发现错得离谱,为啥,线性预测,你我本能的思维方式,但大家也知道,事物的发展一定是非线性的。因此你说AWS给500、750、然后到25年可能的确小年放个800,再然后呢?从scaling law本身指数型算力需求+推理占比提升+自制需求提升+未来某一天cowos放量,我不太买账这种线性外推拍出来的数(虽然我心里也没个准...),但隐约感觉大方向是继续上调。何况你也不知道有什么新增客户后面会冒出来,这些都不可预测。有时候得接受预测的无能...

戴尔电话会透露英伟达B200

戴尔CFO替英伟达“非官方”披露了B200发布时间为2025年(如下图)。按照H100和H200的时间差也差不多(H100 是22年GTC H200是 23年11月)这也不算什么惊喜,市场对B200也有预期,只不过这是第一次被产业链公司公开提及。另一个重点是提到B200功耗会在1000W以上(H100是700W),且CFO来了句“你真的不需要直接液冷来达到这种能量密度”。Tom' Hardware刚刚发了文章对此做了分析,按照散热的普遍系数,芯片面积的散热通常最高约为每平方毫米 1W,而B系列双芯片设计,面积妥妥上1500平方毫米了,因为3nm,可能再打个折,1000W-1500W之间。但按照CFO下面的话,直接浸润式液冷也不是必须,综合考虑前后成本投入和技术成熟度,估计B系列上冷板、风冷也还会持续一段时间虽然一定是未来,但也需要给产业点时间。另一位大佬说B100会降频控在700W。

退一步看目前的市场,现在叙事的确朝着马斯克之前的暴论方向走,“现在是算力紧缺,未来是电力紧缺(PUE)”,step down transformer、cooling、IDC租赁、存储、甚至可能蔓延到IDC相关的各种基础设施。也就是Gavin Baker说的,“相比于软件,更多对AI的追逐转向了Power、utility、industrials等等”  2月份软件指数+2%,而SOX+15%(from F姐)。

Altimeter Jamin Ball 谈软件复苏

第四季度的ARR净新增创新高,从一些已经发报的公司earning上得到了验证,开始看到宏观逆风的减弱。从业绩和股价反应来看,FOMO的情绪在Software一点不比semi和hardware差,除了业绩miss太多的(SNOW),以及突然来个惊吓的(PANW)...但你看PANW之后修复,所以你说SNOW会怎么走?

关于推理芯片的一篇长文,提炼下干货:

OpenAI把复杂精细的算法管理变成了Self Attention这种简单算法+硬件暴力堆料的方式搞成了,直接O(n^2)的方式算上下文关联度就完事儿了,于是实现AGI的问题很大一部分简化成了芯片和系统设计的Scaling问题了,而芯片行业恰恰是人类所有工业体系里面Scaling技能点最牛逼的,等上下文长度Scaling起来又能把AGI涌现到什么程度我都不敢想。

注:1.解释了芯片在这次AGI淘金中的价值;2. 部分解释了为什么说scaling law可以通往AGI

未来长远来看,MOE和KV稀疏化是加速AGI Scaling从算法层面最有效的途径,其实也是从粗放式逐渐过渡到精细化管理静态和动态权重,从而可以创造在芯片Scaling基础上进一步更快加速超长上下文和超大模型的低成本Scaling,而对于硬件的容量需求会进一步扩大,同时随着稀疏化程度提高,使得Memory Hierarchy可能重新变得在系统层级更有意义

今天的Infra层面还远没有演进到对硬件系统如此高效的程度,多模态进一步加剧复杂程度。不同模态的流量潮汐、计算特点以及计算、内存、带宽资源占用情况,都会进一步加剧整个系统对于弹性的需求。

实际上LLM的推理对Infra层面的调度设计的复杂性压根不在transformer本身,而是在“大”模型产生的各自带宽流量问题,精细化利用高速内存和带宽资源催生的潜在的算子需求也已经开始爆炸,甚至复杂度是远高于原先的朴素算子的。这些算子和调度分别是在微观层面和宏观层面对硬件资源的极致利用,在今天这种对算力、带宽、容量、互联需求全都拉爆的应用上,这种极致利用会变得更加重要。而这些复杂的软件系统对LLM系统的设计增加了巨大的难度和工作量,似乎给所有NVidia的竞争者设置一层层障碍

所以实际上NVidia对大模型推理这种对算力、内存容量、内存带宽、互联带宽、IO带宽、灵活性、可编程性都提出了极其变态的需求的场景应对方案就是在这些维度都做到第一,以一种统一的芯片形态保证了在综合维度的竞争力,当然这也是NVidia对于所有场景的统一策略,这个策略当然没错,NVidia今天大力提升显存带宽也是为了绞杀AMD在这两个维度的短期优势。

Alex Irpan的《我们距离AGI还有多远?》 from拾象

越来越多证据表明,即使仅通过计算规模增加和使用正确数据集,也能把不成熟的技术原型转化为成熟的产品。我现在完全信仰计算的力量,并且认为要想实现AGI,计算的占比是80%,剩下20%是理论创新。

如果模型不会陷入自我复制的循环,模型进步最终将不再取决于人类的智力努力,而是取决于投入到系统中的FLOPs计算资源的数量。即使合成标签(synthetic labels)比真实标签准确度更差,但它的成本也低,能大量用于模型训练。我认为未来合成数据和模型自我监督都会投入使用,到时的场景也许是这样:人类的直接反馈仅仅被用来引导或初始化奖励模型,或者对已有的数据进行合理性检查,而不是直接被用来训练模型。其他一切都将由模型自主生成和自我监督,然后不断反馈,不再依赖于人类直接的指导或监督。

在AI领域,模型永远无法完全实现人们的所有预期,但模型的能力却在持续扩展,而且从不倒退。今天的AI技术水平将会是未来几年的低点,因为AI还会继续进化。即使所有VC都失败,LLM不再流行,我们依然拥有了目前已经训练好的模型和衍生出的思想。技术的发展是不可逆转的,我们都应该好好思考这一点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/720431.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【论文阅读】TensoRF: Tensorial Radiance Fields 张量辐射场

发表于ECCV2022. 论文地址:https://arxiv.org/abs/2203.09517 源码地址:https://github.com/apchenstu/TensoRF 项目地址:https://apchenstu.github.io/TensoRF/ 摘要 本文提出了TensoRF,一种建模和重建辐射场的新方法。不同于Ne…

Python字符串中%d,%.f的用法

在字符串中,我们经常需要改变其中的一些几个字符,比如 第一个d%就是epoch1,会随着epoch的变化而变化。同理,后面的也是。打印出的结果就是 其中,epoch迭代了3次,从0开始。会发现 d%,是整数&…

12-Java享元模式 ( Flyweight Pattern )

Java享元模式 摘要实现范例 享元模式(Flyweight Pattern)主要用于减少创建对象的数量,以减少内存占用和提高性能 享元模式尝试重用现有的同类对象,如果未找到匹配的对象,则创建新对象 享元模式属于结构型模式&…

开发一套小程序所需的费用取决于多个因素

随着移动互联网的发展,小程序已经成为许多企业和个人推广业务和服务的重要工具。 不过,对于很多想要开发小程序的人来说,最大的疑问就是开发一套小程序要花多少钱。 这个问题的答案并不是固定的,因为开发一个小程序的成本取决于几…

一条SQL引起的系统不可用

一.前言 最近在运维系统,系统对客端突然报了403错误,从后台看发现了大量的慢SQL,导致查询超时,仔细分析我从来没见过那么厚颜无耻的SQL,一条SQL语句关联了一个大表(6000数据)查询了10次。我也很…

IM聊天交友APP源码IM带音视频Uniapp即时通讯安卓苹果APP修改二开

前端开发语言:VUE( 安卓,IOS,WEB为一套前端代码) 服务器端开发语言: PHPWebSocket 数据库:MySql mongodb 前端打包工具:Hbuilder 服务器搭建工具:宝塔 Xshell 短信接口: 支持…

虚拟机 CentOS 7 安装

1. 新建虚拟机 2. 选择ISO映像文件 3. 开启虚拟机 进入后回车 等待至此页面,进行配置 软件选择 图形化界面(可选择是否安装) 系统分区 按需求分配大小 4. 开始安装 配置完毕后开始安装 ROOT密码 创建用户 安装完重启即可 5. 启动虚拟机 输入刚…

ARM-v7 GCC 环境下的大小端转换实现

1.前言 什么是大小端转换?为什么叫大小端转换? Jonathan Swift的《格列佛游记》中记载,有两国因为剥鸡蛋的方式不同,即一国要求将熟鸡蛋的较大的一端(大端,big endian)敲碎然后剥壳,…

jmeter 业务顺序执行(串行、并行)

简介 当我们在应对某些性能需求时,比如要求测试单个业务串行或并行的响应时间。如果直接设定线程组业务的话,jmeter 会将某个线程组下面的全部业务一起执行,在这种情况下的响应时间是不符合要求的,所以需要勾选指定参数或设置其他…

器件选型【电容,电阻篇】

电阻篇: 一句话先做总结:电阻的选型主要考虑额定电压和过流能力(基于封装大小) 电阻封装规格越大功率越大。但其功率也与温度有关,如果温度超过 70℃,其额定功率是会下降的。并且,R01005 和 R0…

VUE3项目学习系列--element-plus集成(三)

1、安装依赖 Element-plus官网:快速开始 | Element Plus (element-plus.org) pnpm i element-plus 在项目main.ts中引入element-plus: import { createApp } from "vue"; import App from "./App.vue"; // 从Element官网上参考,…

python识别并控制操作已打开的浏览器进行自动化测试

前提:已安装python和selenium 一、将浏览器以debugger模式打开 打开方法: 1.右击浏览器,选择属性: 2.在目标中加上 --remote-debugging-port9222 --user-data-dir"C:\selenum\AutomationProfile" 二、识别代码 from…

Java基础(5) 泛型 日期和时间 线程 File-输入流

泛型 java的泛型有点像ts的泛型 public class ArrayList<T> {private T[] array;private int size;public void add(T e) {...}public void remove(int index) {...}public T get(int index) {...} }// 创建可以存储String的ArrayList: ArrayList<String> strLis…

codeTop01:LRU (最近最少使用) 缓存的实现

问题 请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。 实现 LRUCache 类&#xff1a; ● LRUCache(int capacity) 以 正整数 作为容量 capacity 初始化 LRU 缓存 ● int get(int key) 如果关键字 key 存在于缓存中&#xff0c;则返回关键字的值&#xff0c;…

opencart3 添加速卖通商品脚本

非爬虫&#xff0c;只能把速卖通商品信息拿下来解析插入到自己的项目里。 刚接触opencart3没多久&#xff0c;有一些新项目需要添加商品&#xff0c;每次手动从速卖通复制信息又很慢&#xff0c;就自己写了一个脚本。 思路&#xff1a;速卖通商品详情页有一段数据包含了几乎所…

初识Hive

官网地址为&#xff1a; Design - Apache Hive - Apache Software Foundation 一、架构 先来看下官网给的图&#xff1a; 图上显示了Hive的主要组件及其与Hadoop的交互。Hive的主要组件有&#xff1a; UI&#xff1a; 用户向系统提交查询和其他操作的用户界面。截至2011年&…

基于STC12C5A60S2系列1T 8051单片机的TM1638键盘数码管模块的按键扫描、数码管显示按键值、显示按键LED应用

基于STC12C5A60S2系列1T 8051单片机的TM1638键盘数码管模块的按键扫描、数码管显示按键值、显示按键LED应用 STC12C5A60S2系列1T 8051单片机管脚图STC12C5A60S2系列1T 8051单片机I/O口各种不同工作模式及配置STC12C5A60S2系列1T 8051单片机I/O口各种不同工作模式介绍TM1638键盘…

C# WinForm AndtUI第三方库 Tree控件使用记录

环境搭建 1.在NuGet中搜索AndtUI并下载至C# .NetFramework WinForm项目。 2.添加Tree控件至窗体。 使用方法集合 1.添加节点、子节点 using AntdUI; private void UpdateTreeView() {Tree tvwTestnew Tree();TreeItem rootTreeItem;TreeItem subTreeItem;Dictionary<str…

高级软件开发知识点

流程 算法题简历上项目用到技术、流程、遇到问题HR 准备 常考的题型和回答思路刷100算法题&#xff0c;理解其思想&#xff0c;不要死记最近一家公司所负责的业务和项目&#xff1a; 项目背景、演进之路&#xff0c;有哪个阶段&#xff0c;每个阶段主要做什么项目中技术选型…

STM32 TIM编码器接口

单片机学习&#xff01; 目录 文章目录 前言 一、编码器接口简介 1.1 编码器接口作用 1.2 编码器接口工作流程 1.3 编码器接口资源分布 1.4 编码器接口输入引脚 二、正交编码器 2.1 正交编码器功能 2.2 引脚作用 2.3 如何测量方向 2.4 正交信号优势 2.5 执行逻辑 三、编码器定时…