【深度】2024AI大模型算力芯片产业深度分析

人工智能算力基础设施成为我国数字经济高质量发展的重要战略部署,具有重大发展意义。

1)算力普适普惠化是大趋势,相关服务生态逐步构建。“东数西算”工程的实施,带动数据、算力跨域流动,实现产业跃升和区域平衡发展。依托智算中心的超大规模预训练能力,各行业人工智能应用将不必从零开始开发,只需结合领域数据进行调整和增量学习,即可形成具有良好精度和性能的下游应用。

2)截至 2023 年 8 月,根据新京智库统计,目前全国至少有 30 座城市已经建成或正在建设智算中心,同时在企业端已有超过 10 座由大型科技企业主导的智算中心。未来随着 AI 快速发展,预计智算中心数量有望快速增加。

全球算力进入新一轮快速发展期

算力是数字时代的新生产力。万物智能时代对计算的需求呈百千倍递增态势,科学研究、人工智能、数字孪生以及元宇宙等新兴领域的快速崛起,推动全球算力规模的快速增长,驱动算力技术与产品的多元创新,带动产业格局的重构重塑,算力成为全球数字经济发展新引擎和各国战略竞争新焦点。

数据量增长带来算力需求提升,智能算力规模有望快速增长

数据海量增加,算法模型愈加复杂,应用场景的深入和发展,带来了对算力需求的快速提升。根据白皮书数据显示,从 2012 年开始的 6 年中, Al 计算的需求增加了 30 万倍。

供给水平大幅提升,先进计算创新成果涌现

算力产业加速壮大升级。经过多年发展,我国已形成体系较完整、规模体量庞大、创新活跃的计算产业,在全球产业分工体系中的重要性日益提升。

截至 2022年 11 月,我国计算产业规模约占电子信息制造业的 20%,规模以上企业 2300 余家,“创新突破、兼容并蓄”的产业发展新格局正加快构建。

一是整机市场不断发展,高性能计算领域,我国超算系统占有量与制造商总装机量均保持全球领先。

二是产业生态不断完善。国产芯片已初具规模,X86、ARM、自主架构 CPU 持续深化规模应用,百度、寒武纪等 AI 芯片加速迭代优化,国产操作系统逐步向金融、电信、医疗等行业应用渗透,鲲鹏生态、PKS 体系等计算产业生态日渐完善,覆盖底层软硬件、整机系统及应用等关键环节。

算力创新能力不断提升。

一是基础软硬件持续突破。互联网厂商加速服务器芯片、AI 芯片自研,阿里推出 CPU 芯片倚天 710,已在阿里云数据中心规模化部署;百度智能云联合昆仑芯推出第二代昆仑芯云服务器,搭载的昆仑芯 2 代 AI 芯片整体性能较上一代提升 2-3 倍。

开源操作系统欧拉加强更新迭代,在安全性、易用性、生态能力上进一步提升,2023 年 12 月,在 2023 开源产业生态大会上,华为终端 BG 软件部总裁龚体介绍称,鸿蒙生态设备总量超过 7 亿台,华为自有设备 3 亿多台。

二是新兴计算平台系统加速布局。新型计算系统结构与系统、新型存储系统、领域专用软硬协同计算系统等成为创新热点方向,华为等企业推出多样性计算融合架构,构建包括编程语言、编译器、加速库、开发框架等在内的多样性计算软件栈,降低多样性算力的开发部署难度,提升多样性算力的应用效能。

三是前沿计算技术多点突破。之江实验室等团队联合研发的量子计算模拟器SWQSIM,基于神威超级计算机,可提供每秒 4.4 百亿亿次的持续计算性能。中国科学技术大学等团队研制的“九章二号”光量子计算机原型机,具备一定编程能力,在图论、量子化学等领域具有应用潜力。

算力需求爆发拉动芯片量价齐升

图片

ChatGPT热潮席卷全球。ChatGPT(Chat Generative Pre-trained Transformer)是由OpenAI于2022年12月推出的对话AI模型,一经面世便受到广泛关注,其2023年1月月活跃用户达到1亿,是史上月活用户增长最快的消费者应用。在问答模式的基础上ChatGPT可以进行推理、编写代码、文本创作等等,这样的特殊优势和用户体验使得应用场景流量大幅增加。

1、▲芯片需求=量↑ x 价↑ , AIGC拉动芯片产业量价齐升

1)量:AIGC带来的全新场景+原场景流量大幅提高。① 技术原理角度:ChatGPT基于Transformer技术,随着模型不断迭代,层数也越来越多,对算力的需求也就越来越大;② 运行条件角度:ChatGPT完美运行的三个条件:训练数据+模型算法+算力,需要在基础模型上进行大规模预训练,存储知识的能力来源于1750亿参数,需要大量算力。

2)价:对高端芯片的需求将拉动芯片均价。采购一片英伟达顶级GPU成本为8万元,GPU服务器成本通常超过40万元。支撑ChatGPT的算力基础设施至少需要上万颗英伟达GPU A100,高端芯片需求的快速增加会进一步拉高芯片均价。

2、ChatGPT的“背后英雄”:芯片,看好国内GPU、CPU、FPGA、AI芯片及光模块产业链

1)GPU:支撑强大算力需求。由于具备并行计算能力,可兼容训练和推理,目前GPU被广泛应用于加速芯片。看好海光信息、景嘉微。

2)CPU:可用于推理/预测。AI服务器利用CPU与加速芯片的组合可以满足高吞吐量互联的需求。看好龙芯中科、中国长城。

3)FPGA:可通过深度学习+分布集群数据传输赋能大模型。FPGA具备灵活性高、开发周期短、低延时、并行计算等优势。看好安路科技、复旦微电、紫光国微。

4)ASIC:极致性能和功耗表现。AI ASIC芯片通常针对AI应用专门设计了特定架构,在功耗、可靠性和集成度上具有优势。看好寒武纪、澜起科技。

5)光模块:容易被忽略的算力瓶颈。伴随数据传输量的增长,光模块作为数据中心内设备互联的载体,需求量随之增长。看好德科立、天孚通信、中际旭创。

1.  算力需求爆发拉动芯片量价齐升

AI计算需要各类芯片支撑

算力需求爆发,芯片量价齐升

AI服务器为算力载体

CPU、GPU、FPGA、ASIC、光模块各司其职

1.1 人工智能四层架构,芯片为底层支撑

图片

1.2 人工智能不同计算任务需要各类芯片实现

图片

1.3 ChatGPT流量激增,为AI服务器带来重要发展机遇

图片

1.4 AI服务器快速增长,大力拉动芯片需求

图片

1.5 AI服务器芯片构成——CPU+加速芯片

图片

1.6 CPU擅长逻辑控制,可用于推理/预测

图片

1.7 服务器CPU向多核心发展,满足处理能力和速度提升需要 

图片

1.7 GPU高度适配AI模型构建 

图片

1.8 FPGA:可通过深度学习+分布集群数据传输赋能大模型

图片

1.9 ASIC可进一步优化性能与功耗,全球巨头纷纷布局

国内外ASIC芯片龙头布局

随着机器学习、边缘计算、自动驾驶的发展,大量数据处理任务的产生,对于芯片计算效率、计算能力和计能耗比的要求也越来越高,ASIC通过与CPU结合的方式被广泛关注,国内外龙头厂商纷纷布局迎战AI时代的到来。

图片

1.10 数据传输速率:容易被忽略的算力瓶颈

图片

1.11 数据传输核心器件:光模块

图片

2. 技术创新引领本土产业链弯道突围

国产服务器CPU发展之路通过CHIPLET布局先进制程,服务器芯片广泛应用存算一体打破“存储墙”限制,实现降本增效.

2.1 服务器CPU需求增长,国化产三条发展路线

图片

2.2 未来算力升级路径:CHIPLET、存算一体

近期CHATGPT的兴起推动着人工智能在应用端的蓬勃发展,这也对计算设备的运算能力提出了前所未有的需求。虽然AI芯片、GPU、CPU+FPGA等芯片已经对现有模型构成底层算力支撑,但面对未来潜在的算力指数增长,短期使用CHIPLET异构技术加速各类应用算法落地,长期来看打造存算一体芯片(减少芯片内外的数据搬运),或将成为未来算力升级的潜在方式。

图片

2.3 CHIPLET是布局先进制程、加速算力升级的关键技术

Chiplet异构技术不仅可以突破先进制程的封锁,并且可以大幅提升大型芯片的良率、降低设计的复杂程度和设计成本、降低芯片制造成本。Chiplet技术加速了算力升级,但需要牺牲一定的体积和功耗,因此将率先在基站、服务器、智能电车等领域广泛使用。

图片

2.4 CHIPLET已广泛应用于服务器芯片 

图片

2.5 存算一体:打破“存储墙”限制,技术迭代演进

图片

图片

2.6 存算一体:更大算力、更高能效、降本增效

存算一体就是存储器中叠加计算能力,以新的高效运算架构进行二维和三维矩阵计算。存算一体的优势包括:

(1)具有更大算力(1000TOPS以上)

(2)具有更高能效(超过10-100TOPS/W),超越传统ASIC算力芯片

(3)降本增效(可超过一个数量级)

图片

图片

推荐书籍:
《分布式商业生态战略:数字商业新逻辑与企业数字化转型新策略》

作者:思二勋

书籍介绍:
本书从新时代商业环境出发,如:元宇宙、Web 3.0、资产数字化、反垄断、要素市场化配置、分布式自治组织(distributed autonomous organization,DAO)、非同质化通证(non-fungible token,NFT)等新市场和新趋势出发,以企业数字化转型为核心,以区块链等数字化技术为基本点,以场景为基本面,勾勒了数字化时代分布式商业演化的新趋势,以及其对企业经营管理的影响,提出了数字化时代企业数字化转型的新策略和分布式经营管理的低成本、高效率发展方案。

分布式商业是数字经济时代的基本商业形态,分布式商业生态战略也是企业数字化生存与发展的基本战略,是企业数字化转型的全新模式和路径,亦是元宇宙商业生态建设的新范式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/49724.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

谷粒商城实战笔记-46-商品服务-API-三级分类-配置网关路由与路径重写

文章目录 一,准备工作1,新增一级菜单2,新增二级菜单 二,前端树形界面开发1,开发分类展示组件 三,远程调用接口获取商品分类数据1,远程调用2,路由配置 错误记录 本节的主要内容&#…

【算法/训练】:动态规划

一、路径类 1. 字母收集 思路: 1、预处理 对输入的字符矩阵我们按照要求将其转换为数字分数,由于只能往下和往右走,因此走到(i,j)的位置要就是从(i - 1, j)往下走&#x…

MySQL 约束 (constraint)

文章目录 约束(constraint)列级约束和表级约束给约束起名字(constraint)非空约束(no null)检查约束(check)唯一性约束 (unique)主键约束 (primary key)主键分类单一主键复合主键主键自增 (auto_increment) 外键约束外什…

C++树形结构(总)

目录 一.基础: 1.概念: 2.定义: Ⅰ.树的相关基础术语: Ⅱ.树的层次: 3.树的性质: 二.存储思路: 1.结构体存储: 2.数组存储: 三.树的遍历模板: 四.…

学习笔记-系统框图简化求传递函数公式例题

简化系统结构图求系统传递函数例题 基础知识回顾 第四讲 控制系统的方框图 (zhihu.com) 「自控原理」2.3 方框图的绘制及化简_方框图化简-CSDN博客 自动控制原理笔记-结构图及其等效变换_结构图等效变换-CSDN博客 例子一 「自控原理」2.3 方框图的绘制及化简_方框图化简-CS…

7-20FPGA调试日志

1. 在代码里面定义的ILA的变量名称与波形抓取界面的不一致 问题描述 ::: 2. 直接从其他的播放声音的平台放音乐没问题,但是从AU里面生成的2kHz的正弦波放不出声音 演示视频链接 好像和ILA的例化信号有关,例化ILA信号的驱动时钟信号频率没有内部的其他…

dockerfile部署wordpress

1.将容器直接提交成镜像 [rootlocalhost ~]# docker commit 8ecc7f6b9c12 nginx:1.1 sha256:9a2bb94ba6d8d952527df616febf3fbc8f842b3b9e28b7011b50c743cd7b233b [rootlocalhost ~]# docker images REPOSITORY TAG IMAGE ID CREATED SIZE nginx …

C语言 数据存储之结构类型 万字讲解#数据类型详细介绍 #整型在内存中的存储 #大小端字节序 #浮点型在内存的存储解析

文章目录 目录 前言 一、数据类型详细介绍 类型的意义: 1、类型的基本归类 a.整型家族 b.浮点型家族 c.构造类型 数组类型 结构体类型 struct 枚举类型 enum 联合类型 union d.指针类型 e.空类型 二、整型在内存中的存储 三、大小端字节序 什么是…

MySql性能调优05-[sql实战演练]

sql实战演练 行列转换行列式转换第一题【列转行】第二题【列转行】 having的使用找到表中,名字重复的项有数据表employee,包含如下字段id、name、department、age,编写SQL,找到不与其他人同龄的年纪最大的员工的年龄有数据表emplo…

ModelArts中sinh算子的开发

一、环境配置 1、创建notebook并连接 使用ModelArts新建一个notebook,我这里镜像选择第一个,里面含有cann和Ascend910处理器,我这里环境只能使用ssh连接,创建一个密钥对,保存到C盘中的user/Administrator/目录下。 在网页中选择使用vscode接入,等待vscode打开后,选择密…

PotatoTool 蓝队版 V1.3 发布:增强功能和性能优化

一、简介 经过广大网友的反馈和建议,我们对V1.1版本中存在的问题进行了优化。其中,我们针对MD5库进行了本地化处理,以提高查询效率。然而,这也导致了软件体积的飙升。二、优化概述 1、兼容性 兼容arm架构系统 2、UI 2.1 界面…

Linux磁盘扩容lvm

目录 Linux磁盘管理基础知识介绍 1.确认分区类型 2.添加新硬盘 3.给新硬盘添加分区 (2)指定分区类型 4.创建物理卷 5.创建卷组 6.扩展逻辑卷 7.刷新文件系统 (1)查看文件系统 xfs文件系统使用(centos&#…

【YOLOv8系列】图像分类篇----通过YOLOv8实现图像分类功能

最近需要使用YOLOv8对自己的数据集进行训练,从而实现图像分类的功能,因此记录一下整个过程。 YOLOv8的github地址:https://github.com/ultralytics/ultralytics 参考链接:超详细YOLOv8图像分类全程概述:环境、训练、验证与预测详解 文章目录 一、YOLOv8环境搭建二、准备…

80. 删除有序数组中的重复项 II【 力扣(LeetCode) 】

一、题目描述 给你一个有序数组 nums ,请你 原地 删除重复出现的元素,使得出现次数超过两次的元素只出现两次 ,返回删除后数组的新长度。 不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用 O(1) 额外空间的条件下完成…

docker部署mysql8.x版本,shell脚本字段部署安装mysql

docker部署mysql8.x版本&#xff0c;shell脚本字段部署安装mysql **1.**先自行安装好docker环境&#xff0c;docker的镜像注册中心最好是国内的&#xff0c;例如执行一下命令直接修改docker配置&#xff0c; cat <<EOF > /etc/docker/daemon.json {"registry-m…

深入理解算数表达式求值:后缀表达式的转换与计算

归纳编程学习的感悟&#xff0c; 记录奋斗路上的点滴&#xff0c; 希望能帮到一样刻苦的你&#xff01; 如有不足欢迎指正&#xff01; 共同学习交流&#xff01; &#x1f30e;欢迎各位→点赞 &#x1f44d; 收藏⭐ 留言​&#x1f4dd;没人会嘲笑竭尽全力的人&#xff01; 前…

PT2262-IR

PT2262是一款很古老的编码芯片&#xff0c;其兼容型号有&#xff1a;SC2262&#xff0c;AD2262&#xff0c;SC2260(需改变匹配电阻)等。 依据其datasheet&#xff0c;PT2262射频模式工作原理: CODE BITS A Code Bit is the basic component of the encoded waveform, and ca…

34_YOLOv5网络详解

1.1 简介 YOLOV5是YOLO&#xff08;You Only Look Once&#xff09;系列目标检测模型的一个重要版本&#xff0c;由 Ultralytics 公司的Glenn Jocher开发并维护。YOLO系列以其快速、准确的目标检测能力而闻名&#xff0c;尤其适合实时应用。YOLOV5在保持高效的同时&#xff0c…

LeetCode/NowCoder-二叉树OJ练习

励志冰檗&#xff1a;形容在清苦的生活环境中激励自己的意志。&#x1f493;&#x1f493;&#x1f493; 目录 说在前面 题目一&#xff1a;单值二叉树 题目二&#xff1a;相同的树 题目三&#xff1a;对称二叉树 题目四&#xff1a;二叉树的前序遍历 题目五&#xff1a;另…

鸿蒙OpenHarmony Native API【drawing_path.h】 头文件

drawing_path.h Overview Related Modules: [Drawing] Description: 文件中定义了与自定义路径相关的功能函数 Since: 8 Version: 1.0 Summary Functions FunctionDescription[OH_Drawing_PathCreate] (void)[OH_Drawing_Path] * 函数用于创建一个路径对象OH_Drawin…