人工智能算力基础设施成为我国数字经济高质量发展的重要战略部署,具有重大发展意义。
1)算力普适普惠化是大趋势,相关服务生态逐步构建。“东数西算”工程的实施,带动数据、算力跨域流动,实现产业跃升和区域平衡发展。依托智算中心的超大规模预训练能力,各行业人工智能应用将不必从零开始开发,只需结合领域数据进行调整和增量学习,即可形成具有良好精度和性能的下游应用。
2)截至 2023 年 8 月,根据新京智库统计,目前全国至少有 30 座城市已经建成或正在建设智算中心,同时在企业端已有超过 10 座由大型科技企业主导的智算中心。未来随着 AI 快速发展,预计智算中心数量有望快速增加。
全球算力进入新一轮快速发展期
算力是数字时代的新生产力。万物智能时代对计算的需求呈百千倍递增态势,科学研究、人工智能、数字孪生以及元宇宙等新兴领域的快速崛起,推动全球算力规模的快速增长,驱动算力技术与产品的多元创新,带动产业格局的重构重塑,算力成为全球数字经济发展新引擎和各国战略竞争新焦点。
数据量增长带来算力需求提升,智能算力规模有望快速增长
数据海量增加,算法模型愈加复杂,应用场景的深入和发展,带来了对算力需求的快速提升。根据白皮书数据显示,从 2012 年开始的 6 年中, Al 计算的需求增加了 30 万倍。
供给水平大幅提升,先进计算创新成果涌现
算力产业加速壮大升级。经过多年发展,我国已形成体系较完整、规模体量庞大、创新活跃的计算产业,在全球产业分工体系中的重要性日益提升。
截至 2022年 11 月,我国计算产业规模约占电子信息制造业的 20%,规模以上企业 2300 余家,“创新突破、兼容并蓄”的产业发展新格局正加快构建。
一是整机市场不断发展,高性能计算领域,我国超算系统占有量与制造商总装机量均保持全球领先。
二是产业生态不断完善。国产芯片已初具规模,X86、ARM、自主架构 CPU 持续深化规模应用,百度、寒武纪等 AI 芯片加速迭代优化,国产操作系统逐步向金融、电信、医疗等行业应用渗透,鲲鹏生态、PKS 体系等计算产业生态日渐完善,覆盖底层软硬件、整机系统及应用等关键环节。
算力创新能力不断提升。
一是基础软硬件持续突破。互联网厂商加速服务器芯片、AI 芯片自研,阿里推出 CPU 芯片倚天 710,已在阿里云数据中心规模化部署;百度智能云联合昆仑芯推出第二代昆仑芯云服务器,搭载的昆仑芯 2 代 AI 芯片整体性能较上一代提升 2-3 倍。
开源操作系统欧拉加强更新迭代,在安全性、易用性、生态能力上进一步提升,2023 年 12 月,在 2023 开源产业生态大会上,华为终端 BG 软件部总裁龚体介绍称,鸿蒙生态设备总量超过 7 亿台,华为自有设备 3 亿多台。
二是新兴计算平台系统加速布局。新型计算系统结构与系统、新型存储系统、领域专用软硬协同计算系统等成为创新热点方向,华为等企业推出多样性计算融合架构,构建包括编程语言、编译器、加速库、开发框架等在内的多样性计算软件栈,降低多样性算力的开发部署难度,提升多样性算力的应用效能。
三是前沿计算技术多点突破。之江实验室等团队联合研发的量子计算模拟器SWQSIM,基于神威超级计算机,可提供每秒 4.4 百亿亿次的持续计算性能。中国科学技术大学等团队研制的“九章二号”光量子计算机原型机,具备一定编程能力,在图论、量子化学等领域具有应用潜力。
算力需求爆发拉动芯片量价齐升
ChatGPT热潮席卷全球。ChatGPT(Chat Generative Pre-trained Transformer)是由OpenAI于2022年12月推出的对话AI模型,一经面世便受到广泛关注,其2023年1月月活跃用户达到1亿,是史上月活用户增长最快的消费者应用。在问答模式的基础上ChatGPT可以进行推理、编写代码、文本创作等等,这样的特殊优势和用户体验使得应用场景流量大幅增加。
1、▲芯片需求=量↑ x 价↑ , AIGC拉动芯片产业量价齐升
1)量:AIGC带来的全新场景+原场景流量大幅提高。① 技术原理角度:ChatGPT基于Transformer技术,随着模型不断迭代,层数也越来越多,对算力的需求也就越来越大;② 运行条件角度:ChatGPT完美运行的三个条件:训练数据+模型算法+算力,需要在基础模型上进行大规模预训练,存储知识的能力来源于1750亿参数,需要大量算力。
2)价:对高端芯片的需求将拉动芯片均价。采购一片英伟达顶级GPU成本为8万元,GPU服务器成本通常超过40万元。支撑ChatGPT的算力基础设施至少需要上万颗英伟达GPU A100,高端芯片需求的快速增加会进一步拉高芯片均价。
2、ChatGPT的“背后英雄”:芯片,看好国内GPU、CPU、FPGA、AI芯片及光模块产业链
1)GPU:支撑强大算力需求。由于具备并行计算能力,可兼容训练和推理,目前GPU被广泛应用于加速芯片。看好海光信息、景嘉微。
2)CPU:可用于推理/预测。AI服务器利用CPU与加速芯片的组合可以满足高吞吐量互联的需求。看好龙芯中科、中国长城。
3)FPGA:可通过深度学习+分布集群数据传输赋能大模型。FPGA具备灵活性高、开发周期短、低延时、并行计算等优势。看好安路科技、复旦微电、紫光国微。
4)ASIC:极致性能和功耗表现。AI ASIC芯片通常针对AI应用专门设计了特定架构,在功耗、可靠性和集成度上具有优势。看好寒武纪、澜起科技。
5)光模块:容易被忽略的算力瓶颈。伴随数据传输量的增长,光模块作为数据中心内设备互联的载体,需求量随之增长。看好德科立、天孚通信、中际旭创。
1. 算力需求爆发拉动芯片量价齐升
AI计算需要各类芯片支撑
算力需求爆发,芯片量价齐升
AI服务器为算力载体
CPU、GPU、FPGA、ASIC、光模块各司其职
1.1 人工智能四层架构,芯片为底层支撑
1.2 人工智能不同计算任务需要各类芯片实现
1.3 ChatGPT流量激增,为AI服务器带来重要发展机遇
1.4 AI服务器快速增长,大力拉动芯片需求
1.5 AI服务器芯片构成——CPU+加速芯片
1.6 CPU擅长逻辑控制,可用于推理/预测
1.7 服务器CPU向多核心发展,满足处理能力和速度提升需要
1.7 GPU高度适配AI模型构建
1.8 FPGA:可通过深度学习+分布集群数据传输赋能大模型
1.9 ASIC可进一步优化性能与功耗,全球巨头纷纷布局
国内外ASIC芯片龙头布局
随着机器学习、边缘计算、自动驾驶的发展,大量数据处理任务的产生,对于芯片计算效率、计算能力和计能耗比的要求也越来越高,ASIC通过与CPU结合的方式被广泛关注,国内外龙头厂商纷纷布局迎战AI时代的到来。
1.10 数据传输速率:容易被忽略的算力瓶颈
1.11 数据传输核心器件:光模块
2. 技术创新引领本土产业链弯道突围
国产服务器CPU发展之路通过CHIPLET布局先进制程,服务器芯片广泛应用存算一体打破“存储墙”限制,实现降本增效.
2.1 服务器CPU需求增长,国化产三条发展路线
2.2 未来算力升级路径:CHIPLET、存算一体
近期CHATGPT的兴起推动着人工智能在应用端的蓬勃发展,这也对计算设备的运算能力提出了前所未有的需求。虽然AI芯片、GPU、CPU+FPGA等芯片已经对现有模型构成底层算力支撑,但面对未来潜在的算力指数增长,短期使用CHIPLET异构技术加速各类应用算法落地,长期来看打造存算一体芯片(减少芯片内外的数据搬运),或将成为未来算力升级的潜在方式。
2.3 CHIPLET是布局先进制程、加速算力升级的关键技术
Chiplet异构技术不仅可以突破先进制程的封锁,并且可以大幅提升大型芯片的良率、降低设计的复杂程度和设计成本、降低芯片制造成本。Chiplet技术加速了算力升级,但需要牺牲一定的体积和功耗,因此将率先在基站、服务器、智能电车等领域广泛使用。
2.4 CHIPLET已广泛应用于服务器芯片
2.5 存算一体:打破“存储墙”限制,技术迭代演进
2.6 存算一体:更大算力、更高能效、降本增效
存算一体就是存储器中叠加计算能力,以新的高效运算架构进行二维和三维矩阵计算。存算一体的优势包括:
(1)具有更大算力(1000TOPS以上)
(2)具有更高能效(超过10-100TOPS/W),超越传统ASIC算力芯片
(3)降本增效(可超过一个数量级)
推荐书籍:
《分布式商业生态战略:数字商业新逻辑与企业数字化转型新策略》
作者:思二勋
书籍介绍:
本书从新时代商业环境出发,如:元宇宙、Web 3.0、资产数字化、反垄断、要素市场化配置、分布式自治组织(distributed autonomous organization,DAO)、非同质化通证(non-fungible token,NFT)等新市场和新趋势出发,以企业数字化转型为核心,以区块链等数字化技术为基本点,以场景为基本面,勾勒了数字化时代分布式商业演化的新趋势,以及其对企业经营管理的影响,提出了数字化时代企业数字化转型的新策略和分布式经营管理的低成本、高效率发展方案。
分布式商业是数字经济时代的基本商业形态,分布式商业生态战略也是企业数字化生存与发展的基本战略,是企业数字化转型的全新模式和路径,亦是元宇宙商业生态建设的新范式。