01
中国AI算力核心产业现状
随着人工智能技术的快速发展和广泛应用,AI算力已成为推动数字经济和科技创新的关键基础设施。2024年,中国AI算力核心产业规模持续扩大,在全球AI发展格局中占据重要地位,中国AI算力核心产业规模达到约2.5万亿元人民币,同比增长25%。这一规模包括AI芯片、AI服务器、AI云计算平台、AI开发框架等核心硬件和软件产业。与2020年相比,产业规模扩大了近3倍,年均复合增长率超过30%,展现出巨大的发展潜力和市场活力。
AI芯片作为算力的核心组件,是整个产业链的基础。2024年,中国AI芯片产业规模突破4000亿元,其中包括GPU、FPGA、ASIC等多种类型的AI专用芯片。国产AI芯片厂商如华为海思、寒武纪、比特大陆等在技术创新和市场份额方面取得显著进展,逐步缩小与国际领先企业的差距。
在技术创新方面,2024年中国AI算力产业取得多项突破。国产7纳米AI芯片实现量产,算力密度和能效比大幅提升,光子计算、类脑计算等新型计算技术在实验室阶段取得重要进展,面向大规模语言模型的分布式训练系统支持百万亿参数级模型的高效训练。
极客天成为大规模AI模型训练平台项目提供底层存储基础设施,为训练大语言模型所需的海量数据提供高性能、高可靠性的分布式存储系统。极客天成存储为AI数据处理进行专门优化,开发针对大语言模型数据处理的优化存储策略,提高数据读写效率,并为训练好的大语言模型提供高效的存储和快速调用方案。 作为存储领域的专业公司,极客天成具有AIGC领域的国内大型项目的成功经验,通过自主研发的分布式存储系统进一步推进国内大语言模型存储技术的发展。
02
极客天成千卡AIGC项目案例
图:极客天成全闪存储打造千卡AIGC项目
Al大语言模型训练项目,使用千卡级别GPU训练集群,Infiniband网络。极客天成为该项目提供分布式Al集群存储。算力池硬件配置1200颗GPU算力,200Gb IB网络,2.8PB NVMe 全闪Al集群存储。
03
极客天成存储技术支撑大规模AI模型训练
极客天成全闪可支持 200/400Gbps InfiniBand 高速网络,具有高速度和低延迟的性能特性,能够支撑大规模AI模型训练场景的存储需求。计算节点与存储节点间通过Infiniband/ROCE交换机互联,每个节点通过双链路实现400/800Gbps的IO带宽和微秒级时延,消除了传统架构的传输瓶颈。
极客天成全闪技术具有海量数据存储,横向扩展能力使得极客天成全闪能够应对不断增长的数据量需求,为智算平台提供庞大的数据存储空间。
极客天成存储具有灵活的扩容能力并提供全冗余部署,数据多副本存储,每个 I/O 都需要进行数据校验,保证数据高度一致性。所有节点均为冗余设计,不会因为单硬盘故障、单个节点故障、单台交换机故障导致业务停顿或数据丢失。
极客天成存储支持POSIX标准,能兼容适配HDFS,K8S等分布式平台,提升了AI数据处理的效率,也能根据业务场景更换合适的数据存储方式。
极客天成的存储产品还全面支持国产化。开放兼容,支持通用硬件、计算节点、存储节点、SSD、Infiniband/ROCE 交换机全部选用标准成熟部件,无任何工业定制。支持多种操作系统,包括信创操作系统、麒麟操作系统、欧拉操作系统,信创CPU支持海光、鲲鹏、飞腾等,确保了与主流国产平台的无缝兼容。