华为芯片与系统详细梳理--Kirin麒麟 & Ascend昇腾 & Kunpeng鲲鹏 & HarmonyOS鸿蒙 & Euler欧拉
- 1 概述
- 2 芯片
- 2.1 整体描述
- 麒麟芯片(To C)【面向智能终端】
- 昇腾芯片【面向AI计算】
- 鲲鹏芯片【面向通用计算】
- 2.2 细分系列
- 麒麟芯片(To C)与产品
- 昇腾芯片与产品
- 鲲鹏芯片与产品
- 2.3 详细介绍
- 昇腾
- 3 系统
- 3.1 整体描述
- 鸿蒙系统(To C)
- 欧拉操作系统(openEuler)
- 4 算力底座(以鲲鹏+昇腾作为算力底座)
- 5 算力网络架构创新,打造全网一台计算机
- 6 杂记
- TeraOPS(TOP)与 TeraFLOPS 区别
- 芯片对比
- 关键计算芯片华为全自研
- Hi1910 与 Ascend 310芯片 关系
- 参考
1 概述
华为致力于构建算力底座和系统软件生态,本文做了梳理。
2 芯片
华为芯片分多个系列:有麒麟、昇腾、鲲鹏,还有鸿鹄等。
2.1 整体描述
麒麟芯片(To C)【面向智能终端】
是华为用于智能手机的芯片解决方案,采用了华为海思先进的SoC架构和领先的生产技术。麒麟芯片主要面向高端旗舰手机市场,提供了强大的处理能力和优秀的功耗控制。
昇腾芯片【面向AI计算】
是华为推出的两款人工智能处理器,包括昇腾910和昇腾310。这些芯片主要面向人工智能领域,提供了强大的算力支持,可以广泛应用于各种AI应用场景。
鲲鹏芯片【面向通用计算】
是华为推出的服务器芯片,主要应用于数据中心和云计算领域。鲲鹏芯片采用了先进的制程技术和架构设计,提供了出色的性能和能效比。
2.2 细分系列
麒麟芯片(To C)与产品
- 麒麟旗舰系列芯片
- 麒麟中高端系列芯片
- 产品
各类高中低端手机、平板等。
昇腾芯片与产品
-
芯片
Ascend 310
Ascend 710
Ascend 910 -
产品
Atlas系列模块、板卡、小站、服务器、集群等产品。
RC(Root Complex)模式【主站】 & EP(End Point)模式【从站】
- 产业
- 生态
- 大模型
- Atlas人工智能计算解决方案
鲲鹏芯片与产品
- 芯片
鲲鹏 920
- 产品
TaiShan服务器、鲲鹏主板及开发套件
- 生态
2.3 详细介绍
昇腾
昇腾芯片上集成了AI CORE、AI CPU和CPU。其中,AI CORE负责大型Tensor Vector运算,AI CPU负责标量运算,CPU负责逻辑控制和任务分发。
AI Core负责执行标量、向量和张量相关的计算密集型算子,包括三种基础计算单元:Cube(矩阵)计算单元、Vector(向量)计算单元和Scalar(标量)计算单元,同时还包含存储单元(包括硬件存储和用于数据搬运的搬运单元)和控制单元。
3 系统
华为有两大系列:鸿蒙和欧拉
3.1 整体描述
鸿蒙系统(To C)
是华为开发的分布式操作系统,旨在实现跨设备的无缝连接和协同工作。鸿蒙系统可以应用于手机、平板、电视等多种设备,为用户带来更加便捷的使用体验。
欧拉操作系统(openEuler)
是华为面向数字基础设施的操作系统,支持服务器、云计算、边缘计算等多种应用场景。欧拉操作系统致力于提供安全、稳定、易用的操作系统,支持多样性计算,推动企业数字基础设施软硬件、应用生态繁荣发展。
4 算力底座(以鲲鹏+昇腾作为算力底座)
5 算力网络架构创新,打造全网一台计算机
6 杂记
TeraOPS(TOP)与 TeraFLOPS 区别
TeraOPS (Tera Operations per Second):【缩写TOP】
TeraOPS 是每秒进行的操作数(OPS)的单位,其中“Tera”表示 10^12(即一万亿)。
它通常用于描述处理器或计算机系统的整体性能,但具体的“操作”类型可能因上下文而异。
TeraFLOPS (Tera Floating-Point Operations per Second):
TeraFLOPS 是每秒浮点运算次数(FLOPS)的单位,其中“Tera”同样表示 10^12。
它专门用于描述系统在进行浮点运算(如科学计算、图形渲染等)时的性能。浮点运算是计算机中用于表示实数(如小数和分数)的运算。
芯片算力指标一般使用TeraOPS(Tera Operations per Second)而不是TeraFLOPS(Tera Floating-Point Operations per Second)的原因,主要是两者在定义和用途上有所不同。
首先,TeraOPS是一个更通用的度量单位,它表示每秒进行的操作数,这里的“操作”可以是任何类型的计算任务,包括整数运算、逻辑运算等,而不仅仅是浮点运算。这使得TeraOPS在评估芯片的整体性能时更为全面。
而TeraFLOPS则专门用于描述系统在进行浮点运算时的性能。浮点运算是计算机中用于表示实数(如小数和分数)的运算,在科学计算、图形渲染等领域中非常重要。然而,对于许多其他类型的应用来说,浮点运算并不是主要的计算任务,因此使用TeraFLOPS来评估芯片在这些应用中的性能可能不够准确。
芯片对比
关键计算芯片华为全自研
Hi1910 与 Ascend 310芯片 关系
什么是AI加速型弹性云服务器?
上述链接描述“每张Hi1910加速卡包含4个Ascend 310芯片”显示 Hi1910 包含 Ascend 310,具体包含几个,看实际应用。
参考
1、海思官网–麒麟(Kirin)芯片
2、海思官网–鲲鹏(Kunpeng)芯片
3、华为计算–鲲鹏计算 和 昇腾计算
4、华为微认证——鲲鹏处理器
5、鲲鹏官网
6、昇腾官网
7、民生证券-计算机行业深度报告-华为昇腾:国产AI算力“扛旗者”-230904
8、浙商证券-计算机行业华为算力产业链深度系列研究:华为昇腾服务器研究框架-230329
9、昇腾计算产业概述
10、华为–迈向智能世界白皮书
11、财通证券-计算机行业专题报告-华为产业系列深度:凤凰磐涅,AI昇腾-230827
12、华为Ascend昇腾计算产业概述
13、Atlas200 模组拆解
14、什么是AI加速型弹性云服务器?
15、华为Ascend昇腾基本架构