华为昇腾异构计算架构CANN及AI芯片简介

异构计算架构CANN

异构计算架构CANN(Compute Architecture for Neural Networks)是华为针对AI场景推出的异构计算架构,向上支持多种AI框架,包括MindSpore、PyTorch、TensorFlow等,向下服务AI处理器与编程,发挥承上启下的关键作用,是提升昇腾AI处理器计算效率的关键平台。同时针对多样化应用场景,提供多层次编程接口,支持用户快速构建基于昇腾平台的AI应用和业务。

总结:CANN用来屏蔽底层硬件差异,使得用户能够无缝使用Pytorch等主流深度学习框架进行开发。

在这里插入图片描述

图1 CANN逻辑架构

昇腾AI芯片基本架构

昇腾AI芯片基本架构

图2 昇腾AI芯片基本架构

基于Ascend C开发的算子运行在AI Core上,AI Core负责执行标量向量张量相关的计算密集型算子,包括三种基础计算单元:Cube(矩阵)计算单元、Vector(向量)计算单元和Scalar(标量)计算单元,同时还包含存储单元(包括硬件存储和用于数据搬运的搬运单元)和控制单元。

总结:AI Core是芯片的核心,用来运行算子。

AI Core耦合硬件架构

AI core硬件架构根据Cube计算单元和Vector计算单元是否同核部署分为耦合架构和分离架构两种,其中Atlas 训练与推理系列产品均采用耦合架构。

AI core的缓存理解:
1、GM:可以理解为显存
2、L1 Buffer:与GM交互,加载或者存储数据
3、Unified Buffer:统一缓冲区,向量和标量计算的输入和输出。
4、Buffer L0A&L0B&L0C:专门为Cube单元设置的缓存,L0A和L0B为Cube指令的输入,L0C是Cube指令的输出。

在这里插入图片描述

图3 AI Core耦合硬件架构

参考链接1:https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/80RC2alpha002/devguide/opdevg/ascendcopdevg/atlas_ascendc_10_0008.html
参考链接2:https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/80RC2alpha002/quickstart/quickstart/quickstart_18_0003.html
参考链接3:https://blog.csdn.net/m0_37605642/article/details/132780001

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/28687.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Open To Buy(OTB)计划:零售业者的库存管理利器

在当今快速变化的服装市场中,如何高效、精准地进行商品管理成为了服装企业竞争的关键。OTB(Open-to-Buy)作为一种有效的商品管理方法,在企业管理中扮演着至关重要的角色。它基于预算、商品计划以及市场需求等多维度因素&#xff0…

Android开发系列(二)Jetpack Compose 之Text控件

Jetpack Compose是一种全新的声明式UI框架,用于构建Android应用程序。Jetpack Compose Text控件是Compose中用于显示文本的基本UI组件。 Text是一个可组合函数,函数声明如下所示。 Composable fun Text(text: String,modifier: Modifier Modifier,colo…

ROS 机器人控制(Python实现)

ROS 机器人控制(Python实现) 实现思路 构建一个新的软件包,包名叫做vel_pkg在软件包中新建一个节点,节点名叫做vel_node.py在节点中,向ROS大管家rospy申请发布话题/cmd_vel,并拿到发布对象vel_pub构建一个…

cmake、make、makefile、ninga的关系

CMake是一种跨平台的构建系统,它用来管理软件的编译过程。CMake可以生成本地平台特定的构建文件,例如Makefile或者Microsoft Visual Studio项目文件,以便开发人员更轻松地在不同的平台上构建他们的项目。它的主要功能是配置和生成构建脚本&am…

AGI 远不止 ChatGPT!一文入门 AGI 通识及应用开发

AI 大语言模型进入爆发阶段 2022 年 12 月 ChatGPT 突然爆火,原因是其表现出来的智能化已经远远突破了我们的常规认知。虽然其呈现在使用者面前仅仅只是一个简单的对话问答形式,但是它的内容化水平非常强大,甚至在某些方面已经超过人类了&am…

k8s上使用ConfigMap 和 Secret

使用ConfigMap 和 Secret 实验目标: 学习如何使用 ConfigMap 和 Secret 来管理应用的配置。 实验步骤: 创建一个 ConfigMap 存储应用配置。创建一个 Secret 存储敏感信息(如数据库密码)。在 Pod 中挂载 ConfigMap 和 Secret&am…

面试专区|【85道Dubbo高频题整理(附答案背诵版)】

简述什么是Dubbo( 概念 ) ? Dubbo是一个分布式服务框架,它提供了高性能和透明化的RPC远程服务调用方案以及SOA服务治理方案。Dubbo致力于提供高性能和透明化的RPC远程服务调用方案,以及SOA服务治理方案,使…

计算机视觉全系列实战教程:(八)图像变换-点运算、灰度变换、直方图变换

图像变换:点运算、灰度变换、直方图变换 1.点运算(1)What(2)Why 2.灰度变换(1)What(2)Why(作用)(3)Which(有哪些灰度变换) 3.直方图修正(1)直方图均衡化 1.点运算 (1)What 通过点运算,输出图像的每个像素的灰度值仅仅取决于输入图像中相对应…

Flask定制命令

Flask定制命令 将函数或方法定制成命令行代码 # 关键字绑定i click.argument(id) app.cli.command(create_user) # 将i作为参数 def create_user(id):conn pymysql.connect(userroot,password"777",host127.0.0.1,databaseflaskdemo,port3306,autocommitFalse)cur…

回文平方数 Palindromic Squares

题目描述 回文数是指从左向右念和从右向左念都一样的数。如 12321 就是一个典型的回文数。 给定一个用十进制表示的正整数 B,输出所有 [1,300] 中,它的平方用 B 进制表示时是回文数的数。 输入格式 共一行,一个单独的正整数 B。 输出格式…

一些常见的显示接口

以下是一些常见的显示接口,包括 MIPI、mini-LVDS、LVDS、HDMI、DisplayPort 等,它们在用途、使用范围、传输速率等方面有所不同。以下表格详细对比了这些接口: 接口类型主要用途使用范围传输速率传输距离备注MIPI DSI移动设备显示接口&#…

【招联消费金融股份】有限公司2024年5月18日【算法开发岗暑期实习】一面试经验分享

招联消费金融股份有限公司2024年5月18日面试经验分享 面试流程:共30多分钟,先3分钟自我介绍,然后细细介绍简历上面的论文和实习信息。问题1:扩散模型的noise schedule有什么研究。问题2:有哪些常见的数学分布问题3&…

开源大模型开发热门项目推荐,涵盖FastSpeech2、OpenNMT和ChatTTS等项目。

开源大模型开发中的几个热门项目 ### 介绍 在这个开源项目如火如荼的时代,我们为您推荐几个备受关注且富有前景的开源项目。从机器学习、人工智能到自然语言处理,这些项目涵盖了各种前沿领域,并致力于推动技术的普及与发展。 ### 项目一&…

新版嘎嘎快充互联互通系统配置文档

宝塔环境配置 登录宝塔账号,安装nginx、mysql5.7、php7.2、supervisor、redisphp安装扩展: 1)安装swooleloader72 将嘎嘎官方提供的swoole_loader_72_nts.so文件上传到 /www/server/php/72/lib/php/extensions/no-debug-non-zts-20170718…

删除有序链表中的重复元素

删除给出链表中的重复元素(链表中元素从小到大有序),使链表中的所有元素都只出现一次 例如: 给出的链表为1→1→2,返回1→2 给出的链表为1→1→2→3→3,返回1→2→3 数据范围:链表长度满足 0≤𝑛≤100&…

Spring的事务步骤

一、事务处理方案: Spring框架中提供的事务处理方案:一共有两种: 1.适合中小项目使用的, 注解方案: 注解的方式做事务用起来简单,灵活,方便,中小型项目中用它比较方便&#xff0c…

5 分支结构程序-5.5 程序举例

5.5 程序举例,所有的可执行样例 #include <stdio.h>main() {/* 【例 4.11】输入三个整数&#xff0c;输出最大数和最小数。 */// int a, b, c, max, min;// printf("input three numbers: ");// scanf("%d%d%d", &a, &b, &c);// if (a …

基于STM32和人工智能的智能水质监测系统

目录 引言环境准备智能水质监测系统基础代码实现&#xff1a;实现智能水质监测系统 4.1 数据采集模块4.2 数据处理与分析4.3 控制系统4.4 用户界面与数据可视化应用场景&#xff1a;智能水质管理与优化问题解决方案与优化收尾与总结 1. 引言 随着环境保护意识的提高&#xf…

python type hint async decorator异步函数装饰器的类型注解

原始代码&#xff1a; import functoolsasync def do_sth(f, gs, kw):print(f.__name__, gs, kw)def my_deco(func):functools.wraps(func)async def wrapper(*args, **kw):await do_sth(func, args, kw)return await func(*args, **kw)return wrappermy_deco async def foo()…

【C/C++】【学生成绩管理系统】深度剖析

可接各类C/C管理系统课设 目录 实现功能 部分1&#xff1a;系统设置和主菜单 1. 引入头文件 2. 定义结构体 3. 函数声明 4. 主函数 部分2&#xff1a;添加学生信息 部分3&#xff1a;删除学生信息 部分4&#xff1a;修改学生信息 部分5&#xff1a;查询学生信息 部分…