【寒武纪(14)】硬件系统由标量指令、向量指令、张量指令、访存指令构成

我们在文档《Cambricon-BANG-C-Developer-Guide-EN-v4.5.1》的build-in function 发现,存在三种计算:矩阵乘法、标量类型、向量。

在这里插入图片描述
查阅《Cambricon-BANG-C-C+±Programming-Guide-CN-v1.5.0.pdf》可知,硬件系统由标量指令、向量指令、张量指令、访存指令构成。

流水线中分为 IO流、Move流、computer流和scalar流。

  • IO流、Move流 是访存指令
  • 向量指令、张量指令 对应 computer流
  • 标量指令 对应scalar流。

在这里插入图片描述在这里插入图片描述

标量系统就是典型的 load-store 类型RISC (Reduced Instruction set computer)架构。在MLUv3 中标量主要用于实现 控制流和一些特殊功能。

向量指令实现向量计算,每条向量指令包含源操作地址,目的操作地址以及向量长度。长度可用变化。

张量指令用于实现卷积、积分、直方图和矩阵计算。

访存指令搬运数据,长度可变。

向量,张量和访存执行时间是可变的。应该合理安排向量/张量运行 与 访存指令的顺序,减少打断以及流之间的数据依赖。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/153243.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vscode设置前进、后退快捷键

前言 在我们使用vscode编写程序时,经常需要在不同的文件之间跳来跳去,如果只是依靠个人记忆去操作会显得非常不方便。本文介绍如何设置vscode的前进、后退快捷键。 1 vscode设置前进、后退快捷键 点击“设置”图标,然后点击“键盘快捷方式…

各类软件docker安装

docker Docker 要求 CentOS 系统的内核版本高于 3.10 ,通过 uname -r 命令查看你当前的内核版本: uname -r 3.10.0-1062.1.2.el7.x86_64 安装 Docker: 安装 Docker:yum -y install dockerkafka和zookeeper docker pull wurstmei…

python刷题笔记1(42例题)

1. split()函数 str.split([sep [, maxsplit]]) 分割字符串,返回一个数组 2. 判断子串 # 判断子串是否在主串里面,是则输出“Yes”,否则输出“No” str1 input("子串:") str2 input("主串:") if str1 in s…

通信原理板块——差错控制编码或纠错编码

微信公众号上线,搜索公众号小灰灰的FPGA,关注可获取相关源码,定期更新有关FPGA的项目以及开源项目源码,包括但不限于各类检测芯片驱动、低速接口驱动、高速接口驱动、数据信号处理、图像处理以及AXI总线等 1、背景 数字信号在传输过程中&…

【寒武纪(13)】BANGC 报错 stack smashing detected

报错&#xff1a; *** stack smashing detected ***: <unknown> terminated *** stack smashing detected ***: <unknown> terminated CMake Error at mluop_generated_fault_kernel.mlu.o.cmake:221 (message):Error generating file/mnt/data/ef2301-sdk-0.10.0…

什么是策划能力?如何提高策划能力?

什么是策划能力&#xff1f; 通常我们理解的策划能力&#xff0c;大多指的是策划活动&#xff0c;比如举办一次活动先要进行活动策划&#xff0c;形成具体的行动方案&#xff0c;然后开展组织人力物力等资源&#xff0c;最终落地实施。策划能力包含活动策划&#xff0c;但又不…

vscode设置代码模板

一键生成vue3模板代码 效果演示 输入vue3 显示快捷键 按回车键 一键生成自定义模板 实现方法 进入用户代码片段设置 选择片段语言 vue.json输入自定义的代码片段 prefix是触发的内容&#xff0c;按自己的喜好来就行&#xff1b; body是模板代码&#xff0c;写入自己需要的…

UE TransformVector 学习笔记

假如算现在枪的位置&#xff0c;那么就是先拿人的位置再拿枪在本地的相对位置相加&#xff0c;就是枪的位置&#xff0c;也就是枪在场景中的位置&#xff0c;那么这里还可以写成Actor的变化和枪的相对位置连在TransformVector上&#xff0c;返回的就是枪的场景位置 这里做反算&…

uniapp APP下载流文件execl 并用WPS打开

使用plus.downloader.createDownload 方法将新建下载任务 HTML5 API Reference export default function plusDownload(config){if(!config){console.error("Argument should not be null");return;}const urlrequest.baseUrlconfig.url;let token uni.getStorage…

会议剪影 | 思腾合力受邀出席第四届长三角文博会并作主题演讲

以“担当新使命:长三角文化产业的力量”为主题的「第四届长三角国际文化产业博览会」于2023年11月16日-19日在国家会展中心&#xff08;上海&#xff09;成功举办。思腾合力作为行业领先的人工智能基础架构解决方案商出席本次盛会。 此次展会的面积首次超过10万平米&#xff0c…

PHP8新特性

PHP 8是PHP语言的最新版本&#xff0c;于2020年11月发布。它带来了许多新功能和改进&#xff0c;使PHP更强大、更高效。 1、JIT编译器&#xff1a;PHP 8引入了JIT&#xff08;即时编译&#xff09;编译器&#xff0c;它可以将PHP代码直接编译为机器代码&#xff0c;提高了执行速…

BUUCTF 菜刀666 1

BUUCTF:https://buuoj.cn/challenges 题目描述&#xff1a; 流量分析&#xff0c;你能找到flag吗 注意&#xff1a;得到的 flag 请包上 flag{} 提交 密文&#xff1a; 下载附件&#xff0c;解压得到一个.pcapng文件。 解题思路&#xff1a; 1、双击文件&#xff0c;打开wir…

算法-简单-二叉树-翻转、对称

记录一下算法题的学习8 翻转二叉树 翻转二叉树题目 给你一棵二叉树的根节点 root &#xff0c;翻转这棵二叉树&#xff0c;并返回其根节点。 举例&#xff1a;给定root[5,3,7,2,4,6,10] 翻转成为root[5,7,3,10,6,4,2] 即所有的根节点的左右节点都要互换位置&#xff0c;输出的…

Python如何将项目直接打包为一键整合包

目录 一、准备项目 二、创建打包文件 三、创建安装脚本 四、执行安装 五、测试安装 六、常见问题与解决方案 总结 Python项目打包成一键整合包是一个比较复杂的任务&#xff0c;需要考虑到项目的各个方面&#xff0c;包括依赖项、配置文件、静态文件、数据库等等。下面是…

上位机与下位机通讯方式(转载)

上位机&#xff1a;指可以直接发送操作指令的计算机或单片机&#xff0c;一般提供用户操作交互界面并向用户展示反馈数据。 典型设备类型&#xff1a;电脑、手机、排版、触摸屏等。 下位机&#xff1a;指直接与机器相连接的计算机或单片机&#xff0c;一般用于接收和反馈上位机…

Dotar(zsh,tmux,vim,ag)

Dotar是一个包含了zsh, spacevim(nvim), tmux和许多其它工具的多合一的Mac/Ubuntu开发环境 背景 Dotar的名字源于dot和tar的结合&#xff0c;代表者打包(tar)文件。 开始 需求 zsh, tmux, vim, ag已经安装&#xff0c;并且zsh作为你的默认终端: chsh -s $(which zsh)如果…

NX二次开发UF_CAM_ask_tool_matl_db_object 函数介绍

文章作者&#xff1a;里海 来源网站&#xff1a;里海NX二次开发3000例专栏 UF_CAM_ask_tool_matl_db_object Defined in: uf_cam.h int UF_CAM_ask_tool_matl_db_object(UF_CAM_db_object_t * db_obj ) overview 概述 This function provides the database object which is…

解锁性能:玩转多线程编程的新姿势......

拥有多线程和拥有一百枚核弹没有区别&#xff0c;因为都是毁灭性的存在。——麦克阿瑟 在Java中&#xff0c;实现多线程主要有三种方式&#xff1a;继承Thread类、实现Runnable接口和实现Callable接口。 多线程的形式上实现方式主要有两种&#xff0c;一种是继承Thread类&…