cuda学习笔记(2)

在这里插入图片描述
在这里插入图片描述

一 专业名词

1 分支断定

在这里插入图片描述

2 一致性和同一性

在这里插入图片描述

3 常见名词汇总

在这里插入图片描述

4 加速比

在这里插入图片描述

二 GPU架构构述

GPU就是将cpu的数据存储单元去掉,也就是保留执行单元,GPU就是多个执行单元

1 GPU设计思路,指令流共享,同时执行,数据切分成小块

在这里插入图片描述
在这里插入图片描述

2 GPU设计思路,单指令多数据处理

在这里插入图片描述
在这里插入图片描述
分支如何工作,只有一个大脑,8个流输入的是同一段代码,有的是t,有的是f,执行t的时候,f只能等待
在这里插入图片描述
停滞的解决方法:用别的独立的工作,来填满空余时间,延迟掩藏
停滞是指等待的过程,数据还没来,前面还没算完

在这里插入图片描述

1 CPU 和GPU交互

在这里插入图片描述
在这里插入图片描述

2 GPU线程模型

开发者定义的是线程,以及每个block里面放多少线程
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

3 CUDA编程

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

假设只要1个block,block是二维的,i,j对应二维索引
在这里插入图片描述

在这里插入图片描述

cudaMalloc()    在设备端分配 golbal memory
cudaFree()  释放存储空间
GPU指针分配

在这里插入图片描述

数据拷贝函数

在这里插入图片描述
在这里插入图片描述

Cuda算法框架,通用

第1步:为数据分配GPU空间,将数据从cpu上拷贝到GPU上,同时为输出数据分配内存空间
第2步:在GPU启动并行
第3步:将数据拷贝回CPU,释放GPU上的占用内存
在这里插入图片描述

矩阵相乘算法

在这里插入图片描述
在GPU启动并行计算矩阵,不需要锁,因为用不到别的部分的数据
在这里插入图片描述
假设只使用一个block
在这里插入图片描述

函数声明

主要有三种函数,3个函数声明可以用于同时定义同一个变量
在这里插入图片描述

线程同步,一般是局部同步,也就是块内同步,全局同步开销太大

且线程同步之间的任务要时间接近,可以提高效率
在这里插入图片描述
如果是采用了以下的这种调用情况,会导致程序逻辑错误
在这里插入图片描述

线程调度:软件调用的核数可能会大于实际的硬件核数

调度量不代表执行量,调度过程会存在一些等待的部分
在这里插入图片描述

Warp

1个warp是32个线程,block内的线程再次进行分组执行,因为资源有限,一个warp内的数据是默认同步的
一个时间一个block内只有一个warp在执行

一个block只能分配在同一个SM上

变量声明

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

课程链接
链接: https://www.bilibili.com/video/BV1LE411p7ej?p=6&spm_id_from=pageDriver&vd_source=ee789cf916563b0f6fa47fd0f3556c63

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/703918.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

四种主流的prompt框架

省流版: 文章介绍了在使用GPT时的四种prompt框架,有利于使用者打磨提问风格,与GPT进行更好的交互以提高生产力,能帮助大家有效提高工作效率~ 创作不易,如果对你有帮助的话,还请三连支持~ 想要使用Prompt…

MySQL的21个SQL经验

1. 写完SQL先explain查看执行计划(SQL性能优化) 日常开发写SQL的时候,尽量养成这个好习惯呀:写完SQL后,用explain分析一下,尤其注意走不走索引。 explain select userid,name,age from user where userid =10086 or age =18;2、操作delete或者update语句,加个limit(S…

jQuery简介与解析 - 掌控网页互动的魔法工具

jQuery简介与解析 - 掌控网页互动的魔法工具 摘要:本文将带您了解jQuery这一强大且流行的JavaScript库,探讨其特点、优势以及如何在网页开发中发挥巨大作用。我们将从jQuery的基本概念入手,逐步深入解析其核心功能,助您轻松掌握这…

phpspreadsheet导出数据和图片到excel

仅作记录&#xff0c;废话不多说 前提是已经安装了phpspreadsheet &#xff08; composer require phpoffice/phpspreadsheet &#xff09; 一、 数据拼装&#xff0c;调用excel类 <?php /*** 电子台账* Date: 2023/4/20* Time: 17:28*/namespace app\store\controlle…

Android 面试问题 2024 版(其三)

Android 面试问题 2024 版&#xff08;其三&#xff09; 十一、版本控制十二、Play 商店和应用程序部署十三、无障碍十四、第三方库和 API十五、解决问题的能力十六、基于 JD 的非常高级别的问题 十一、版本控制 什么是版本控制&#xff0c;为什么它在软件开发中很重要&#x…

Shell echo、printf、test命令

目录 Shell echo命令 打印文本消息 显示变量值 输出特殊字符 输出到文件 追加到文件 Shell printf 命令 打印简单文本 Shell test 命令 文件测试 字符串比较 整数比较 逻辑运算 Shell echo命令 打印文本消息 echo "Hello, World!" 显示变量值 name&q…

积累:如何提取 int 数据的高低字节

前言 服务通信、硬件开发&#xff0c;一般都会涉及到字节数据的解析、处理。无论是两个服务间的数据交互协议&#xff0c;还是硬件设备的通信协议&#xff0c;协议中涉及到的参数比较多&#xff0c;并且协议中每个参数占用的字节大小设定会因功能也不尽相同&#xff1a;简单点的…

微信小程序(4)- 事件系统和模板语法

1. 事件系统 1.1 事件绑定和事件对象 小程序中绑定事件与在网页开发中绑定事件几乎一致&#xff0c;只不过在小程序不能通过 on 的方式绑定事件&#xff0c;也没有 click 等事件&#xff0c;小程序中绑定事件使用 bind 方法&#xff0c;click 事件也需要使用 tap 事件来进行代…

抖店货源怎么找?这几个货源渠道,我都替你整理出来了!

我是电商珠珠 在开通抖店之后&#xff0c;怎么找货源成为了新手的致命要点。货源找不好&#xff0c;就会导致店铺的流量曝光不够。 抖店货源究竟该怎么找呢&#xff0c;今天我就来给大家说个明白。 1、货源网站 比较常规的方式&#xff0c;就是去货源网站上去找&#xff0c…

LeetCode //C - 131. Palindrome Partitioning

131. Palindrome Partitioning Given a string s, partition s such that every substring of the partition is a palindrome. Return all possible palindrome partitioning of s. Example 1: Input: s “aab” Output: [[“a”,“a”,“b”],[“aa”,“b”]] Example 2…

达梦数据库——集群守护进程各状态详解

守护进程&#xff08; dmwatcher &#xff09;是 DM 数据守护系统不可或缺的核心部件&#xff0c;是数据库实例和 监视器之间信息流转的桥梁。数据库实例向本地守护进程发送信息&#xff0c;接收本地守护进程的消 息和命令&#xff1b;监视器&#xff08; dmmonitor &#…

爬某网站延禧宫率第一集视频

import requests import re from tqdm import tqdm # 网址链接&#xff1a;https://v.ijujitv.cc/play/24291-1-1.html url https://v6.1080pzy.co/20220801/urxniJCN/hls/index.m3u8 headers {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) Appl…

BUUCTF crypto做题记录(9)新手向

一、rsa2 得到题目代码如下&#xff1a; N 101991809777553253470276751399264740131157682329252673501792154507006158434432009141995367241962525705950046253400188884658262496534706438791515071885860897552736656899566915731297225817250639873643376310103992170…

【Spring连载】使用Spring Data的Repositories----从聚合根(Aggregate Roots)发布事件

【Spring连载】使用Spring Data的Repositories----从聚合根Aggregate Roots发布事件 由存储库管理的实体是聚合根。在域驱动设计应用程序中&#xff0c;这些聚合根通常发布域事件。Spring Data提供了一个名为DomainEvents的注解&#xff0c;你可以在聚合根的方法上使用该注解&a…

Linux调用可执行程序:system()函数和execl函数

system()函数&#xff1a; system()函数是一个在C/C编程语言中的库函数&#xff0c;用于在操作系统中执行命令。 函数声明如下&#xff1a; int system(const char *command);该函数接受一个指向以空字符结尾的字符串的指针作为参数&#xff0c;该字符串包含要执行的命令。函…

吴恩达deeplearning.ai:sigmoid函数的替代方案以及激活函数的选择

以下内容有任何不理解可以翻看我之前的博客哦&#xff1a;吴恩达deeplearning.ai专栏 文章目录 引入——改进下需求预测模型ReLU函数(整流线性单元 rectified linear unit&#xff09;线性激活函数(linear activation function)激活函数的选择实现方式为什么需要激活函数 到现在…

【MATLAB】 LMD信号分解+FFT傅里叶频谱变换组合算法

有意向获取代码&#xff0c;请转文末观看代码获取方式~ 展示出图效果 1 LMD分解算法 LMD (Local Mean Decomposition) 分解算法是一种信号分解算法&#xff0c;它可以将一个信号分解成多个局部平滑的成分&#xff0c;并且可以将高频噪声和低频信号有效地分离出来。LMD 分解算…

283.【华为OD机试真题】伐木工(动态规划—JavaPythonC++JS实现)

🚀点击这里可直接跳转到本专栏,可查阅顶置最新的华为OD机试宝典~ 本专栏所有题目均包含优质解题思路,高质量解题代码(Java&Python&C++&JS分别实现),详细代码讲解,助你深入学习,深度掌握! 文章目录 一. 题目-伐木工二.解题思路三.题解代码Python题解代码J…

【IDEA】java 项目启动偶现Kotlin 版本问题 error:Kotlin:module was

一、问题描述&#xff1a; error:Kotlin:module was compiled with an incompatible version of kotlin the binary version of its metadata is二、问题原因&#xff1a; jar包版本冲突 三、解决方式&#xff1a; 1、Rebuild Project&#xff08;推荐☆&#xff09; 重新构…

【Spring Cloud】高并发带来的问题及常见容错方案

文章目录 高并发带来的问题编写代码修改配置压力测试修改配置&#xff0c;并启动软件添加线程组配置线程并发数添加Http取样配置取样&#xff0c;并启动测试访问message方法观察效果 服务雪崩效应常见容错方案常见的容错思路常见的容错组件 总结 欢迎来到阿Q社区 https://bbs.c…