GPU编程基础-CUDA实现图像处理
- 1. 相关基础概念
- 1.1 Host和Device程序
- 1.2 Kernel程序
- 1.3 SIMT和SIMD
- 1.4 GPU计算的 Occupancy指标
- 1.5 GPU计算的基本流程
- 2. GPU计算框架与过程说明
- 3. 一个基于CUDA的图像处理例子
- 4. 一些报错解决
1. 相关基础概念
1.1 Host和Device程序
- 在CPU上运行的称为Host程序;
- 在GPU上运行的称为Device程序。
1.2 Kernel程序
GPU上运行的函数又被叫做Kernel函数。
Host程序在调用Device程序时,可以通过参数确定执行该Kernel的CUDA threads的数量。每个Thread在执行Kernel函数时,会被分配一个thread ID,Kernel函数可以通过内置变量threadIdx访问。一个Kernel函数对应一个Grid。每个Grid中的任务是一定的。当要执行这些任务的时候,