一、CUDA程序执行方法
执行步骤为:
- 安装Visual Studio Code。
- 在Visual Studio Code中安装插件WSL与电脑的WSL2进行连接。
- 点击左下角,然后再选择连接到WSL。
- 在WSL中创建以 .cu 为后缀的文件。
root@DESKTOP-HR6VO5J:~# mkdir CUDA //创建CUDA文件夹
root@DESKTOP-HR6VO5J:~/CUDA# touch HelloWorld.cu //在CUDA文件夹中创建程序文件
-
在Visual Studio Code中打开该文件,并进行代码的编写。
-
WSL中跳转到程序文件目录下。
-
使用nvcc命令生成输出文件。
-
执行该输出文件,与执行Linux中Shell脚本的方式相同。执行结果中,第一条输出结果为CPU输出,后面10条输出结果为GPU中的10个线程输出。
二、CUDA程序编写方法
编写步骤为:
- 设置GPU线程
- 内核执行配置(kernel execution configuration):<<<grid,block>>>。其中grid标识一个grid中有几个block,block表示一个block中有几个线程,两者相乘为线程数量,即 线程数量=grid * block。
- 设置线程总数和线程布局
- 内核调用
- 内核函数名<<<grid,block>>>(参数列表)
- 释放所有与当前进程相关的GPU资源
- cudaDeviceReset