Ubuntu下使用AMD APP编写OpenCL程序

对于Ubuntu或其近亲(Lubuntu、Kubuntu、Mint等)编写OpenCL程序也不会太难。由于本例用的是AMD APP SDK,因此需要AMD的GPU以及相关驱动。首先,去AMD官网下载GPU驱动——AMD Catalyst。如果你用的是APU并且还有一块独立显卡的话,通过AMD Catalyst Control Center可以选择使用哪个GPU。像我现在用的联想Z475笔记本,搭载了AMD APU A6-3420M以及一块AMD Radeon HD 7400M,但是相比较而言,还是APU自带的6620G的GPU性能更強一些,因此我这边设置的是采用AMD Radeon HD 6620G。

在Linux下,AMD官方的GPU驱动是.run文件,只需使用sudo sh xxx.run即可安装。安装时采用默认安装即可。

然后去developer.amd.com开发者网站下载AMD APP SDK。下载完成之后,将lib里面的动态库文件(xxx.so)取出来,并且把include里的头文件取出来。在你的OpenCL工程中把头文件的路径以及动态加载库都设置好。在你用-l的时候,如果动态库文件后缀名为.so.1,那么得把文件名后缀.1去掉。因为-l只能连接.a、.lib、.so等这些后缀的库文件。


下面我们将举一个最简单的例子,首先看主机端代码:

复制代码
/*============================================================================Name        : OpenCLTest.cAuthor      : Zenny ChenVersion     :Copyright   : Your copyright noticeDescription : Hello World in C, Ansi-style============================================================================*/#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#include <CL/cl.h>static int GetCurrentLocationFilePath(char pDst[512], const char *filename)
{if(pDst == NULL || filename == NULL)return 0;int size = readlink("/proc/self/exe", pDst, 512);while(pDst[size - 1] != '/')size--;strcpy(&pDst[size], filename);int retSize = strlen(filename) + size;pDst[retSize] = '\0';return retSize;
}int main(void)
{/*Step1: Getting platforms and choose an available one.*/cl_uint numPlatforms;   //the NO. of platformscl_int  status = clGetPlatformIDs(0, NULL, &numPlatforms);if (status != CL_SUCCESS){puts("Error: Getting platforms!");return 0;}cl_platform_id platforms[16];/*For clarity, choose the first available platform. */if(numPlatforms > 0){status = clGetPlatformIDs(numPlatforms, platforms, NULL);if(status != CL_SUCCESS){puts("Failed to get platform IDs");return 0;}}/*Step 2:Query the platform and choose the first GPU device if has one.Otherwise use the CPU as device.*/cl_uint             numDevices = 0;cl_device_id        devices[16];clGetDeviceIDs(platforms[0], CL_DEVICE_TYPE_GPU, 0, NULL, &numDevices);if(numDevices == 0)    //no GPU available.
    {puts("No devices available!");return 0;}else{printf("The number of available devices is: %u\n", numDevices);clGetDeviceIDs(platforms[0], CL_DEVICE_TYPE_GPU, numDevices, devices, NULL);}/*Step 3: Create context.*/cl_context context = clCreateContext(NULL,1, devices,NULL,NULL,NULL);/*Step 4: Creating command queue associate with the context.*/cl_command_queue commandQueue = clCreateCommandQueue(context, devices[0], 0, NULL);/*Step 5: Create program object */char filePath[512];GetCurrentLocationFilePath(filePath, "test.cl");FILE *fp = fopen(filePath, "r");if(fp == NULL){puts("OpenCL kernel source file open failed!");return 0;}fseek(fp, 0, SEEK_END);long fileLength = ftell(fp);fseek(fp, 0, SEEK_SET);char *source = (char*)malloc(fileLength + 1);fread(source, 1, fileLength, fp);fclose(fp);size_t sourceSize[] = {fileLength};cl_program program = clCreateProgramWithSource(context, 1, (const char**)&source, sourceSize, NULL);free(source);if(program == NULL){puts("Failed to create the program!");return 0;}/*Step 6: Build program. */status = clBuildProgram(program, 1,devices,NULL,NULL,NULL);if(status != CL_SUCCESS){puts("Failed to build the program!");return 0;}/*Step 7: Initial input,output for the host and create memory objects for the kernel*/int input[128];for(int i = 0; i < 128; i++)input[i] = i + 1;cl_mem inputBuffer = clCreateBuffer(context, CL_MEM_READ_ONLY|CL_MEM_COPY_HOST_PTR, sizeof(input), input, NULL);cl_mem outputBuffer = clCreateBuffer(context, CL_MEM_WRITE_ONLY , sizeof(input), NULL, NULL);/*Step 8: Create kernel object */cl_kernel kernel = clCreateKernel(program, "test", NULL);/*Step 9: Sets Kernel arguments.*/status = clSetKernelArg(kernel, 0, sizeof(cl_mem), &inputBuffer);status = clSetKernelArg(kernel, 1, sizeof(cl_mem), &outputBuffer);/*Step 10: Running the kernel.*/size_t global_work_size[1] = { 128 };status = clEnqueueNDRangeKernel(commandQueue, kernel, 1, NULL, global_work_size, NULL, 0, NULL, NULL);/*Step 11: Read the cout put back to host memory.*/int output[128];status = clEnqueueReadBuffer(commandQueue, outputBuffer, CL_TRUE, 0, sizeof(input), output, 0, NULL, NULL);/*Step 12: Clean the resources.*/status = clReleaseKernel(kernel);               //Release kernel.status = clReleaseProgram(program);             //Release the program object.status = clReleaseMemObject(inputBuffer);       //Release mem object.status = clReleaseMemObject(outputBuffer);status = clReleaseCommandQueue(commandQueue);   //Release  Command queue.status = clReleaseContext(context);             //Release context.for(int i = 0; i < 128; i++){if(output[i] != i + 2){printf("Error occurred @%d!", i);return 0;}}puts("Pass!");return 1;
}
复制代码

在编译选项中,使用-std=gnu99或-std=gnu11。上述代码为纯C语言,因此即便你没有安装g++也完全没关系。

下面看看内核源代码:

复制代码
/*============================================================================Name        : OpenCLTest.cAuthor      : Zenny ChenVersion     :Copyright   : Your copyright noticeDescription : Simple OpenCL kernel source============================================================================*/__kernel void test(__global int* in, __global int* out)
{int index = get_global_id(0);out[index] = in[index] + 1;
}
复制代码

将此文件放在可执行文件相同路径下,然后我们就能正常运行了。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/448600.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jdk的安装与配置

Linux一、安装JDK 从sun网站上直接下载JDK&#xff1a;http://java.sun.com/j2se/1.4.2/download.html提供了两个下载j2re-1_4_2_10-linux-i586.bin 13.75 MB, j2re-1_4_2_10-linux-i586-rpm.bin 13.27 MB&#xff1a;1、RPM in self-extracting file (j2re-1_4_2_10-linux…

李洋疯狂C语言之n个人报数,报到3的退出,最后留在场上的是原来的第几位(约瑟夫环)

今天老师布置了个题目&#xff0c;约瑟夫环&#xff0c;俗称猴子选大王。n个人报数&#xff0c;报到3的退出&#xff0c;最后留在场上的时原来的第几位 #include <stdio.h>int main() {int i, n, q, p 0; //计数 i ,人数 n ,报数 p ,场上人数 qprintf ("input…

搭建Vue脚手架(vue-cli)并创建一个项目

1、 安装nodejs环境 官网下载&#xff1a;https://nodejs.org/en/download/ 一直默认就行&#xff0c;路径可以改变但要记得到 安装完成后cmd&#xff0c;输入node -v ,npm -v 如果能看到node和npm的版本号了&#xff0c;说明已经安装成功 2、安装vue-cli 有npm和cnpm两种方式…

NPM 使用介绍

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 NPM是随同NodeJS一起安装的包管理工具&#xff0c;能解决NodeJS代码部署上的很多问题&#xff0c;常见的使用场景有以下几种&#xff1a…

人生致命的八个经典问题

问题一&#xff1a;如果你家附近有一家餐厅&#xff0c;东西又贵又难吃&#xff0c;桌上还爬着蟑螂&#xff0c;你会因为它很近很方便&#xff0c;就一而再、再而三地光临吗&#xff1f; 回答&#xff1a;你一定会说&#xff0c;这是什么烂问题&#xff0c;谁那么笨&#xff0c…

RabbitMQ学习总结(5)——发布和订阅实例详解

2019独角兽企业重金招聘Python工程师标准>>> 一、Publish/Subscribe&#xff08;发布/订阅&#xff09;&#xff08;using the Java Client&#xff09; 在前面的教程中,我们创建了一个work Queue&#xff08;工作队列&#xff09;。工作队列背后的假设是每个任务是…

iOS有哪些数据类型/基本数据类型?

简述 本文主要探究使用OC作为iOS开发语言时&#xff0c;我们能使用哪些数据类型。 一切类型始于C。 C语言的类型 基本数据类型&#xff1a; 基本数据类型&#xff08;fundamental data types&#xff09;也叫原始数据类型&#xff08;primitive data types&#xff09; 整型、字…

李洋疯狂C语言之将”you are come from shanghai ”倒置为”shanghai from come are you”,将句子中的单词位置倒置,而不改变单词内部结构

题目: 编写一个C函数,将”you are come from shanghai ”倒置为”shanghai from come are you”,及将句子中的单词位置倒置,而不改变单词内部结构 #include <stdio.h> #include <string.h> void change(char *p1, char *p2); //函数声明 int main() {char str[] …

马桶怎么清洗才干净无异味?

方法/步骤 在马桶水箱中一定要放上洁厕宝&#xff1a; 洁厕宝里面含有多种去除马桶中杂质以及异味的功能&#xff0c;另外它还带有香香的味道&#xff0c;我们一按冲马桶的按钮&#xff0c;放出来的总是蓝色的水&#xff0c;十分的美观和好看&#xff0c;但是这并不是花瓶般的作…

白话解说:阻塞和非阻塞,同步和异步

阻塞和非阻塞&#xff0c;同步和异步是node.js里经常遇到的词汇&#xff0c;举例说明&#xff1a; 我要看足球比赛&#xff0c;但是妈妈叫我烧水&#xff0c;电视机在客厅&#xff0c;烧水要在厨房。家里有2个水壶&#xff0c;一个是普通的水壶&#xff0c;另一个是水开了会叫的…

苏嵌点滴(一)

来苏嵌也有12天了&#xff0c;也渐渐开始习惯这样的生活&#xff0c;每天睁眼到闭眼&#xff0c;全都是代码。每天都得学习很多新的知识&#xff0c;C语言学到现在也学得差不多了&#xff0c;还有明天一天课。 指针、数组这些C语言中的重点&#xff0c;还是需要一点时间消化的…

Mysql学习总结(8)——MySql基本查询、连接查询、子查询、正则表达查询讲解...

2019独角兽企业重金招聘Python工程师标准>>> 查询数据指从数据库中获取所需要的数据。查询数据是数据库操作中最常用&#xff0c;也是最重要的操作。用户可以根据自己对数据的需求&#xff0c;使用不同的查询方式。通过不同的查询方式&#xff0c;可以获得不同的数据…

安装OpenCL和AMD驱动程序

我们将安装AMD OpenCL软件开发工具包&#xff08;SDK&#xff09;和AMD驱动程序。 userubuntu:~$ mkdir AMD-APP-SDK-v2.5-lnx64 userubuntu:~$ cd AMD-APP-SDK-v2.5-lnx64/ userubuntu:~$ wgethttp://developer.amd.com/Downloads/AMD-APP-SDK-v2.5-lnx64.tgz userubuntu:~$ t…

Node.js -- Stream 使用小例 ( 流运用 :读取、写入、写出、拷贝)

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 Stream 是一个抽象接口&#xff0c;Node 中有很多对象实现了这个接口。例如&#xff0c;对http 服务器发起请求的request 对象就是一个 …

李洋疯狂C语言之有关“you are come from shanghai”逆序(二)

今天将指针和函数全部学完了&#xff0c;之前这题的做法&#xff0c;现在看来有点繁琐&#xff0c;于是乎做了一些修改&#xff0c;下面是新的代码 //you are from shanghai逆序#include <stdio.h> #include <string.h> //下面要用到strlenvoid reverse(c…

sync - 清空文件系统缓冲区

总览 (SYNOPSIS) sync [OPTION] 描述 (DESCRIPTION) 强迫把更改的块写入磁盘&#xff0c; 并更新超级块。 --help显示帮助然后终止。--version显示版本信息然后终止。 转载于:https://www.cnblogs.com/fanweisheng/p/11101219.html

学会用好 Visual Studio Code

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到教程。 Visual Studio Code是个牛逼的编辑器&#xff0c;启动非常快&#xff0c;完全可以用来代替其他文本文件编辑工具。又可以用来做开发&…

苏嵌点滴(二)

今天把指针和函数讲完了&#xff0c;这些都还能接受&#xff0c;之后老师和我们讲了递归&#xff0c;有点难度。 晚上电脑还出了点状况&#xff0c;一个晚自习全用来重装系统和学习软件套装X_X&#xff0c;调试完已经接近下课&#xff0c;递归还没来得及看。 放学后&#xff…

Maven学习总结(五)——聚合与继承

2019独角兽企业重金招聘Python工程师标准>>> Maven学习总结(五)——聚合与继承 一、聚合 如果我们想一次构建多个项目模块&#xff0c;那我们就需要对多个项目模块进行聚合 1.1、聚合配置代码 1 <modules> 2 <module>模块一</module> 3 …

19-6/28作业:100以内偶数求和

☞作业要求 ☞分析思路 在循环里面增加约束&#xff0c;使累加1变成累加2 ☞do-while循环代码 public class GaoSiFor { public static void main(String[] args) { //定义两个变量 int sum 0; int i 0; //开始循环 do{ //…