Matlab 使用GPU加速转载

在matlab中使用GPU加速，来加速矩阵运算。

首先如前面所说，并不是所有GPU都能在maltab中进行加速的，貌似只有NVDIA的显卡可以吧。

硬件：GeForce GTX 980

软件：Matlab 2015a （Matlab 2012以后的版本才带有GPU加速的工具箱）

下面开始介绍怎么玩GPU加速

第一步：在matlab命令窗口，运行gpuDevice，查看自己的显卡是否具备GPU加速功能

gpuDevice

正常情况下matlab会输出如下结果代表具备GPU加速功能：

  CUDADevice with properties:Name: 'GeForce GTX 980'Index: 1ComputeCapability: '5.2'SupportsDouble: 1DriverVersion: 7.5000ToolkitVersion: 6.5000MaxThreadsPerBlock: 1024MaxShmemPerBlock: 49152MaxThreadBlockSize: [1024 1024 64]MaxGridSize: [2.1475e+09 65535 65535]SIMDWidth: 32TotalMemory: 4.2950e+09AvailableMemory: 3.3203e+09MultiprocessorCount: 16ClockRateKHz: 1380000ComputeMode: 'Default'GPUOverlapsTransfers: 1KernelExecutionTimeout: 1CanMapHostMemory: 1DeviceSupported: 1DeviceSelected: 1

第二步：CPU和GPU之间的数据交换，大致有如下几个函数和功能：

（1）、将数据从CPU中搬入GPU，函数：gpuArray，用法 M = gpuArray(M)；

（2）、在GPU中计算完成后，将数据搬出到CPU存储，函数：gather，用法M=gather(M)。

下面给大家看看最简单的用法以及处理同样矩阵运算时的时间对比：

clear all
clc
M = rand(2000,2000);            % 生成一个随机矩阵
tic
[A1,B1] = eig(M);               % 求该随机矩阵的特征值和特征向量
t1=toc tic M = gpuArray(M); % 将数据从CPU中搬到GPU [A2,B2] = eig(M); % 求特征值和特征向量 A2 = gather(A2); % 将数据从GPU中搬到CPU t2 = toc

输出结果（运行时间对比）：

t1 = 14.1483
t2 =  9.1567

总结：虽然加速不是特别明显，不过还是非常给力的，需要说明的是，一般的GPU对于单精度型的数据运算加速更明显一点，因此我们在编写代码时，最好能够将数据从double型转换为single型，即M=single(M)，然后在使用M=gpuArray(M)，将数据搬迁到GPU进行计算，下面看看转换为单精度型后的时间对比：

clear all
clc
M = rand(2000,2000);            % 生成一个随机矩阵
tic
[A1,B1] = eig(M);                    % 求该随机矩阵的特征值和特征向量
t1=toctic
M = single(M);                     % 将数据转换为单精度型
M = gpuArray(M);                % 将数据从CPU中搬到GPU
[A2,B2] = eig(M);                 % 求特征值和特征向量
A2 = gather(A2);                 % 将数据从GPU中搬到CPU
t2 = toc

运行结果：

t1 =  14.8332
t2 =   5.0963

GPU对eig和svd进行加速，和cpu运行时间对比

clear all
A = rand(2000,2000);
tic
A1 = gpuArray(single(A));
[U,S,V] = svd(A1,'econ');
A2 = U*S*V';
A3 = gather(A2);
t = toc
tic
[U1,S1,V1] = svd(A,'econ');
A4 = U1*S1*V1';
t2 = tocerror = norm(A3-A4,'fro')tic
A1 = gpuArray(single(A));
[vv,dd] = eig(A1);
t3 = toc

结果：

t =    3.1564
t2 =    7.1644
error =    0.0032
t3 =    5.2244
t4 =   17.6389

是不是加速更明显了呢？　　

注：1、单精度型初始化矩阵函数例：X=rand(10,'single'); %定义在CPU上的一个10x10的随机初始化数组　

2、直接在GPU中初始化矩阵例：GX=rand(10,'gpuArray'); %直接在GPU设备上随机初始化一个10x10的数组　

　　3、判断数据DATA是否存在于GPU内存中例：TF=existOnGPU(DATA)

4、计算效率统计例：t=gputimeit(F,N) %返回执行F操作N次所需的时间，当N=1时可以缺省　

转载于:https://www.cnblogs.com/phyzrx/p/7475201.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/253514.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Matlab 使用GPU加速转载

相关文章

数字后端——可制造性设计

Cloudstack安装（二）

Pycharm 输出中文或打印中文乱码现象的解决办法

计算机系统结构——概述

BestCoder Round #91 1001 Lotus and Characters

Calendar的那些神坑

mkyaffs2image的用法

全景图像拼接——基本流程

SmartRaiden 和 Lighting Network 进行去中心化跨链原子资产交换

WPF 带CheckBox、图标的TreeView

win32框架,GDI图形编程写一个HelloWorld游戏_c语言

全景图像拼接——图像融合

极详细的ECC讲解 -OOB与ECC

前端进阶（8） - 前端开发需要了解的工具集合：webpack, eslint, prettier, ...

CMOS图像传感器——TOF 图像传感器

AndroidStudio创建jinLibs文件夹

内嵌Tomcat的Connector对象的静态代码块

YAFFS2文件系统在嵌入式LINUX系统中的应用

【Python爬虫学习笔记1】网络协议及请求基础

快速上手SpyGlass——基本流程

Matlab 使用GPU加速 转载

相关文章

Matlab 使用GPU加速转载