C++ 利用硬件加速矩阵乘法

点击蓝字

752dd79bccd939e66cb1814358655a1b.png

关注我们

来源于网络,侵删

1.矩阵乘法定义

d5cba5128a6c5af51869d13df19ba152.png

2.矩阵类封装

我们用 C++封装了一个n × m 的矩阵类,用二维数组来存储数据,定义如下:

#define MAXN 1000
#define LL __int64class Matrix {
private:int n, m;LL** pkData;
public:Matrix() : n(0), m(0) {pkData = NULL;}void Alloc() {pkData = new LL *[MAXN];                       // 1)for (int i = 0; i < MAXN; ++i) {pkData[i] = new LL[MAXN];}}void Dealloc() {if (pkData) {for (int i = 0; i < MAXN; ++i) {           // 2)delete [] pkData[i];}delete[] pkData;pkData = NULL;}}
};

9c9520180444575e6f16d0e528d61cfc.png

3.矩阵乘法实现

(1)ijk 式

最简单的矩阵乘法实现如下:

class Matrix {...
public:void Multiply_ijk(const Matrix& other, Matrix& ret) {// assert(m == other.n);ret.Reset(n, other.m);int i, j, k;for (i = 0; i < n; i++) {for (j = 0; j < other.m; j++) {for (k = 0; k < m; k++) {ret.pkData[i][j] += pkData[i][k] * other.pkData[k][j];}}}}
};

这种方法被称为 ijk 式,对矩阵乘法 A × B = C,枚举 A 的每一行,再枚举 B 的每一列,分别对应相乘后放入矩阵 C的对应位置中,如下图所示;

39cdda22c8aaf34ba3e9bec66b8b6574.png

(2)ikj 式

对上述算法进行一些改进,交换两个内层循环的位置,得到如下算法:

class Matrix {...
public:void Multiply_ikj(const Matrix& other, Matrix& ret) {// assert(m == other.n);ret.Reset(n, other.m);int i, j, k;for (i = 0; i < n; i++) {for (k = 0; k < m; k++) {LL v = pkData[i][k];for (j = 0; j < other.m; j++) {ret.pkData[i][j] += v * other.pkData[k][j];}}}}
};

这种方法被称为ikj 式,对矩阵乘法 A × B = C ,行优先枚举 A的每一个格子,再枚举 B的每一行,分别对应相乘后放入矩阵 C的对应位置中,每次相乘得到的 C 都是部分积,如下图所示,用绿色的深浅来表示这个值是否已经完整求得;

ef23ee11bf4cbff74edded90773e144d.png

(3)kij 式

对上述算法再进行一些改进,交换两个外层循环的位置,得到如下算法:

class Matrix {...
public:void Multiply_kij(const Matrix& other, Matrix& ret) {// assert(m == other.n);ret.Reset(n, other.m);int i, j, k;for (k = 0; k < m; k++) {for (i = 0; i < n; i++) {LL v = pkData[i][k];for (j = 0; j < other.m; j++) {ret.pkData[i][j] += v * other.pkData[k][j];}}}}
};

这种方法被称为kij 式,对矩阵乘法 A × B = C ,列优先枚举 A的每一个格子,再枚举 B的每一行,分别对应相乘后放入矩阵 C 的对应位置中,每次相乘得到的 C 都是部分积,如下图所示,用绿色的深浅来表示这个值是否已经完整求得;

a5c5ce8c900dc551d812e332d3c384dc.png

4.时间测试

e5af0eef9b0680b873837c6ceb9137de.png

5.原理分析

  • 原因是因为 CPU 访问内存的速度比 CPU 计算速度慢得多,为了解决速度不匹配的问题,在 CPU 与 内存 之间加了高速缓存cache。高速缓存 cache 的存在大大提高了 CPU 访问数据的速度。但是当内存访问不连续的时候,就会导致 cache 命中率降低,所以为了加速,就要尽可能使内存访问连续,即不要跳来跳去。

  • 矩阵

6.最后结论

运行速度:

ikj≈kij>ijk

0e8c6a185ab99fb6264d95d291410797.gif

如果你年满18周岁以上,又觉得学【C语言】太难?想尝试其他编程语言,那么我推荐你学Python,现有价值499元Python零基础课程限时免费领取,限10个名额!
▲扫描二维码-免费领取

302e93d75213d447823ae0022e4c3112.gif

戳“阅读原文”我们一起进步

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/337318.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

redis分片_Redis分片

redis分片本文是我们学院课程的一部分&#xff0c;标题为Redis NoSQL键值存储 。 这是Redis的速成课程。 您将学习如何安装Redis和启动服务器。 此外&#xff0c;您还会在Redis命令行上乱七八糟。 接下来是更高级的主题&#xff0c;例如复制&#xff0c;分片和集群&#xff0c…

解析C++全排列

点击蓝字关注我们来源于网络&#xff0c;侵删1.C实现全排列的函数next_permutation(start,end)这个函数在暴力解决问题方面有很大作用&#xff0c;使用时需要引入头文件 < algorithm >&#xff0c;当当前序列不存在下一个序列时就会结束&#xff0c;若想得到一个序列的全…

redis开启redis_Redis聚类

redis开启redis本文是我们学院课程的一部分&#xff0c;标题为Redis NoSQL键值存储 。 这是Redis的速成课程。 您将学习如何安装Redis和启动服务器。 此外&#xff0c;您还会在Redis命令行上乱七八糟。 接下来是更高级的主题&#xff0c;例如复制&#xff0c;分片和集群&#…

C++ 读取文件操作

点击蓝字关注我们来源于网络&#xff0c;侵删1.先上代码&#xff1a;#include <fstream> #include<iostream> using namespace std;//文本文件读文件 void test01() {//1、包含头文件//2、创建流对象ifstream ifs;//3、打开文件并且判断是否打开成功ifs.open("…

C/C++,判断变量的类型

点击蓝字关注我们来源于网络&#xff0c;侵删出于某个奇葩需求&#xff0c;研究了一下c/c如何判断变量类型&#xff0c;整理总结在此&#xff0c;分享给大家&#xff0c;也避免自己以后绕弯。一、c判断变量类型c中&#xff0c;可以利用typeid()来判断变量类型。第一步&#xff…

c/c++语言实现登陆界面

点击蓝字关注我们来源自网络&#xff0c;侵删一.整体功能介绍实现一个登陆界面1 输出一个登陆界面2 用户名能够实现邮箱验证&#xff0c;regex库&#xff0c;密码要不可见3 进度条的模拟实现4 音乐播放二.分步实现1.输出一个登陆界面首先对此功能使用到的函数进行简单的介绍。s…

spark restful_Spark入门:也可以用Java创建轻量级的RESTful应用程序

spark restful最近&#xff0c;我一直在使用Spark &#xff08;一种Java的Web框架&#xff0c;与Apache Spark 不相关&#xff09;编写RESTful服务。 当我们计划写这篇文章时&#xff0c;我已经做好了不可避免的接口&#xff0c;样板代码和深层层次结构的Java风格的准备。 令我…

C++的get()函数与getline()函数使用详解

点击蓝字关注我们来源自网络&#xff0c;侵删一.C的get()函数使用详解1.C get()函数get()函数是cin输入流对象的成员函数&#xff0c;它有3种形式&#xff1a;无参数的&#xff1b;有一个参数的&#xff1b;有3个参数的。1) 无参数的其调用形式为cin.get()用来从指定的输入流中…

电脑所有程序里有不一样颜色_12个好玩的电脑屏保,让你成为别人眼中最靓的仔。...

Hello 大家好&#xff0c;这里是工具狂人。作为一个靠打字(哦不&#xff0c;搬砖)为生的新媒体小编&#xff0c;每天多数时候都是对着电脑屏幕&#xff0c;中途有时会拿起手机回复消息、查看短信、刷起微博。刷手机的时间一长&#xff0c;眼前的电脑会自动打开系统的屏保程序&a…

java8 函数式编程_如何使用Java 8函数式编程生成字母序列

java8 函数式编程我偶然发现了用户“ mip”一个有趣的堆栈溢出问题 。 问题是&#xff1a; 我正在寻找一种生成字母序列的方法&#xff1a; A, B, C, ..., Z, AA, AB, AC, ..., ZZ.可以很快将其识别为Excel电子表格的标题&#xff0c;它确实做到了&#xff1a; 到目前为止&a…

C++判断变量/对象/枚举类型的简单方式

点击蓝字关注我们来源于网络&#xff0c;侵删1.关键点<typeinfo>使用typeid()操作符所需包含的头文件。typeid()获取变量类型信息的操作符&#xff0c;其返回值类型为std::typeinfo。我们可使用typeid(n) typeid(int)的方式来判断变量n是否为类型int。注&#xff1a;可以…

C++ 空指针和野指针

点击蓝字关注我们来源于网络&#xff0c;侵删1.空指针指针变量指向内存中编号为0的空间为空指针。空指针指向的内存空间是不可以访问的 。代码&#xff1a;#include<iostream> using namespace std; int main() {int a 10;int * p &a;cout << p << end…

sap abap开发从入门到精通_SAP开发-ABAP数据字典(锁)

企业级软件或开发框架&#xff0c;必然支持后台高并发&#xff0c;即支持多人同时访问数据库。SAP作为资深企业管理软件&#xff0c;自然也不例外&#xff0c;ABAP可以很方便的开发出支持高并发的程序&#xff0c;要实现高并发&#xff0c;正确使用锁对象是其中一个重要环节&am…

(acm)C++加速输入的几种方法

点击蓝字关注我们来源于网络&#xff0c;侵删1.CIO流的同步和绑定在C中&#xff0c;cin和cout的速度其实不并不慢&#xff0c;C中的流的IO速度相当的快&#xff0c;其速度与初始设定的缓存区大小和硬盘的IO速度有关。但在C中&#xff0c;为了兼容C的IO(scanf和printf)&#xff…

服务器编写_编写下载服务器。 第六部分:描述您发送的内容(内容类型等)...

服务器编写就HTTP而言&#xff0c;客户端下载的只是一堆字节。 但是&#xff0c;客户真的很想知道如何解释这些字节。 它是图像吗&#xff1f; 还是ZIP文件&#xff1f; 本系列的最后一部分描述了如何向客户端提示她下载的内容。 设置 内容类型描述了返回的资源的MIME类型 。 …

C语言与C++的区别终于有人说清楚了!

点击蓝字关注我们来源于网络&#xff0c;侵删1、前言在很大程度上&#xff0c;C是C的超集&#xff0c;这意味着一个有效的C程序也是一个有效的C程序。C和C的主要区别是&#xff0c;C支持许多附加特性。但是&#xff0c;C中有许多规则与C稍有不同。这些不同使得C程序作为C程序编…

postgresql两个列模糊比较_数据分析之SQL优化系列(二)---PostgreSQL 的索引

参考《PostgreSQL11.2-中文手册》下面这个链接&#xff0c;讲的通俗易懂&#xff0c;可以看看。数据分析师不得不知道的SQL优化 - 鑫获 - 博客园​www.cnblogs.com索引是提高数据库性能的常用途径。比起没有索引&#xff0c;使用索引可以让数据库服务器更快找到并获取特定行。但…

高达 36 斤的 C/C++ 编译器?

点击蓝字关注我们来源于网络&#xff0c;侵删前言软件有重量吗&#xff1f;有人说&#xff0c;现代的软件主要搭载在硬件之上&#xff0c;只有占用内存的大小&#xff1b;也有人说&#xff0c;软件都是在网络上下载下来的&#xff0c;哪有什么重量可言&#xff1b;还有人说&…

双屏全屏跳回到主屏_双屏笔记本了解下?剪视频不要太好使

[PConline 评测]每天一开始上班&#xff0c;我们就要开始跟各种电脑程序和窗口打交道&#xff0c;而当面对各种信息和数据的轰炸时&#xff0c;恨不得就要把ALTTAB两个键给磨烂了。↑每天至少要面对十多个窗口gif而今天&#xff0c;笔记本厂商也不再吝啬于给予用户更多更大的屏…

一例看懂C语言程序中的内聚和耦合

点击蓝字关注我们来源自网络&#xff0c;侵删一、原理篇&#xff08;清楚相关原理的读者&#xff0c;请直接看第二部分示例篇&#xff09;在软件工程中&#xff0c;模块的内聚和耦合是度量模块化质量的标准之一。内聚是指模块的功能强度的度量&#xff0c;即一个模块内部各个元…