MKL学习——基本操作C++实现

前言

前面介绍了各种向量-向量,矩阵-向量,矩阵-矩阵的函数简介。根据自身目前状况,主要使用实数域的操作,也就是说关注单精度float类型的s和双精度double类型的d。还有就是用的基本都是全矩阵,没有经过压缩,也不是对称、三角、带状的某一种情况。所以主要还是总结一般的乘法、加法操作。

【注】代码都以单精度float的情况书写,主要流程要记住,使用mkl_malloc申请内存,使用mkl_free释放内存。n年没用过C++了,凑合看看吧。

学MKL的肯定对编程有一定程度了解,智能提示是一个很好的工具,在VS中,输入cblas_s以后,会自动补全所有的单精度操作函数,那么根据常规经验,就能判断出它到底用于做什么以及需要的参数;比如提示axpby意思就是a*xb*y。还有就是函数有两种,一种是有返回值,一种无返回值,怎么办,只能提示看函数的声明是void还是float或者是double类型即可。

向量-向量

加法

运算

y=ax+by

代码


#include<stdio.h>
#include<stdlib.h>
#include<mkl.h>
int main()
{float *A, *B;//两个向量int a=1, b=1;//标量int n = 5;//向量大小A = (float *)mkl_malloc(n * 1 * sizeof(float), 64);B = (float *)mkl_malloc(n * 1 * sizeof(float), 64);printf("The 1st vector is ");for (int i = 0; i < n; i++){A[i] = i;printf("%2.0f", A[i]);}printf("\n");printf("The 2st vector is ");for (int i = 0; i < n; i++){B[i] =i+1;printf("%2.0f", B[i]);}printf("\n");//计算a*A+b*Bcblas_saxpby(n, a, A, 1, b, B, 1);printf("The a*A+b*B is ");for (int i = 0; i < n; i++){printf("%2.0f", B[i]);}printf("\n");mkl_free(A);mkl_free(B);getchar();return 0;
}

结果

The 1st vector is  0 1 2 3 4
The 2st vector is  1 2 3 4 5
The a*A+b*B is  1 3 5 7 9

乘法

运算:向量点乘

代码:

//乘法
#include<stdio.h>
#include<stdlib.h>
#include <mkl.h>int main()
{float *A, *B;//两个向量int a = 1, b = 1;//标量int n = 5;//向量大小float res;A = (float *)mkl_malloc(n * 1 * sizeof(float), 64);B = (float *)mkl_malloc(n * 1 * sizeof(float), 64);printf("The 1st vector is ");for (int i = 0; i < n; i++){A[i] = i;printf("%2.0f", A[i]);}printf("\n");printf("The 2st vector is ");for (int i = 0; i < n; i++){B[i] = i + 1;printf("%2.0f", B[i]);}printf("\n");//乘法:对应元素乘积的加和res=cblas_sdot(n, A, 1, B, 1);printf("点乘结果: %2.0f",res);printf("\n");mkl_free(A);mkl_free(B);getchar();return 0;
}

结果:

The 1st vector is  0 1 2 3 4
The 2st vector is  1 2 3 4 5
点乘结果: 40

二范数

运算:二范数或者欧几里得范数,是所有元素平方和开根号

代码

//计算向量二范数
#include<stdio.h>
#include<stdlib.h>
#include<mkl.h>
void main()
{float *A;int n = 5;float res;A = (float *)mkl_malloc(n*sizeof(float), 64);printf("The original vector:\n");for (int i = 0; i < n; i++){A[i] = i + 1;printf("%2.0f ", A[i]);}printf("\n");res = cblas_snrm2(n, A, 1);//计算二范数printf("The norm2 of vector is:%2.6f", res);mkl_free(A);getchar();
}

结果:

The original vector1  2  3  4  5
The norm2 of vector is:7.416198

旋转

运算:将空间中一个点,绕原点旋转的角度

代码:以二维坐标点(2,0)绕原点旋转45°为例。代码有点问题,一释放内存就出错,具体原因是对两个向量开辟空间以后又让它们指向了别的地址,造成了开辟空间无用。所以调用Cblas函数,可以直接把指向数组的指针丢进去。暂时先这样理解吧,等把C++复习一遍再来看看分析的对不对。

//旋转,以二维空间中的一个点(2,0)绕原点旋转45°
#include<stdio.h>
#include<stdlib.h>
#include<mkl.h>
#include<math.h>
#define M_PI 3.14159265358979323846int main()
{float *A, *B;//A是坐标点,B是旋转矩阵float point1[] = { 2 };//旋转点x坐标float point2[] = { 0 };//旋转点y坐标float rotpoint[] = { cos(45.0*M_PI / 180), sin(45.0*M_PI / 180) };//A = (float *)mkl_malloc(1 * sizeof(float), 64);//B = (float *)mkl_malloc(1 * sizeof(float), 64);A = point1;B = point2;printf("The point is (%2.0f,%2.0f)",point1[0],point2[0]);printf("\n");//计算旋转后的点cblas_srot(1, A, 1, B, 1, rotpoint[0], rotpoint[1]);printf("The rotated is (%2.6f,%2.6f)", A[0], B[0]);printf("\n");//mkl_free(A);//mkl_free(B);getchar();return 0;
}

结果:还是比较正确的

The point is ( 2, 0)
The rotated is (1.414214,-1.414214)

缩放

运算

x=ax

代码

//计算向量缩放
#include<stdio.h>
#include<stdlib.h>
#include<mkl.h>
void main()
{float *A;int n = 5;float scal=0.1;A = (float *)mkl_malloc(n*sizeof(float), 64);printf("The original vector:\n");for (int i = 0; i < n; i++){A[i] = i + 1;printf("%2.0f ", A[i]);}printf("\n");cblas_sscal(n, scal, A, 1);//缩放printf("The scaled vector:\n");for (int i = 0; i < n; i++){printf("%2.1f ", A[i]);}mkl_free(A);getchar();
}

结果

The original vector1  2  3  4  5
The scaled vector0.1 0.2 0.3 0.4 0.5

交换

运算:交换两个向量

代码

//交换
#include<stdio.h>
#include<stdlib.h>
#include<mkl.h>int main()
{float *A, *B;//两个向量int a = 1, b = 1;//标量int n = 5;//向量大小A = (float *)mkl_malloc(n * 1 * sizeof(float), 64);B = (float *)mkl_malloc(n * 1 * sizeof(float), 64);printf("The 1st vector is ");for (int i = 0; i < n; i++){A[i] = i;printf("%2.0f", A[i]);}printf("\n");printf("The 2st vector is ");for (int i = 0; i < n; i++){B[i] = i + 1;printf("%2.0f", B[i]);}printf("\n");//交换ABcblas_sswap(n, A, 1, B, 1);printf("The 1st swapped vctor is");for (int i = 0; i < n; i++){printf("%2.0f", A[i]);}printf("\n");printf("The 2st swapped vctor is");for (int i = 0; i < n; i++){printf("%2.0f", B[i]);}printf("\n");mkl_free(A);mkl_free(B);getchar();return 0;
}

结果

The 1st vector is  0 1 2 3 4
The 2st vector is  1 2 3 4 5
The 1st swapped vctor is 1 2 3 4 5
The 2st swapped vctor is 0 1 2 3 4

最值

运算:求最大最小值

代码

//求最大最小值
#include<stdlib.h>
#include<stdio.h>
#include<mkl.h>
void main()
{float *A;//向量int n = 5;//向量大小int max, min;A = (float *)mkl_malloc(n * 1 * sizeof(float), 64);printf("The 1st vector is ");for (int i = 0; i < n; i++){A[i] = i;printf("%2.0f", A[i]);}printf("\n");//计算最值位置max=cblas_isamax(n, A, 1);min = cblas_isamin(n, A, 1);printf("The max value is %2.0f, position is %d\n", A[max], max + 1);printf("The min value is %2.0f, position is %d\n", A[min], min + 1);mkl_free(A);getchar();
}

结果

The 1st vector is  0 1 2 3 4
The max value is  4, position is 5
The min value is  0, position is 1

矩阵-向量

乘法1

运算:

y:=αAx+βy

代码

//矩阵-向量乘积
#include<stdio.h>
#include<stdlib.h>
#include<mkl.h>
int main()
{float *A, *B,*C;//A是矩阵,B是向量,C是向量int m = 2;//矩阵行数int n = 5;//向量维度,矩阵列数int a = 1, b = 1;//缩放因子A = (float *)mkl_malloc(m*n*sizeof(float), 64);B = (float *)mkl_malloc(n*sizeof(float), 64);C = (float *)mkl_malloc(m*sizeof(float), 64);//赋值,按行存储?printf("数组为\n");for (int i = 0; i < m*n; i++){if (i%n == 0 && i != 0)printf("\n");A[i] = i;printf("%2.0f",A[i]);}   printf("\n");printf("向量为\n");for (int i = 0; i < n; i++){B[i] = i + 1;printf("%2.0f", B[i]);}printf("\n");for (int i = 0; i < m*n; i++)C[i] = 0;//2*5的矩阵与5*1的向量相乘cblas_sgemv(CblasRowMajor, CblasNoTrans, m, n, a, A, n, B, 1, b, C, 1);printf("矩阵-向量乘法结果\n");for (int i = 0; i < m; i++){printf("%2.0f ", C[i]);}mkl_free(A);mkl_free(B);mkl_free(C);getchar();return 0;
}

结果

数组为0 1 2 3 45 6 7 8 9
向量为1 2 3 4 5
矩阵-向量乘法结果
40 115

乘法2

运算

A:=αxy+A,

代码

//矩阵-向量乘积
#include<stdio.h>
#include<stdlib.h>
#include<mkl.h>
int main()
{float *A, *B, *C;//A是矩阵,B是向量int m=2,n = 5;//B,C向量维度int a = 1;//缩放因子A = (float *)mkl_malloc(m*n*sizeof(float), 64);B = (float *)mkl_malloc(m*sizeof(float), 64);C = (float *)mkl_malloc(n*sizeof(float), 64);//赋值,按行存储?printf("数组为\n");for (int i = 0; i < m*n; i++){if (i%n == 0 && i != 0)printf("\n");A[i] = 1;printf("%2.0f", A[i]);}printf("\n");printf("向量1为\n");for (int i = 0; i < m; i++){B[i] = i + 1;printf("%2.0f", B[i]);}printf("\n");printf("向量2为\n");for (int i = 0; i < n; i++){C[i] = i+2;printf("%2.0f", C[i]);}printf("\n");//5*1向量乘以1*5向量,加上5*5矩阵cblas_sger(CblasRowMajor, m, n, a, B, 1, C, 1, A, n);printf("向量-向量相乘+矩阵的结果\n");for (int i = 0; i < m*n; i++){if (i%n == 0 && i != 0)printf("\n");printf("%2.0f ", A[i]);}mkl_free(A);mkl_free(B);mkl_free(C);getchar();return 0;
}

结果

数组为1 1 1 1 11 1 1 1 1
向量1为1 2
向量2为2 3 4 5 6
向量-向量相乘+矩阵的结果3  4  5  6  75  7  9 11 13

矩阵-矩阵

乘法1

运算

C:=αop(A)op(B)+βC,

代码

#include<stdio.h>
#include<stdlib.h>
#include<mkl.h>
int main()
{float *A, *B, *C;int m = 2, n = 3, k = 2;//A维度2*3,B维度2*3(计算时候转置),C维度2*2int a = 1, b = 1;//缩放因子A = (float *)mkl_malloc(m*n*sizeof(float), 64);B = (float *)mkl_malloc(n*k*sizeof(float), 64);C = (float *)mkl_malloc(m*k*sizeof(float), 64);printf("矩阵1为\n");for (int i = 0; i < m*n; i++){if (i != 0 && i%n == 0)printf("\n");A[i] = i + 1;printf("%2.0f", A[i]);}printf("\n");printf("矩阵2为\n");for (int i = 0; i < n*k; i++){if (i != 0 && i%k == 0)printf("\n");B[i] = 1;printf("%2.0f", B[i]);}printf("\n");printf("矩阵3为\n");for (int i = 0; i < m*k; i++){if (i != 0 && i%k == 0)printf("\n");C[i] = i;printf("%2.0f", C[i]);}printf("\n");printf("结果矩阵\n");cblas_sgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, m, k, n, a, A, n, B, k, b, C, k);//注意mkn的顺序☆for (int i = 0; i < m*k; i++){if (i != 0 && i%k == 0)printf("\n");printf("%2.0f", C[i]);}printf("\n");mkl_free(A);mkl_free(B);mkl_free(C);getchar();return 0;
}

结果

矩阵1为1 2 34 5 6
矩阵2为1 11 11 1
矩阵3为0 12 3
结果矩阵6 7
1718

乘法2

依旧是上述的功能,此处尝试一下

#include<stdio.h>
#include<stdlib.h>
#include<mkl.h>
int main()
{float *A, *B, *C;int m = 2, n = 3, k = 2;//A维度2*3,B维度2*3(计算时候转置),C维度2*2int a = 1, b = 1;//缩放因子A = (float *)mkl_malloc(m*n*sizeof(float), 64);B = (float *)mkl_malloc(k*n*sizeof(float), 64);C = (float *)mkl_malloc(m*k*sizeof(float), 64);printf("矩阵1为\n");for (int i = 0; i < m*n; i++){if (i != 0 && i%n == 0)printf("\n");A[i] = i + 1;printf("%2.0f", A[i]);}printf("\n");printf("矩阵2为\n");for (int i = 0; i < k*n; i++){if (i != 0 && i%n == 0)printf("\n");B[i] = 1;printf("%2.0f", B[i]);}printf("\n");printf("矩阵3为\n");for (int i = 0; i < m*k; i++){if (i != 0 && i%k == 0)printf("\n");C[i] = i;printf("%2.0f", C[i]);}printf("\n");printf("结果矩阵\n");cblas_sgemm(CblasRowMajor, CblasNoTrans, CblasTrans, m, k, n, a, A, n, B, n, b, C, k);//注意mkn的顺序☆for (int i = 0; i < m*k; i++){if (i != 0 && i%k == 0)printf("\n");printf("%2.0f", C[i]);}printf("\n");mkl_free(A);mkl_free(B);mkl_free(C);getchar();return 0;}

结果

矩阵1为1 2 34 5 6
矩阵2为1 1 11 1 1
矩阵3为0 12 3
结果矩阵6 7
1718

注意点

最主要的是记住参数顺序,首先是矩阵op(A)和的C行数,op代表操作,乘法2中的op就是转置;然后是矩阵op(B)C的列数;随后才是op(A)的列数和op(B)的行数。对于乘法2中的第二个矩阵,也就是B<script type="math/tex" id="MathJax-Element-399">B</script>矩阵,虽然转置了,但是还是以不转置时候,以行存储方式的引导维度,也就是列数为输入参数。
而且丢入函数的参数,并不一定是mkl_malloc开辟的空间,也可以是其它数组,用指针指向数组地址,然后丢到函数就行了。
奉上code(vs2013): MKL -C++基本操作

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/246651.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

相机矩阵(Camera Matrix)

前言 最近翻阅关于从2D视频或者图片中重构3D姿态的文章及其源码&#xff0c;发现都有关于摄像机参数的求解&#xff0c;查找了相关资料&#xff0c;做一下笔记。 国际惯例&#xff0c;来一波参考网址 透视变换、透镜畸变及校正模型、相机校正(Camera Calibration)、Matlab相…

损失函数梯度对比-均方差和交叉熵

前言 我们都知道在机器学习中&#xff0c;希望算法或者网络收敛更快&#xff0c;有些是对数据预处理&#xff0c;尤其是Batch Normalization&#xff0c;有些是采用不同的激活函数&#xff0c;尤其是Relu激活函数取得了巨大的成功&#xff0c;还有一种加速收敛方法是更换损失函…

如何选择深度学习优化器

前言 转载地址&#xff1a;如何选择深度学习优化器 作者&#xff1a;不会停的蜗牛 CSDN AI专栏作家 在很多机器学习和深度学习的应用中&#xff0c;我们发现用的最多的优化器是 Adam&#xff0c;为什么呢&#xff1f; 下面是 TensorFlow 中的优化器&#xff0c; https://w…

【caffe-Windows】以mnist为例的hdf5单标签处理——matlab实现

前言 主要是想尝试看一下多标签的caffe是如何进行输入输出的&#xff0c;但是目前还未找到基于原始caffe做多标签输入的代码&#xff0c;大部分都是基于源码做了一部分修改实现多标签分类&#xff0c;caffe官网倒是有一个多标签的Python程序&#xff0c;这个我慢慢研究研究&am…

【caffe-Windows】基于Python多标签方法——VOC2012数据集

前言 按照上一篇博客所遗留的话题&#xff1a;多标签分类&#xff0c;进行初步探索&#xff0c;此篇博客针对caffe官网的多分类进行配置&#xff0c;只不过是Python接口的&#xff0c;不过官网在开头说明可以使用HDF5或者LMDB进行操作&#xff0c;只不过Python更加方便罢了 国…

【theano-windows】学习笔记一——theano中的变量

前言 因为目前需要搭建一些关于RBM或者其他之类的模型&#xff0c;感觉不太会折腾caffe&#xff0c;然而我发现了几个有趣网址&#xff0c;使用theano实现了各种各样的模型&#xff0c;所以&#xff0c;尝试学一下theano。主要以官方教程为主&#xff0c;所以博客会以译文的方…

【theano-windows】学习笔记二——theano中的函数和共享参数

前言 上一篇博客中学到了theano中的变量类型&#xff0c;也就是dscalar、dvector之类的, 然后还有一个theano.function和eval函数, 将我们所定义的操作转换成theano可执行的函数&#xff0c;类似于def, 还有就是简单的线性代数运算操作。 在神经网络(NN)中, 我们声明了权重、…

【theano-windows】学习笔记三——theano中的导数

前言 就一个NN而言&#xff0c;包含梯度、偏置、参数更新&#xff0c;而前面第一篇博客学习了theano中符号变量的定义, 第二篇博客学习了变量的随机初始化, 变量之间的互相操作(类似于sigmoid(w∗xb)), 但是参数更新还应涉及到损失函数的偏导计算&#xff0c;这一章节就是看看…

【theano-windows】学习笔记四——theano中的条件语句

前言 按照官网教程&#xff0c;学习条件语句Switch和ifelse的使用 参考地址: conditions 性能对比 ifElse是将布尔变量和两个变量当做输入 Switch是将张量和两个变量当做输入. 因为Switch是元素级操作&#xff0c;所以比ifElse更具一般性 Switch需要对所有输出变量进行评…

【theano-windows】学习笔记五——theano中张量部分函数

前言 至此感觉应该可以写出一个logistic回归程序了&#xff0c;但是为了达到对theano中张量的更灵活的使用, 还是先看一下thenao.tensor对变量都提供了哪些操作&#xff0c;最全的文档戳这里或者这里, 这里就稍微摘取一点自我感觉以后可能用得多的函数 基本张量函数 创建张量…

【theano-windows】学习笔记六——theano中的循环函数scan

前言 Scan是Theano中最基础的循环函数, 官方教程主要是通过大量的例子来说明用法. 不过在学习的时候我比较习惯先看看用途, 然后是参数说明, 最后再是研究实例. 国际惯例, 参考网址 官网关于Scan的11个例子 官网更全面的介绍 简介 用途 递归的一般形式, 可以被用于循环s…

多标签分类、多任务分类、多输出回归概念

前言 虽然不是搞分类的&#xff0c;但是还是看看多标签和多分类的区别。为了避免自己的错误理解, 当然是选择原谅他啊…….找正规文档看哇. 以下翻译分别来自scikit-learn.org和 维基 喂鸡百科 国际惯例&#xff0c;贴上来源: Multiclass and multilabel algorithms Multi-…

【theano-windows】学习笔记七——logistic回归

前言 前面只是学了最基本的theano操作&#xff0c;但是theano中还有很多其他的东西&#xff0c;比如图结构&#xff0c;自定义函数等&#xff0c;这些暂时没有用到就先不看了&#xff0c;后续学啥用啥&#xff0c;没必要一口气吃个胖子&#xff0c;免得消化不良还把前面吃的东…

【theano-windows】学习笔记八——预备知识

前言 按照上一个博客所说的&#xff0c;直接按照深度学习0.1文档进行学习&#xff0c;当然在此之前我们需要了解这一系列教程所需要的数据集&#xff0c;以及一些概念性的东西 国际惯例&#xff0c;参考博客网址&#xff1a; 深度学习0.1文档 深度学习0.1文档-中文翻译 基…

【theano-windows】学习笔记九——softmax手写数字分类

前言 上一篇博客折腾了数据集的预备知识, 接下来按照官方的Deep learning 0.1 documentation一步步走, 先折腾softmax, 关于softmax和logistic回归分类的联系, 我在之前写过一个小博客 国际惯例, 参考博客走一波: Classifying MNIST digits using Logistic Regression soft…

【theano-windows】学习笔记十——多层感知机手写数字分类

前言 上一篇学习了softmax, 然后更进一步就是学习一下基本的多层感知机(MLP)了. 其实多层感知机同时就是w*xb用某个激活函数激活一下, 得到的结果作为下一层神经元的输入x, 类似于 output⋯f3(f2(f1(x∗w1b2)∗w2b2)∗w3b3)⋯output=\cdots f^3(f^2(f^1(x*w^1+b^2)*w^2+b^2)*…

【theano-windows】学习笔记十一——theano中与神经网络相关函数

前言 经过softmax和MLP的学习, 我们发现thenao.tensor中除了之前的博客【theano-windows】学习笔记五——theano中张量部分函数提到的张量的定义和基本运算外, 还有一个方法称为nnet, 如果自己实现过前面两篇博客中的代码就会发现用到了theano.tensor.nnet.sigmoid和thenao.te…

【caffe-windows】全卷积网络特征图分析

前言 突然就想分析一下全卷积网络的转置卷积部分了, 就是这么猝不及防的想法, 而且这个网络对图片的输入大小无要求&#xff0c;这么神奇的网络是时候分析一波了&#xff0c;我个人的学习方法调试代码&#xff0c;然后对照论文看理论 本次分析主要针对每层的权重大小和特征图…

【theano-windows】学习笔记十二——卷积神经网络

前言 按照进度, 学习theano中的卷积操作 国际惯例, 来一波参考网址 Convolutional Neural Networks (LeNet) 卷积神经网络如何应用在彩色图像上&#xff1f; 卷积小知识 三大特性&#xff1a;局部感知(稀疏连接), 权值共享, 池化 上图很重要, 描述的是前一个隐层m-1具有四…

【theano-windows】学习笔记十三——去噪自编码器

前言 上一章节学习了卷积的写法,主要注意的是其实现在theano.tensor.nnet和theano.sandbox.cuda.dnn中都有对应函数实现, 这一节就进入到无监督或者称为半监督的网络构建中. 首先是自编码器(Autoencoders)和降噪自编码器(denoising Autoencoders) 国际惯例, 参考网址: Denoi…