Tensorflow快餐教程(4) - 矩阵

摘要: Tensorflow矩阵基础运算

矩阵

矩阵的初始化

矩阵因为元素更多,所以初始化函数更多了。光靠tf.linspace,tf.range之类的线性生成函数已经不够用了。

可以通过先生成一个线性序列,然后再reshape成一个矩阵的方式来初始化。

例:

>>> g1 = tf.linspace(1.0,10.0,16)
>>> g1
<tf.Tensor 'LinSpace_6:0' shape=(16,) dtype=float32>
>>> g2 = tf.constant(sess.run(tf.reshape(g1,[4,4])))
>>> sess.run(g2)
array([[ 1.       ,  1.6      ,  2.2      ,  2.8000002],[ 3.4      ,  4.       ,  4.6000004,  5.2000003],[ 5.8      ,  6.4      ,  7.       ,  7.6000004],[ 8.200001 ,  8.8      ,  9.400001 , 10.       ]], dtype=float32)
>>> g2
<tf.Tensor 'Const_29:0' shape=(4, 4) dtype=float32>

tf.linspace生成了(16,)的一个向量,然后被reshape成(4,4)的矩阵。

生成全0值的矩阵

tf.zeros可以生成全0的矩阵,不指定类型时,默认为float32.

>>> g7 = tf.zeros([4,5])
>>> sess.run(g7)
array([[0., 0., 0., 0., 0.],[0., 0., 0., 0., 0.],[0., 0., 0., 0., 0.],[0., 0., 0., 0., 0.]], dtype=float32)

可以指定数据类型:

>>> g8 = tf.zeros([10,10],dtype=tf.int32)
>>> sess.run(g8)
array([[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]], dtype=int32)

生成全1的矩阵

类似地,我们可以用tf.ones生成值全为1的矩阵。
例:

>>> g9 = tf.ones([8,2],dtype=tf.int64)
>>> sess.run(g9)
array([[1, 1],[1, 1],[1, 1],[1, 1],[1, 1],[1, 1],[1, 1],[1, 1]])

将矩阵全部设成一个值

tf.ones和tf.zeros其实是特例,tf.fill才是更通用的功能:

>>> g10 = tf.fill([5,5],10.1)
>>> sess.run(g10)
array([[10.1, 10.1, 10.1, 10.1, 10.1],[10.1, 10.1, 10.1, 10.1, 10.1],[10.1, 10.1, 10.1, 10.1, 10.1],[10.1, 10.1, 10.1, 10.1, 10.1],[10.1, 10.1, 10.1, 10.1, 10.1]], dtype=float32)

生成对角矩阵

矩阵一个特点是经常是只有稀疏的值。最常用的就是对角阵,只有一条对角线上有值。
例:

>>> g11 =tf.diag([1,1,2,2])
>>> sess.run(g11)
array([[1, 0, 0, 0],[0, 1, 0, 0],[0, 0, 2, 0],[0, 0, 0, 2]], dtype=int32)

除了生成对角阵,我们还可以从一个矩阵中将对角线值获取成一个向量:

>>> g12 = tf.diag_part(g11)
>>> sess.run(g12)
array([1, 1, 2, 2], dtype=int32)
>>> g12
<tf.Tensor 'DiagPart:0' shape=(4,) dtype=int32>

随机生成初始化值

除了全0,全1,全确定值和对角线值,还有一种非常常用的方式就是生成随机值。
我们可以按正态分布来生成初始值:

>>> g13 = tf.random_normal([5,5])
>>> sess.run(g13)
array([[ 0.21010283,  1.083522  , -2.1688387 , -1.2340024 ,  0.9230036 ],[ 0.43592915, -0.7187195 , -1.3310403 ,  0.27570882,  1.3831469 ],[-0.42430717,  2.8005996 ,  1.1899991 ,  0.6987934 ,  1.6732428 ],[ 0.4975314 , -1.259698  ,  1.2508341 , -1.2581793 , -0.8776101 ],[ 0.49039882,  0.8129552 ,  1.2836359 , -0.3732389 , -2.034603  ]],dtype=float32)

可以指定平均值和标准差,默认均值为0,标准差为1。默认的类型为float32,反正不支持整数。

例:

>>> g14 = tf.random_normal([3,8], mean=1.0, stddev=2.0, dtype=tf.float32)
>>> sess.run(g14)
array([[ 3.7580974 , -2.7150466 , -2.107638  ,  1.7130036 , -0.8702172 ,-1.0325654 ,  3.1230848 , -0.82150674],[-1.3860679 ,  0.03262603, -0.63146615, -0.71946084,  1.182011  ,0.34882843,  2.3536258 , -1.0503623 ],[-3.6498313 ,  0.4458651 ,  2.9859743 ,  2.153699  ,  3.8967788 ,1.895072  ,  3.5918627 ,  1.9855003 ]], dtype=float32)

矩阵的转置

将矩阵中的元素基于对角线对称交换,叫做矩阵的转置transpose。

例:

>>> g3 = tf.transpose(g2)
>>> g3
<tf.Tensor 'transpose_1:0' shape=(4, 4) dtype=float32>
>>> sess.run(g3)
array([[ 1.       ,  3.4      ,  5.8      ,  8.200001 ],[ 1.6      ,  4.       ,  6.4      ,  8.8      ],[ 2.2      ,  4.6000004,  7.       ,  9.400001 ],[ 2.8000002,  5.2000003,  7.6000004, 10.       ]], dtype=float32)

1,4,7,10是对角线,在转置时保持不变。

在非方阵的情况下,转置后对角线仍然保持不变。
我们看一个2*3矩阵的例子:

>>> g4 = tf.linspace(1.0,10.0,6)
>>> g5 = tf.reshape(g4,[2,3])
>>> sess.run(g5)
array([[ 1.       ,  2.8      ,  4.6      ],[ 6.3999996,  8.2      , 10.       ]], dtype=float32)

对角线是1和8.2.
我们转置一下:

>>> g6 = tf.constant(sess.run(tf.transpose(g5)))
>>> sess.run(g6)
array([[ 1.       ,  6.3999996],[ 2.8      ,  8.2      ],[ 4.6      , 10.       ]], dtype=float32)

虽然从一个宽矩阵变成了高矩阵,但是对角线仍然是1和8.2.

矩阵的数学运算

加减运算

两个行列相同的矩阵可以进行加减运算。
例:

>>> h01 = tf.random_normal([4,4])
>>> h02 = tf.fill([4,4],1.0)
>>> h03 = h01 + h02
>>> sess.run(h03)
array([[ 1.959749  ,  1.2833667 ,  0.12137735,  1.0297428 ],[ 1.3971953 , -0.0582509 ,  1.1770982 ,  2.154177  ],[-1.1314301 ,  1.6063341 , -1.2442939 ,  1.2752731 ],[ 1.3077021 ,  0.42679614,  2.9681108 ,  1.6179581 ]],dtype=float32)

广播运算

例:

>>> h04 = h02 + 2.0
>>> sess.run(h04)
array([[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.]], dtype=float32)

矩阵乘积

"*"运算在矩阵乘法中,跟上节所讲一样,还是Hadamard积,就是对应元素的积,例:

>>> h05 = tf.reshape(tf.linspace(1.0,10.0,16),[4,4])
>>> sess.run(h05)
array([[ 1.       ,  1.6      ,  2.2      ,  2.8000002],[ 3.4      ,  4.       ,  4.6000004,  5.2000003],[ 5.8      ,  6.4      ,  7.       ,  7.6000004],[ 8.200001 ,  8.8      ,  9.400001 , 10.       ]], dtype=float32)
>>> h06 = tf.reshape(tf.linspace(1.0,16.0,16),[4,4])
>>> sess.run(h06)
array([[ 1.,  2.,  3.,  4.],[ 5.,  6.,  7.,  8.],[ 9., 10., 11., 12.],[13., 14., 15., 16.]], dtype=float32)
>>> sess.run(h05 * h06)
array([[  1.       ,   3.2      ,   6.6000004,  11.200001 ],[ 17.       ,  24.       ,  32.200005 ,  41.600002 ],[ 52.2      ,  64.       ,  77.       ,  91.200005 ],[106.600006 , 123.200005 , 141.00002  , 160.       ]],dtype=float32)

我们也可以用matmul函数,或者"@"运算符计算矩阵相乘的结果:

>>> h05 @ h06
<tf.Tensor 'matmul:0' shape=(4, 4) dtype=float32>
>>> sess.run(h05 @ h06)
array([[ 65.200005,  72.8     ,  80.40001 ,  88.      ],[132.40001 , 149.6     , 166.80002 , 184.      ],[199.6     , 226.40002 , 253.20001 , 280.      ],[266.8     , 303.2     , 339.60004 , 376.      ]], dtype=float32)

"@"是高版本Python中支持的操作,在tensorflow中重载它的函数为matmul。

逆矩阵 Inverse Matrices

定义I为单位对角矩阵,如果BA=I,那么我就说B是A的逆矩阵。可以通过matrix_inverse函数来获得逆矩阵,例:

>>> i01 = tf.diag([1.0,2.0,3.0,4.0])
>>> sess.run(i01)
array([[1., 0., 0., 0.],[0., 2., 0., 0.],[0., 0., 3., 0.],[0., 0., 0., 4.]], dtype=float32)
>>> i01_rev = tf.matrix_inverse(i01)
>>> sess.run(i01_rev)
array([[1.        , 0.        , 0.        , 0.        ],[0.        , 0.5       , 0.        , 0.        ],[0.        , 0.        , 0.33333334, 0.        ],[0.        , 0.        , 0.        , 0.25      ]], dtype=float32)

我们来验算一下i01_rev与i01相乘是不是单位矩阵:

>>> sess.run( i01_rev @ i01)
array([[1., 0., 0., 0.],[0., 1., 0., 0.],[0., 0., 1., 0.],[0., 0., 0., 1.]], dtype=float32)

果然是。

对角阵比较特殊,还满足交换律:

>>> sess.run( i01 @ i01_rev)
array([[1., 0., 0., 0.],[0., 1., 0., 0.],[0., 0., 1., 0.],[0., 0., 0., 1.]], dtype=float32)

求行列式的值以判断是否有逆矩阵

我们学习线性代数知道,如果一个矩阵要想有逆矩阵,它的行列式一定不能为0。

在Matlab和mathematica两大著名数学软件中,求行列式的函数名字很简单,就是det。
Tensorflow因为是个库,所以名字比较长,叫tf.matrix_determinant.

我们来看一个例子:

>>> A1 = [[1,1,1],[1,-1,-1],[5,-2,2]]
>>> A = tf.constant(A1, tf.float32)
>>> A
<tf.Tensor 'Const_3:0' shape=(3, 3) dtype=float32>
>>> sess.run(A)
array([[ 1.,  1.,  1.],[ 1., -1., -1.],[ 5., -2.,  2.]], dtype=float32)
>>> d = tf.matrix_determinant(A)
>>> sess.run(d)
-8.0

利用逆矩阵求解线性方程组

假设有下列方程组,求解:

x+y+z =1,
x-y-z = 2,
5x-2y+2z = 3

这个题中的系数矩阵就是我们刚才例子中的矩阵,我们已经求得行列式值为-8不等于0,所以我们可以通过用系数矩阵的逆矩阵乘以常数向量的方式求解。

>>> b = tf.constant([[1],[2],[3]],dtype=tf.float32)
>>> b
<tf.Tensor 'Const_4:0' shape=(3, 1) dtype=float32>
>>> sess.run(b)
array([[1.],[2.],[3.]], dtype=float32)
>>> sess.run(tf.matmul(tf.matrix_inverse(A),b))
array([[ 1.5000001],[ 0.875    ],[-1.3750001]], dtype=float32)

最后求得,x=1.5, y=0.875, z = -1.375.

原文链接

干货好文,请关注扫描以下二维码:



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521892.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为什么阿里程序猿纷纷在内网晒代码?

摘要&#xff1a; 大家知道&#xff0c;阿里有两万多名可爱的程序员。 他们也没什么别的爱好&#xff0c;就是多才多艺了一点&#xff1a;这帮阿里程序猿在改变世界前 要先撼动歌坛 就是热心肠了一点&#xff1a;阿里有个程序员&#xff0c;因为闯红灯上新闻了 虽然怕老婆但也能…

从七个方面,面试大厂高级工程师

戳蓝字“CSDN云计算”关注我们哦&#xff01;在上周&#xff0c;我密集面试了若干位Java后端的候选人&#xff0c;工作经验在3到5年间。我的标准其实不复杂&#xff1a;第一能干活&#xff1b;第二Java基础要好&#xff1b;第三最好熟悉些分布式框架。我相信其它公司招开发时&a…

Java需要掌握的底层知识_Java程序员应该掌握的底层知识

缓存缓存行&#xff1a;缓存行越大&#xff0c;局部性空间效率越高&#xff0c;但读取时间慢缓存行越小&#xff0c;局部性空间效率越低&#xff0c;但读取时间快取一个折中值&#xff0c;目前多用&#xff1a;64字节public class CacheLinePadding { //执行时间在4s左右public…

(vue基础试炼_01)使用vue.js 快速入门hello world

文章目录一、需求案例二、案例实现2.1. 原始js写法2.2. 怎样使用vue.js &#xff1f;2.3. 使用vue.js 写法三、案例vue简述&#xff1f;四、案例趣味延伸五、表达值作用及嘱咐语一、需求案例 在页面显示hello world 二、案例实现 2.1. 原始js写法 <!DOCTYPE html> &l…

如何让机器理解汉字一笔一画的奥秘?

摘要&#xff1a;从智能客服到机器翻译&#xff0c;从文本摘要生成到用户评论分析&#xff0c;从文本安全风控到商品描述建模&#xff0c;无不用到自然语言技术&#xff0c;作为人工智能领域的一个重要分支&#xff0c;如何让机器更懂得人类的语言&#xff0c;尤其是汉字这种强…

Logtail从入门到精通(三):机器分组配置

摘要&#xff1a; 基于集团内数年来的Agent运维经验总结&#xff0c;我们设计了一种灵活性更高、使用更加便捷、耦合度更低的配置&机器管理方式&#xff1a;自定义标识机器分组。此种方式对于动态环境非常适用&#xff0c;尤其适用于弹性伸缩服务和swarm、pouch(阿里docker…

(vue基础试炼_02)使用vue.js实现隔2秒显示不同内容

接上一篇&#xff1a;&#xff08;vue基础试炼_01&#xff09;使用vue.js 快速入门hello worldhttps://gblfy.blog.csdn.net/article/details/103841156 文章目录一、原始js写法① 效果图② 2秒之后二、使用vue实现① 思考② vue写法③ 效果图三、vue总结一、原始js写法 <!…

适合小团队作战,奖金+招聘绿色通道,这一届算法大赛关注下?

大赛背景伴随着5G、物联网与大数据形成的后互联网格局的逐步形成&#xff0c;日益多样化的用户触点、庞杂的行为数据和沉重的业务体量也给我们的数据资产管理带来了不容忽视的挑战。为了建立更加精准的数据挖掘形式和更加智能的机器学习算法&#xff0c;对不断生成的用户行为事…

银行业AI:炒作背后的现实——“尽管对新技术感到兴奋,但银行业态度非常谨慎”

摘要&#xff1a; 在人工智能火热的今天&#xff0c;银行业是如何看待人工智能对其的影响呢&#xff1f;答案可能出人意料。随着人工智能的发展&#xff0c;越来越多的行业都或多或少会受到该技术的影响。在博主之前的文章中&#xff0c;分析了人工智能、大数据以及VR对教育行业…

tcp分包传图片 如何还原_技术控丨超详细解析TCP重传机制

作者&#xff1a;Zhang_Jiawen &#xff1b; 来自&#xff1a;Dell技术社区TCP 的主要任务是很简单&#xff1a;打包和发送数据。TCP 与其他协议的不同之处在于使用滑动窗口来管理基本数据收发过程&#xff0c;同时确保数据流的有效及可靠传输&#xff0c;从而不致发送速率明显…

超详细!上线一个机器学习项目你需要哪些准备?

摘要&#xff1a; Canvas是用于设计和记录机器学习系统的模板。它比简单的文本文档具有优势&#xff0c;因为Canvas用简单的部件通过部件之间的相关性来寻找机器学习系统的关键组件。这个工具已经很流行&#xff0c;因为它对复杂项目进行了可视化操作。 在本文中&#xff0c;我…

漫画:什么是插入排序?

戳蓝字“CSDN云计算”关注我们哦&#xff01;————— 第二天 —————————————————人们如何进行扑克牌的排序呢&#xff1f;举个例子&#xff0c;比如我手中有红桃6,7,9,10这四张牌&#xff0c;已经处于升序排列&#xff1a;这时候&#xff0c;我又抓到了一…

(vue基础试炼_03)使用vue.js实现TodoList

接上一篇&#xff1a;&#xff08;vue基础试炼_02&#xff09;使用vue.js实现隔2秒显示不同内容https://gblfy.blog.csdn.net/article/details/103841818 指令作用v-for循环数据v-on绑定事件v-model数据的双向绑定文章目录一、需求说明① 案例文档② 基础代码③ 基础效果图二、…

Python API快餐教程(1) - 字符串查找API

摘要&#xff1a; 字符串查找API 字符串处理相关API 字符串是7种序列类型中的一种。除了序列的操作函数&#xff0c;比如len()来求字符串长度之外&#xff0c;Python还为字符串提供丰富到可以写个编辑器的API. 查找类API 首先&#xff0c;下面的查找API都是为了查找位置&#x…

因吵架总被骂,阿里程序猿一气之下发明“情侣吵架神器”

摘要&#xff1a; 最近&#xff0c;阿里有个叫虎跑的程序猿&#xff0c;发明了一个“吵架神器”。 到底是个什么黑科技&#xff1f; 最近&#xff0c;阿里有个叫虎跑的程序猿&#xff0c;发明了一个“吵架神器”。到底是个什么黑科技&#xff1f;和很多情侣一样&#xff0c;虎跑…

java中volatile关键字的含义_java中volatile关键字的含义

转自&#xff1a;http://www.cnblogs.com/aigongsi/archive/2012/04/01/2429166.html在java线程并发处理中&#xff0c;有一个关键字volatile的使用目前存在很大的混淆&#xff0c;以为使用这个关键字&#xff0c;在进行多线程并发处理的时候就可以万事大吉。Java语言是支持多线…

(vue基础试炼_04)使用组件改造TodoList

接上一篇&#xff1a;&#xff08;vue基础试炼_03&#xff09;使用vue.js实现TodoListhttps://gblfy.blog.csdn.net/article/details/103842233 指令说明v-bind传入绑定值文章目录一、前端页面组件化二、全局组件学习三、局部组件学习一、前端页面组件化 页面组件化&#xff1a…

我们到底该如何看待6G?

戳蓝字“CSDN云计算”关注我们哦&#xff01;近日&#xff0c;加拿大媒体报道&#xff0c;华为已确认在加拿大渥太华开启6G网络研究&#xff0c;已与加拿大多所大学的研究者展开洽谈。华为表示&#xff0c;自家的渥太华研发实验室将引领华为全球6G发展。图片来源网络消息传出之…

两年AI研究经验(教训)总结,进来看看吧!

摘要&#xff1a; 本文以过来人的身份将自身2年的研究经验做了一下分享&#xff0c;希望本文对于即将开始从事人工智能研究的朋友有所帮助。人工智能研究这个领域是有一定门槛的。对于初学者来说&#xff0c;一般通常的做法是直接购买一些热门的书籍&#xff0c;比如“西瓜书”…

C语言:字符串字面量及其保存位置

相关阅读 C语言https://blog.csdn.net/weixin_45791458/category_12423166.html?spm1001.2014.3001.5482 虽然C语言中不存在字符串类型&#xff0c;但依然可以通过数组或指针的方式保存字符串&#xff0c;但字符串字面量却没有想象的这么简单&#xff0c;本文就将对此进行讨论…