[转载]Tensorflow 的reduce_sum()函数的axis,keep_dim这些参数到底是什么意思?

转载链接:https://www.zhihu.com/question/51325408/answer/125426642
来源:知乎

这个问题无外乎有三个难点:

  1. 什么是sum
  2. 什么是reduce
  3. 什么是维度(indices, 现在均改为了axis和numpy等包一致)

sum很简单,就是求和,那么问题就是2和3,让我们慢慢来讲。其实彻底讲清楚了这个问题,很多关于reduce,维度的问题都会恍然大悟。

0. 到底操作哪个维度??

sum这个操作完全可以泛化为任意函数,我们就以sum为例,来看看各种情况。

首先是1维(按照tensorflow的说法其实是0维,后面会说)就是这样:

a = 1
sum(a) => 1 

那么看看2维的情况,为了看的更清楚,特意写成了矩阵的形式:

a = [[1,2], [3,4]] sum(a) => ??? 

仔细观察,那么问题来了,sum(a)到底应该是多少?有人说,当然是[3, 7](“横着加”[[1+2],[3+4]]),有人说 不应该是[4, 6](“竖着加”[[1+3],[2+4]]) 吗?还有人或说,不应该是10(全加在一起)吗?

谁是对的?

都是对的。

所以,对于多维数组元素的相加,如果不指定“如何加”,结果是未定义的,之所以有些时候没有指定也可以得到结果,是因为不同的软件或框架有默认的行为。对于tensorflow,默认行为是最后一种,也就是全加在一起。

1. 什么是维度?什么是轴(axis)?如何索引轴(axis)?

注:对Axis比较熟悉的读者可跳过这部分解释,只看加粗字体。

 

这是一个很大的问题,到底什么是维度呢?维基百科说:

维度,又称维数,是数学中独立参数的数目。在物理学和哲学的领域内,指独立的时空坐标的数目。
0维是一点,没有长度。1维是线,只有长度。2维是一个平面,是由长度和宽度(或曲线)形成面积。3维是2维加上高度形成“体积面”。虽然在一般人中习惯了整数维,但在分形中维度不一定是整数,可能会是一个非整的有理数或者无理数。

妈呀,好复杂,我只是想写个tensorflow代码呀。

那么,编程时,你就可以简单的认为:

维度是用来索引一个多维数组中某个具体数所需要最少的坐标数量。

把这句话多读几遍,我想你肯定会有所顿悟。这里之所以说第一个1维的例子时0维,是因为,一个数字根本不需要索引,因为就只有一个呀。所有不同维度的形式如下:

0维,又称0维张量,数字,标量:1

1维,又称1维张量,数组,vector:[1, 2, 3]

2维,又称2维张量,矩阵,二维数组:[[1,2], [3,4]]

3维,又称3维张量,立方(cube),三维数组:[ [[1,2], [3,4]], [[5,6], [7,8]] ]

n维:你应该get到点了吧~

再多的维只不过是是把上一个维度当作自己的元素

1维的元素是标量,2维的元素是数组,3维的元素是矩阵。

从0维到3维,边看边念咒语“维度是用来索引一个多维数组中某个具体数所需要最少的坐标。”

在纸上写写看,想要精确定位一个数字,需要几个数字呢?比如上面例子中的3维数组,我们想要3这个数字,至少要3个数字定位,它的坐标是(0为索引起点):[0, 1, 0]

好了,现在就能说了,什么是轴(axis),如何索引axis(代码中常用的变量名,后文就用axis代表轴)。

什么是axis,编程时,你就可以简单的认为:

axis是多维数组每个维度的坐标。

同样,把这句话多读几遍,我想你一定有体悟。

还拿3维来说,数字3的坐标是[0, 1, 0],那么第一个数字0的axis是0,第二个数字1的axis是1,第三个数字0的axis是2。

让我们再看看我们是如何得到3这个数字的:

  1. 找到3所在的2维矩阵在这个3维立方的索引:0
  2. 找到3所在的1维数组在这个2维矩阵的索引:1
  3. 找到3这个数这个1维数组的索引:0

(这里最好写在纸上看一看,括号比较多。)

也就是说,对于[ [[1,2], [3,4]], [[5,6], [7,8]] ]这个3维情况,[[1,2],[[5,6]], [[3,4], [7,8]]这两个矩阵(还记得吗,高维的元素低一个维度,因此三维立方的元素是二维矩阵)的axis是0,[1,2],[3,4],[5,6],[7,8]这4个数组(二维矩阵的元素是一维数组)的axis是1,而1,2,3,4,5,6,7,8这8个数的axis是2。

越往里axis就越大,依次加1。

那么,对于3维的情况,令a = [ [[1,2], [3,4]], [[5,6], [7,8]] ],tf.reduce_sum(a, axis=1)应该输出[[ 4, 6], [12, 14]],这就是处在axis=1的4个数组相加的结果,并reduce掉了一个维度。

这里需要注意的是,axis可以为负数,此时表示倒数第axis个维度,这和Python中列表切片的用法类似。

那么什么是reduce呢?

2. 什么是reduce

reduce这个词字面上来讲,大多称作“归约”,但这个词太专业了,以至于第一眼看不出来意思。我更倾向于解释为“塌缩”,这样就形象多了。对一个n维的情况进行reduce,就是将执行操作的这个维度“塌缩”。还是上面tf.reduce_sum(a, axis=1)的例子,输出[[ 4, 6], [12, 14]]是二维,显然是被“塌缩”了,塌缩的哪个维度呢?就是被操作的维度,第2个维度,也就是axis=1(0开始索引)。tf.reduce_sum(a, axis=1)具体执行步骤如下:

  1. 找到a中axis=1的元素,也就是[1,2],[3,4],[5,6],[7,8]这4个数组(两两一组,因为前两个和后两个的地位相同)
  2. 在axis=1的维度进行相加也就是[1,2]+[3,4]=[4,6],[5,6]+[7,8]=[12, 14]
  3. “塌缩”这一维度,也就是说“掉一层方括号”,得出[[ 4, 6], [12, 14]]

接下来是一个附加问题:

3. 什么是keepdims

上面的reduce已经解释了,“塌缩”的是被操作的维度,那么keepdims也就是保持维度,直观来看就是“不掉一层方括号”,不掉哪层方括号呢?就是本来应该被塌缩的那一层(详细解释见评论)。tf.reduce_sum(a, axis=1, keepdims=True)得出[[[ 4, 6]], [[12, 14]]],可以看到还是3维。这种尤其适合reduce完了要和别的同维元素相加的情况。

转载于:https://www.cnblogs.com/jfdwd/p/11184160.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/550144.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

多多进宝推广团队_多多进宝推广形式及推手寻找、佣金结算方式是怎样的?

多多进宝是拼多多下的一款推广工具,主要是针对于想要提高自己店铺产品的销量以及获取更多流量的拼多多商家来展开的!但是,目前为止还有很多拼多多商家对多多进宝的一个运用不太了解,以至于有一些拼多多商家在使用多多进宝时有很大…

rtsp 通过 浏览器播放

安装docker ffmpeg https://blog.csdn.net/m1f2c3/article/details/93624289 docker pull jrottenberg/ffmpeg docker run -it --entrypointbash jrottenberg/ffmpeg docker start ... 下载jsmpeg npm install -g ws npm install ws npm install http-server -g 进入j…

025 程序的循环结构

目录 一、概述二、遍历循环三、遍历循环的应用3.1 计数循环(N次)3.2 计数循环(特定次)3.3 字符串遍历循环3.4 列表遍历循环3.5 文件遍历循环四、无限循环五、循环控制保留字5.1 break 和 continue5.1.1 for5.1.2 while六、循环的高级用法6.1 循环的扩展6.1.1 for6.1.2 while七、…

灰度值怎么降级_微服务生态的灰度发布如何实现?

前言相信很多小伙伴们都听说过灰度发布,但是不一定知道如何实现?今天我们就介绍一下基本原理,以及提供代码实现给小伙伴们。灰度概念即原来的生产环境是1.0版本,那现在我们需要升级到2.0版本,但是我们需要验证2.0版本&…

wget抓取网站, 模拟手机端抓取

nohup wget --mirror -p --tries100 --convert-links -P . –user-agent"Mozilla/5.0 (iPad; U; CPU OS 3_2 like Mac OS X; en-us) AppleWebKit/531.21.10 (KHTML, like Gecko) Version/4.0.4 Mobile/7B334b Safari/531.21.10" http://网址 >1.log 2>&1 …

在电脑上显示未知发布者怎么办_笔记本电脑显示器花屏怎么办?电脑屏幕花屏的解决方法...

笔记本电脑显示器花屏怎么办?笔记本电脑屏幕花屏该如何解决呢?近日有用户反映在使用笔记本电脑时候,会出现花屏的问题,下面就给大家介绍具体解决方法。一:检查显示器与显卡的连线是否松动若显示屏花屏的话,…

php 网页转pdf

linux 安装 wkhtmltopdf 下载地址 https://wkhtmltopdf.org/downloads.html 服务器是centos7 wget https://github.com/wkhtmltopdf/packaging/releases/download/0.12.6-1/wkhtmltox-0.12.6-1.centos7.x86_64.rpm 下载有点慢 rpm -ivh wkhtmltox-0.12.6-1.centos7.x86_6…

deluser命令

deluser命令 2012年07月03日 ⁄ 系统管理 ⁄ 暂无评论 1.功能作用 从系统中删除一个用户或组 2.位置 /usr/sbin/deluser 3.格式用法 deluser [options] USER deluser USER GROUP 4.主要参数 --quiet | -q 不将进程信息发给 stdout --help | -h 帮助信息 …

mongodb 字段出现次数_MongoDB数据库

内容回顾Xpath选择器不要求记忆,只要混个眼熟即可基于openpyxl模块爬取豆瓣电影单页爬取多页爬取1.校验请求头里面是否有User-Agent参数 请求头里面加上即可2.限制IP规定时间内的访问次数 1.人为的加上时间延迟 在你的程序里面加上time.sleep()让你的程序间歇一段时…

相似三角形·中考

概述相似,主要是相似三角形,在中考中有举足轻重的地位,难度也较高,往往倒三题中至少有一题是圆和相似的结合相似常常和四边形、反比例函数、圆、二次函数等结合,十分灵活 比例性质 概念若$\displaystyle \frac{a}{b}\f…

php 对接 北向数据接口 socket

function encode($msgType, $timeStamp, $body) {return "\xFF\xFF".pack(CNn, $msgType, $timeStamp, strlen($body)).$body;}$connection->send(encode(1, time(), reqLoginAlarm;userxxx;keyxxx;typexxx)); 详情参考: 请教使用socket做为客户端和北向接口对接&…

编译后没有taget文件夹_maven资源文件的相关配置才会在编译后的target里面有

建Maven项目的时候,如果没有进行特殊的配置,Maven会按照标准的目录结构查找和处理各种类型文件。src/main/java和src/test/java这两个目录中的所有*.java文件会分别在comile和test-comiple阶段被编译,编译结果分别放到了target/classes和targ…

配置gunicorn、 nginx、supervisor

1、建立引导,参考博文:https://www.cnblogs.com/wxzbk/p/10335859.html2、启动测试gunicorn -b 0.0.0.0:8080 run:app #run是引导文件,APP是模块名3、配置nginx1.跳转:cd /etc/nginx2.跳转:cd sites-available3.创建配…

添加icon_在zotero中添加百度学术、中国知网的文章检索引擎

方法关于添加文章检索引擎的方法,首先是参考官方文档:locate [Zotero Documentation]。里面提到有一个官方随时更新的engines.json文件,下载下来,保存到相应的文件夹就可以了。另外官方文档里还提供了一张检索引擎列表&#xff0c…

协变和逆变-Covariance and Contravariance

在C#4.0新特性介绍中,总是免不了对协变和逆变的介绍。但似乎协变逆变又很鸡肋。我试图简单地讲下协变(Covariance)和逆变(Contravariance)。 1,Co&Contravariance并非C#4.0引入的,早在C#1.0中就有了。只是C#4.0加入…

汉字笔画动图怎么做_动态图示范汉字笔顺标准,超全面!

忄先写点和点,最后写竖。匕先写撇,后写竖弯钩。万先写横,再写横折钩,后写撇。母字的最后三笔是点、横、点。及先写撇,再写横折折撇,后写捺。乃先写横折折撇,再写撇。这个字和及字形相近&#xf…

孙悟空的师父是谁? (ZT)

猜测之一 孙悟空是只石猴,很多年后有人说他是这本书的真正主角,其实这是不恰当的,他只是“第一主角”。因为西游的队伍里每个人都是主角,包括龙马。 孙悟空是天产石猴,生于花果山水帘洞,得育明师。修成大道…

decimalformat精度丢失_php intval 两位小数乘以100后结果少1

ASP.NET Core开发-后台任务利器Hangfire使用ASP.NET Core开发系列之后台任务利器Hangfire 使用. Hangfire 是一款强大的.NET开源后台任务利器,无需Windows服务/任务计划程序. 可以使用于ASP.NET 应用也 ...【转】NGUI创建UIRoot后报NullReferenceException的解决办法…

小米用户画像_腾讯企鹅智库发布手机品牌用户画像:华为一二线城市用户少于小米...

近日,腾讯旗下企鹅智库公布了《2019中国网民智能手机购机用户画像分析》,统计了国内各大手机品牌的用户特征,结论非常有趣。《分析》统计显示,苹果是所有手机品牌中一线城市用户占比最高的品牌,占比高达31.4%&#xff…

NLP(二十一)根据已有文本LSTM自动生成文本

根据已有文本LSTM自动生成文本 原理 与股票预测类似,用前面的n个字符预测下一个字符https://www.cnblogs.com/peng8098/p/keras_5.html代码from __future__ import print_function import numpy as np import random import syspath rshakespeare_final.txt text …