1 python数据分析numpy基础之mean用法和示例
python的numpy库的mean()函数,用于计算沿指定轴(一个轴或多个轴)的算术平均值。
用法
numpy.mean(a, axis=None, dtype=None, out=None, keepdims=<no value>, *, where=<no value>)
描述
返回数组元素的平均值。长度为0的数组的mean为nan。
等效于对指定轴求后,然后除以轴大小,即为其平均值。
入参
a:必选,array_like,数组或列表或元组,表示需要计算平均数的元素的数组。
axis:可选,默认为None,整数或整数元组,表示需要计算平均值的一个或多个轴。
1.1 入参a
numpy.mean()的入参a,为必选入参,可以为数组、列表、元组。如果a长度为0,则返回NaN。表示需要求平均值的数组。
>>> import numpy as np
# 入参a为列表
>>> np.mean([1,2,3,4,5])
3.0
# 入参a为元组
>>> np.mean((1,2,3,4,5))
3.0
# 入参a为数组
>>> np.mean(np.array([1,2,3,4,5]))
3.0
# 入参a的长度为0,返回NaN,并且第1次报错,后面不再报错
>>> np.mean(np.array([]))
Warning (from warnings module):File "D:\python3\lib\site-packages\numpy\core\fromnumeric.py", line 3441out=out, **kwargs)
RuntimeWarning: Mean of empty slice.Warning (from warnings module):File "D:\python3\lib\site-packages\numpy\core\_methods.py", line 189ret = ret.dtype.type(ret / rcount)
RuntimeWarning: invalid value encountered in double_scalars
nan
>>> np.mean(np.array([]))
nan
1.2 入参axis为整数
numpy.mean()的入参axis为可选入参,默认为None,表示求全部元素的平均值。
若axis=n为整数,则对指定轴n的元素求平均值,即,先对同轴同方向的元素求和,再除以同轴同方向的元素个数(轴大小),即为其平均值。
若axis=负数,则-1对应最后一个轴,-2倒数第2个轴,依此类推。
>>> import numpy as np
# 创建一个三维数组,大小为(2,3,4)
>>> ar3=np.arange(24).reshape(2,3,4)
>>> ar3
array([[[ 0, 1, 2, 3],[ 4, 5, 6, 7],[ 8, 9, 10, 11]],[[12, 13, 14, 15],[16, 17, 18, 19],[20, 21, 22, 23]]])
# 入参 axis默认为None,求全部元素的平均值
>>> np.mean(ar3)
11.5
# axis=整数,同轴同方向求和,再除以轴大小
# axis=0,先对0轴求和,再除以2
>>> np.mean(ar3,axis=0)
array([[ 6., 7., 8., 9.],[10., 11., 12., 13.],[14., 15., 16., 17.]])
# np.mean(ar3,axis=0)=np.sum(ar3,axis=0)/2
>>> np.sum(ar3,axis=0)/2
array([[ 6., 7., 8., 9.],[10., 11., 12., 13.],[14., 15., 16., 17.]])
# axis=1,先对1轴求和,再除以3
>>> np.mean(ar3,axis=1)
array([[ 4., 5., 6., 7.],[16., 17., 18., 19.]])
# np.mean(ar3,axis=1)=np.sum(ar3,axis=1)/3
>>> np.sum(ar3,axis=1)/3
array([[ 4., 5., 6., 7.],[16., 17., 18., 19.]])
# axis=2,先对2轴求和,再除以4
>>> np.mean(ar3,axis=2)
array([[ 1.5, 5.5, 9.5],[13.5, 17.5, 21.5]])
# np.mean(ar3,axis=2)=np.sum(ar3,axis=2)/4
>>> np.sum(ar3,axis=2)/4
array([[ 1.5, 5.5, 9.5],[13.5, 17.5, 21.5]])
# axis=负数,则-1对应最后一个轴,-2倒数第2个轴,依此类推
>>> np.mean(ar3,axis=-1)
array([[ 1.5, 5.5, 9.5],[13.5, 17.5, 21.5]])
1.3 入参axis为元组
numpy.mean()的入参axis若为轴的元组,则对多个轴求平均值。
先对多个轴的元素求和,再除以多个轴的大小的乘积,即为其平均值。
axis=(m,n)等效于axis=(n,m)。
>>> import numpy as np
# 创建一个三维数组,大小为(2,3,4)
>>> ar3=np.arange(24).reshape(2,3,4)
>>> ar3
array([[[ 0, 1, 2, 3],[ 4, 5, 6, 7],[ 8, 9, 10, 11]],[[12, 13, 14, 15],[16, 17, 18, 19],[20, 21, 22, 23]]])
# axis=元组,对多个轴求和,再除以多个轴大小的乘积
# axis=(0,1),先对0和1轴求和,再除以6,6=2*3
>>> np.mean(ar3,axis=(0,1))
array([10., 11., 12., 13.])
>>> np.sum(ar3,axis=(0,1))/6
array([10., 11., 12., 13.])
# axis=(1,0)等效于axis=(0,1)
>>> np.mean(ar3,axis=(1,0))
array([10., 11., 12., 13.])
# axis=(0,1),先对0和2轴求和,再除以8,8=2*4
>>> np.mean(ar3,axis=(0,2))
array([ 7.5, 11.5, 15.5])
>>> np.sum(ar3,axis=(0,2))/8
array([ 7.5, 11.5, 15.5
# axis=(1,2),先对1和2轴求和,再除以12,12=3*4
>>> np.mean(ar3,axis=(1,2))
array([ 5.5, 17.5])
>>> np.sum(ar3,axis=(1,2))/12
array([ 5.5, 17.5])