Python：处理矩阵之NumPy库（上）

1.前言

2.Python中打开文件操作

3.初步认识NumPy库

4.使用NumPy库

5.NumPy库中的维度

6.array函数

7.arange函数

8.linspace函数

9.logspace函数

10.zeros函数

11.eye函数

前言

NumPy库是一个开源的Python科学计算库，它提供了高性能的多维数组对象、派生对象（如掩码数组、矩阵）以及用于快速操作数组的各种例程，包括逻辑、形状操作、离散傅立叶变换、基本线性代数、基本统计运算、随机模拟等操作，本系列博客讲重点对NumP库的函数已经操作进行讲解

Python中打开文件操作

本系列是对NumPy库的讲解，为什么第一小节却是使用Python打开文件？这是因为在数学建模中，数据的提供往往是Excel格式，要对数据进行操作之前，我们得先了解在Python中基本的文件操作：

1.open函数用于打开文件：

1.Path为文件路径

2.mode指定模式，默认为r：

模式指令	备注
x	创建文件，若文件已存在则失败
a	写入模式，文件存在则在末尾追加
r	读取模式
w	写入模式，并线截断文件
b	二进制模式
t	文本模式
+	更新磁盘文件，读写并且读入

3.buffering为缓冲区（内存的读写速度快于外设，所以大部分情况不用设，即不大于0）

4.encoding为编码方式

filePtr = open(path,mode='r',buffering=-1,encoding='utf-8-sig')
//定义一个文件指针filePtr指向打开的文件

2.seek函数用于移动文件的读取指针到指定位置。seek函数需要使用文件对象进行调用，无返回值：

value = 3
#定义变量value移动光标至3的位置
type.seek(0)
#移动到文件头位置
type.seek(value)
#将文件读取指针移动到文件的第p个字节处，表示绝对位置
type.seek(value, 1)
#在当前位置的基础上，将文件读取指针移动p个字节，表示相对位置
type.seek(value, 2)
#在文件尾的基础上，将文件读取指针移动p个字节，表示相对位置

3.read函数用于从文件光标位置读取字节：

value_A = type.read(5)
#表示读取五个字符赋值给value_A
value_B = type.read()
#无参数表示读取至文件结束

4.readline函数用于一次读取文件一行内容，以字符串的形式存储：

value_A = type.readline()
#表示读取文件一行内容
value_B = type.readline()[:-1]
#使用切片可控制读取到的位置，[:-1]代表该行的末尾

5.readlines函数用于读取文件所有行，以列表的形式存储：

value_A = type.readlines()
#表示读取文件所有行
value_B = type.readlines()[:5]
#使用切片可控制读取到的位置，[:5]代表读取至第五行

6.split函数用于分割数据：

1.格式：split('text',value)

2.以text内容分割内容，分割次数为value

3.value的默认值为 -1，即分割所有出现次数

4.列表格式不能使用split函数分割，只能字符串格式才能分割

value_A = type.readline().split(',')
#表示以逗号分割所读取到的行内容
value_B = type.readline().split(',',3)
#表示以逗号分割三次所读取到的行内容

7.strip函数用于删除两侧字符：

1.格式：strip(value)

2.当value为空时，代表删除头尾字符(换行，回车，制表符，空格)

3.不为空则代表删除头尾的value值

value_A = type.strip(',')
#代表删除头尾的逗号字符
value_B = type.strip()
#代表删除头尾的换行，回车，制表符和空格字符

8.lstrip函数用于删除左侧字符：

1.格式：lstrip(value)

2.当value为空时，代表删除开头字符(换行，回车，制表符，空格)

3.不为空则代表删除开头的value值

value_A = type.lstrip(',')
#代表删除开头的逗号字符
value_B = type.lstrip()
#代表删除开头的换行，回车，制表符和空格字符

9.rstrip函数用于删除右侧字符：

1.格式：rstrip(value)

2.当value为空时，代表删除末尾字符(换行，回车，制表符，空格)

3.不为空则代表删除末尾的value值

value_A = type.rstrip(',')
#代表删除末尾的逗号字符
value_B = type.rstrip()
#代表删除末尾的换行，回车，制表符和空格字符

初步认识NumPy库

NumPy库主要的功能之一用来操作数组和矩阵。是科学计算、深度学习等高端领域的必备工具。在使用TensorFlow、Caffe框架训练神经网络模型时，需要进行大量复杂的运算，可以直接调用NumPy里面的API，而且NumPy还包含了很多使用的数学函数，覆盖了很多的数学领域，比如，线性代数、傅里叶变换、随机数生成。在数学建模比赛中，你还可以认为Python + NumPy == Matlab

图1.动手学NumPy库

使用NumPy库

使用Numpy库前需要导入Numpy库

import numpy as _numpy    #导入numpy库并取别名为_numpy

NumPy库中的维度

在介绍NumPy库的操作前，我们需要了解NumPy中的维度。Numpy中维度就是平常所说的一维（只有x轴）、二维（x、y轴）、三维（x、y、z轴)

#一维使用print输出后有一对花括号 [ ]
#二维使用print输出后有两对花括号 [ [] ]
#三维使用print输出后有三对花括号[ [ [] ] ]

array函数

array函数用于将列表或元组转换为数组

 array(接收对象,dtype = 转换后数据类型,copy = True,order = 'K',subok = False,ndmin = 0)

参数	备注
接收对象	可为公开数组接口的任何对象，__array__方法返回数组的对象，或任何（嵌套）序列
dtype	数组所需的数据类型。如果没有给出，那么类型将被确定为保持序列中的对象所需的最小类型
copy	数组所需的数据类型。如果没有给出，那么类型将被确定为保持序列中的对象所需的最小类型
order	指定阵列的内存布局。如果接收对象不是数组，则新创建的数组将按C顺序排列（行主要），除非指定了'F'，在这种情况下，它将采用Fortran顺序（专业列）。如果object是一个数组，则以下成立。 {'K'，'A'，'C'，'F'}，可选
subok	如果为True，则子类将被传递，否则返回的数组将被强制为基类数组（默认）
ndmin	指定结果数组应具有的最小维数。根据需要，将根据需要预先设置形状
返回值	满足要求的数组对象

表1.array函数参数表

测试用例：

s1 = [1,2,3,10]
#创建一维列表s1
a1 = _numpy.array(s1,dtype = int)
#将列表s1转换为数组，数据类型为int型
s2 = [[1,2,3,10]]
#创建二维列表s2
a2 = _numpy.array(s2,dtype = int)
#将列表s1转换为数组，数据类型为int型
tp = (2,4,6,9,4)
创建元组tp
a3 = _numpy.array(tp,dtype = float)
#将列表a2转换为数组，数据类型为flosr型
#s1.dtype      s1.size        s1.itemsize   s1.ndim       s1.shape
#查看数组类型   查看元素个数   查看元素大小   查看数组维度   查看数组结构

arange函数

arange函数用于生成一维数组

arange([start , ],stop[ , step ,],stype = None)

参数	备注
start	代表初始值，默认从0开始
stop	代表终止值，必填参数
step	代表步长，默认为1

表2.arange函数参数表

测试用例：

_numpy.arange(10)
#array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
_numpy.arange(5,10)
#array([5, 6, 7, 8, 9])
_numpy.arange(5,10,2)
#array([5, 7, 9])
#以上分别省略了初始值和步长

linspace函数

linspace函数用于生成一个一维数组，其数据是一个等差数列

linspace(start,stop,num = 50,endpoint = True,retstep = False,dtype = None,axis = 0)

参数	备注
start	代表初始值，必填参数
stop	代表终止值，必填参数
num	代表生成数据的个数，默认为50
endpoint	代表是否包含终止值，默认为True
retstep	代表是否显示步长，默认为False
dtype	代表数据类型
axis	代表轴向，默认为0，代表沿X轴

表3.linspace函数参数表

测试用例：

_numpy.linspace(10,20,10)
#array([10.        , 11.11111111, 12.22222222, 13.33333333, 14.44444444,15.55555556, 16.66666667, 17.77777778, 18.88888889, 20.        ])_numpy.linspace(10,20,10,endpoint = False)
#array([10., 11., 12., 13., 14., 15., 16., 17., 18., 19.])_numpy.linspace(10,20,10,endpoint = False,retstep = True)
#(array([10., 11., 12., 13., 14., 15., 16., 17., 18., 19.]), 1.0)_numpy.linspace(10,20,10,endpoint = True,retstep = True,dtype = int)
#(array([10, 11, 12, 13, 14, 15, 16, 17, 18, 20]), 1.1111111111111112)
#最后两句代码显示的步长不同，但是数组相同。是因为dtype为int类型，所以小数强转为int类型

logspace函数

logspace函数用于生成一个一维数组，其数据是一个等比数列

logspace(start,stop,num = 50,endpoint = True,base = 10.0,dtype = None,axis = 0)

参数	备注
start	代表初始值，必填参数
stop	代表终止值，必填参数
num	表生成数据的个数，默认为50
endpoint	代表是否包含终止值，默认为True
base	代表底数，默认为10.0
dtype	代表数据类型
axis	代表轴向，默认为0，代表沿X轴

表4. logspace函数参数表

_numpy.logspace(10,20,5)
#array([1.00000000e+10, 3.16227766e+12, 1.00000000e+15, 3.16227766e+17,1.00000000e+20])_numpy.logspace(10,20,5,endpoint = False)
#array([1.e+10, 1.e+12, 1.e+14, 1.e+16, 1.e+18])_numpy.logspace(10,20,5,endpoint = False,base= 100.0)
#array([1.e+20, 1.e+24, 1.e+28, 1.e+32, 1.e+36])
#底数为100_numpy.logspace(10,20,5,endpoint = True,base = 10.0,dtype = int,axis = 0)
#array([-2147483648, -2147483648, -2147483648, -2147483648, -2147483648])
#底数为10

zeros函数

zeros函数用于创建一个元素全为零的数组

zeros(shape,dtype = float,order = 'C')

参数	备注
shape	代表数组尺寸，可以是数值或元组
dtype	代表数组中的元素的数据类型，默认为float
order	代表存储多维数组时，是列优先'F'还是行优先'C'，默认为行优先
shape	代表数组尺寸，故可以使用[]或()分别代表列表或元组的尺寸

表5. zeros函数参数表

_numpy.zeros((2,2))
#array([[0., 0.],[0., 0.]])_numpy.zeros([2,2])
#array([[0., 0.],[0., 0.]])_numpy.zeros((2,2),dtype = int)
#array([[0, 0],[0, 0]])
#与前两个元素类型不同_numpy.zeros((3,5),dtype = int,order = 'F')
#array([[0, 0, 0, 0, 0],[0, 0, 0, 0, 0],[0, 0, 0, 0, 0]])

PS：当shape为[]或()时，可以传入多个数值，如_numpy.zeros((2,2,2))，代表2个3维数组，其元素含有2行2列。总结：当传入的数值大于2时，每增加一个数值代表维度加一，而最终的数字个数由前两个数字综合确定

eye函数

eye函数用于创建元素中一个对角线全为一的数组矩阵

eye(N,M = None,k = 0,btype = < class 'float' >,order = 'C')

参数	备注
N	代表行数
M	代表列数
k	代表对角线元素个数，默认为0
dtype	代表数组中元素的数据类型，默认为float
order	代表存储多维数组时，是列优先'F'还是行优先'C'，默认为行优先

表5. eye函数参数表

_numpy.eye(3,3)
#array([[1., 0., 0.],[0., 1., 0.],[0., 0., 1.]])_numpy.eye(3,3,dtype = int)
#array([[1, 0, 0],[0, 1, 0],[0, 0, 1]])_numpy.diag([3,4,5])
#array([[3, 0, 0],[0, 4, 0],[0, 0, 5]])_numpy.diag((3,4,5),1)
array([[0, 3, 0, 0],[0, 0, 4, 0],[0, 0, 0, 5],[0, 0, 0, 0]])_numpy.diag((3,4,5),-1)
#array([[0, 0, 0, 0],[3, 0, 0, 0],[0, 4, 0, 0],[0, 0, 5, 0]])