Numpy 可以读写磁盘上的文本数据或二进制数据。
NumPy 为 ndarray 对象引入了一个简单的文件格式:npy。
npy 文件用于存储重建 ndarray 所需的数据、图形、dtype 和其他信息。
常用的 IO 函数有:
- load() 和 save() 函数是读写文件数组数据的两个主要函数,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为 .npy 的文件中。
- loadtxt() 和 savetxt() 函数处理正常的文本文件(.txt 等)
1、save()、load()
numpy.save() 函数将数组保存到以 .npy 为扩展名的文件中。
numpy.save(file, arr, allow_pickle=True, fix_imports=True)
参数说明:
- file:要保存的文件,扩展名为 .npy,如果文件路径末尾没有扩展名 .npy,该扩展名会被自动加上。
- arr: 要保存的数组
- allow_pickle: 可选,布尔值,允许使用 Python pickles 保存对象数组,Python 中的 pickle 用于在保存到磁盘文件或从磁盘文件读取之前,对对象进行序列化和反序列化。
- fix_imports: 可选,为了方便 Pyhton2 中读取 Python3 保存的数据。
numpy.load(file, mmap_mode=None, allow_pickle=True, fix_imports=True, encoding=’ASCII’)
encoding :仅当在Python 3中加载Python 2生成的文件时有用
a = np.array([1, 2, 3, 4, 5])# 保存到 outfile.npy 文件上
np.save('outfile.npy', a)
# 保存到 outfile2.npy 文件上,如果文件路径末尾没有扩展名 .npy,该扩展名会被自动加上
np.save('outfile2',a)"""
可以看出文件是乱码的,因为它们是 Numpy 专用的二进制格式后的数据。
我们可以使用 load() 函数来读取数据就可以正常显示了:
"""
b = np.load('outfile.npy')
print(b) # [1 2 3 4 5]
2、savez()
numpy.savez() 函数将多个数组保存到以 npz 为扩展名的文件中。
numpy.savez(file, *args, **kwds)
参数说明:
- file:要保存的文件,扩展名为 .npz,如果文件路径末尾没有扩展名 .npz,该扩展名会被自动加上
- args: 要保存的数组,可以使用关键字参数为数组起一个名字,非关键字参数传递的数组会自动起名为 arr_0, arr_1, …
- kwds: 要保存的数组使用关键字名称。
a = np.array([[1,2,3],[4,5,6]])
b = np.arange(0, 1.0, 0.1)
c = np.sin(b)
# c 使用了关键字参数 sin_array
np.savez("runoob.npz", a, b=b, sin_array = c)
r = np.load("runoob.npz")
print(r.files) # 查看各个数组名称
print(r["arr_0"]) # 数组 a
print(r["b"]) # 数组 b
print(r["sin_array"]) # 数组 c
"""
['b', 'sin_array', 'arr_0']
[[1 2 3][4 5 6]]
[0. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9]
[0. 0.09983342 0.19866933 0.29552021 0.38941834 0.479425540.56464247 0.64421769 0.71735609 0.78332691]
"""
3、loadtxt()、savetxt()
savetxt() 函数是以简单的文本文件格式存储数据,对应的使用 loadtxt() 函数来获取数据。可以 用 .txt 或者 .csv 为扩展名
np.loadtxt(FILENAME, dtype=int, delimiter=’ ',skiprows=0, usecols=None,unpack=False)
np.savetxt(FILENAME, a, fmt="%d", delimiter=",")
参数 delimiter 可以指定各种分隔符、针对特定列的转换器函数、需要跳过的行数等。
a = np.array([[1, 2, 3, 4, 5], [7, 8, 9, 10, 11]])
# delimiter 用什么分割数据
# fmt 保存的数据格式
# skiprows 跳过前几行。一般跳过表头
# dtype 指定数据类型
# usecols 取哪几列
# unpack 转置 效果 类似 numpy.transpose ndarray.T
np.savetxt('out.txt', a, delimiter=",", fmt="%d,%d,%.3f,%.3f,%.3f")
b = np.loadtxt('out.txt', delimiter=",", skiprows=0, dtype=np.int32, usecols=(0,1,2))
b1 = np.loadtxt('out.txt', delimiter=",", skiprows=0, dtype=np.int32, usecols=(0,1,2), unpack=True)
print(b)
print("*"*20)
print(b1)
print("*"*20)
a = np.array([1, 2, 3, 4, 5])
np.savetxt('out1.txt', a, delimiter=",", fmt="%d")
b = np.loadtxt('out1.txt', delimiter=",")print(b)
"""
[[1 2 3][7 8 9]]
********************
[[1 7][2 8][3 9]]
********************
[1. 2. 3. 4. 5.]out.txt:
1,2,3.000,4.000,5.000
7,8,9.000,10.000,11.000
out1.txt
1
2
3
4
5
"""
4、tofile()、fromfile()
https://blog.csdn.net/kebu12345678/article/details/54837245/
https://www.cnblogs.com/yinyoupoet/p/13287353.html
- tofile()将数组中的数据以二进制格式写进文件
- tofile()输出的数据不保存数组形状和元素类型等信息
- fromfile()函数读回数据时需要用户指定元素类型,并对数组的形状进行适当的修改
a = np.arange(12).reshape(4,3)
# a.tofile("raw10.raw")
a.tofile("raw10.bin")
print(a.dtype) # int32
print(a)b = np.fromfile("raw10.bin",dtype=np.int64) # 按照 np.int64 读入的数据是错误的
print(b) # [ 4294967296 12884901890 21474836484 30064771078 38654705672 47244640266]b = np.fromfile("raw10.bin",dtype=np.int32) # 按照 np.int32 读入的数据是一维的
print(b) # [ 0 1 2 3 4 5 6 7 8 9 10 11]
b.shape = 4,3
print(b)print((a==b).all()) # True
"""
int32
[[ 0 1 2][ 3 4 5][ 6 7 8][ 9 10 11]]
[ 4294967296 12884901890 21474836484 30064771078 38654705672 47244640266]
[ 0 1 2 3 4 5 6 7 8 9 10 11]
[[ 0 1 2][ 3 4 5][ 6 7 8][ 9 10 11]]
True
"""
https://www.runoob.com/numpy/numpy-io.html