Python3 open() 函数详解 读取文件写入文件追加文件二进制文件
open()函数的主要作用是打开文件并返回相应文件对象,使用文件对象可以对当前文件进行读取、写入、追加等操作,默认情况下"r"模式,文件不存在的话会发生OSError错误的。
它是Python的内置函数,在python文件中直接可以使用。
语法
#常用方式
open(file, mode='r')
#完整参数
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
参数
file - 文件的路径(相对或绝对)
mode[可选] - 指定文件的打开模式,分为只读,只写,读写,追加等。还有一些常用的组合模式,详见下表:
模式及含义
字符含义
'r'只读方式打开文件,文件不可写,文件如果不存在则报错,打开文件后指针会放在文件的开头,这是默认模式
'w'打开文件只用于写入内容,不可读取,如果文件不存在则自动创建,如果原文件已存在则会将其清空覆盖。
'x'独占只写模式,所谓独占,就是要求当前指定文件必须是不存在的,然后再由它进行创建。如果已存在则会报错。
'a'打开文件用于追加(只写),如果文件不存在则自动创建,如果已存在,则在文件内容的最后追加内容。
'b'二进制模式,一般用于非文本文件,如图片等。
't'文本模式(默认)
'+'读写模式,一般配合只读、只写模式使用,以扩充它们的功能。
'U'通用换行模式(已废弃)
常用组合模式
字符含义
'r+'打开文件用于读写,指针放在文件开头,写入的内容从当前所在位置进行替换(需要注意:如果是新打开的文件,就是从开头开始替换,如果使用了readline或readlines方法读取内容后,当前位置会发生改变的)。
'rb'以二进制格式打开文件用于只读,文件不存在会报错。
'rb+'以二进制格式打开文件用于读写,写入的内容类型必须是bytes(b)类型。写入的内容从当前所在位置进行替换。
'w+'打开文件用于读写,文件不存在则创建,存在则覆盖。
'wb'以二进制格式打开文件用于只写,写入的内容类型必须是bytes(b)类型。
'wb+'以二进制格式打开文件用于读写,写入的内容类型必须是bytes(b)类型。写入的内容直接覆盖原文件。
'a+'打开文件用于读写,文件不存在则创建,存在则在文件内容末尾追加内容。
'ab'以二进制格式打开文件用于只写(追加),写入的内容类型必须是bytes(b)类型。
'ab+'以二进制格式打开文件用于读写,写入的内容类型必须是bytes(b)类型。写入的内容会在文件内容末尾追加。
buffering[可选] - 用于设置缓冲策略,必须是一个整数,传递0关闭缓冲(仅允许在二进制下可以使用),传递1则是行缓冲(仅在文本模式下可用),传递大于1的整数,则是指定缓冲区的大小(以字节为单位),如果没有给出指定的缓冲策略,将按照二进制文件以固定大小进行缓冲,在许多的系统上,缓冲区的长度通常为4096或8192字节,而“交互式”文件文件(isatty()返回True)使用行缓冲,其他文件文件与二进制文件的一致。
encoding[可选] - 指定打开文件的编码和解码的字符编码,应该只用于文本模式下。
errors[可选] - 指定文件在编码和解码时发生错误的处理方式,默认是严格的模式,发生错误会报ValueError错误,其他参数详见下表:
字符含义
'strict'严格模式,发生错误会直接报错,与不传递值效果一致。
'ignore'忽略模式,一般不建议使用,可能会导致数据丢失。
'replace'在有错误的地方插入指定的标记。可以是任意字符串,例如('?')
'surrogateescape'一般用于处理未知编码的文件
'xmlcharrefreplace'仅在写入时使用,将编码不支持的字符转换为相应的XML字符
'backslashreplace'用Python的反向转义序列替换格式错误的数据
'namereplace'仅在写入时使用,用\N{...}转义序列替换不支持的字符
newline[可选] - 指定换行模式,仅适用于文本模式,可以是None,'\n','\r'和'\r\n'。
closefd[可选] - 如果参数为false时且file给的是文件描述符,则在关闭文件时,底层文件描述符将保持打开状态,如果file给出的是文件名,则必须为True(默认值),否则报错。
opener[可选] - 自定义文件的开启者,这个不常用。
返回值
相应文件对象
实例
§ 实例1 - 'r','r+','rb','rb+'模式
#r
>>>f = open('text.txt', 'r')
>>>f.readline()
'abcdefg1234567'
f.close()
#r+
#r是只读模式,由于加上了+号,就变成了读写模式了,但是它与其他写模式不同,它是从当前光标位置开始写入的,默认是从文件内容的头部开始。可以通过seek来控制光标位置,也会受到read、readline、readlines影响。
#本例中头部的abc被替换成了aaa。
>>>f = open('text.txt', 'r+')
>>>f.write('aaa')
>>>f.seek(0)
>>>f.read()
'aaadefg1234567'
>>>f.close()
#rb
>>>f = open('text.txt', 'rb')
>>>f.read()
b'abcdefg1234567'
#rb+
>>>f = open('text.txt', 'rb+')
>>>f.write(b'aaa')
>>>f.seek(0)
>>>f.read()
b'aaadefg1234567'
>>>f.close()
§ 实例2 - 'w','w+','wb','wb+'模式
#text.txt原本内容为“abcdefg1234567”。
#w
#由于w是只写模式,所以写入完毕后还得再打开一次才能读取到内容。
>>>f = open('text.txt', 'w')
>>>f.write('aaa')
>>>f.close()
>>>f = open('text.txt', 'r')
>>>f.readline()
'aaa'
>>>f.close()
#从结果可以看出,文件的内容被完全覆盖了。
#w+
#这样就可以覆盖然后又读取了。
>>>f = open('text.txt', 'w+')
>>>f.write('aaa')
>>>f.seek(0)
>>>f.read()
'aaa'
>>>f.close()
#wb
>>>f = open('text.txt', 'wb')
>>>f.write(b'aaa')
>>>f.close()
>>>f = open('text.txt', 'r')
>>>f.read()
'aaa'
>>>f.close()
#wb+
>>>f = open('text.txt', 'wb+')
>>>f.write(b'aaa')
>>>f.seek(0)
>>>f.read()
b'aaa'
>>>f.close()
§ 实例3 - 'a','a+','ab','ab+'模式
#text.txt原本内容为“abcdefg1234567”。
#a
#由于a是只写模式,所以写入完毕后还得再打开一次才能读取到内容。
>>>f = open('text.txt', 'a')
>>>f.write('aaa')
>>>f.close()
>>>f = open('text.txt', 'r')
>>>f.read()
'abcdefg1234567aaa'
>>>f.close()
#a+
#这样就可以追加然后又读取了。
>>>f = open('text.txt', 'a+')
>>>f.write('aaa')
>>>f.seek(0)
>>>f.read()
'abcdefg1234567aaa'
>>>f.close()
#ab
>>>f = open('text.txt', 'ab')
>>>f.write(b'aaa')
>>>f.close()
>>>f = open('text.txt', 'r')
>>>f.read()
'abcdefg1234567aaa'
>>>f.close()
#ab+
>>>f = open('text.txt', 'ab+')
>>>f.write(b'aaa')
>>>f.seek(0)
>>>f.read()
b'abcdefg1234567aaaaaa'
>>>f.close()
§ 实例4 - 'x'模式
#假设text.txt是存在的。
#由于text.txt是不存在的,所以顺利执行了。我们再执行一次试试。
>>>f = open('text.txt', 'x')
>>>f.write('abc')
>>>f.close()
>>>f = open('text.txt', 'r')
>>>f.read()
'abc'
>>>f.close()
#就会执行报错了。提示text.txt文件已经存在了。用x可以防止文件被覆盖或修改,只能一次性创建并写入内容。
>>>f = open('text.txt', 'x')
FileExistsError: [Errno 17] File exists: 'text.txt'