python文件操作的基本流程

 引入

程序运行过程中产生的数据会保存到内存中,如果想要永久保存下来,就必须将数据存放在硬盘上,应用程序如果想要操作计算机的硬件就必须通过操作系统,文件就是操作系统提供给应用程序来操作硬盘的虚拟概念,应用程序操作文件就是向操作系统发送调用,由操作系统完成对硬盘的操作。

文件操作的基本流程

比如想打开电脑桌面上一个word文档进行操作,步骤应该是:1、双击打开文档; 2、进行某些操作,比如读文件、修改文件等;3、保存后关闭文件。

使用python实现对文件的操作也遵循这三个步骤:

# open()方法常用方式是接收三个参数:文件绝对/相对路径,操作文件的方式,编码格式
# 1.打开文件,应用程序向操作系统发送调用,操作系统打开文件(硬盘上的一块空间),返回一个文件对象赋值给变量file
file = open(r'D:\文件.txt', 'r', encoding='utf-8')  # 以读模式打开文件,打开文件的字符编码是utf-8
# 注意:\在python中有特殊意义,当路径是绝对路径时,需要在路径字符串前加r进行转义;文件路径如果是文件名的话,python会在当前程序文件夹所在路径下去找该文件。# 2、对文件进行操作,比如读文件---调用文件对象的读方法
data = file.read()# 3、关闭文件,向操作系统发送关闭文件的请求
file.close()

使用python打开一个文件之后产生了两部分的内存空间占用,一部分是文件打开后占用的内存空间,另一部分是打开后产生的文件对象,文件操作完成之后需要回收这两部分的内存空间.

file.close()  # 删除文件打开后占用的内存
del file  # 删除文件对象的内存

由于python垃圾回收机制,我们无需考虑删除文件对象这一步,但是在操作完文件之后必须要关闭文件,就是f.close(),否则在电脑上不停的打开文件而不关闭,电脑的内存迟早会被用尽,尽管如此,可能还会有粗心的小伙伴忘记关闭文件,python为了防止这一情况,提供了with关键字来帮助我们管理从打开到关闭整个上下文的流程,因此with关键字也称为with上下文管理。

# 执行完with下的子代码块之后会自动执行f.close()的操作,再也不用担心忘记关闭文件了。
with open('文件.txt', 'r') as f:  # 打开文件,将文件对象赋值给变量fpass   # pass是什么都不做,可以用来占位# 可以用with同时打开多个文件,用逗号分隔
with open('file1.txt', 'r') as f1, open('file2.txt', 'r') as f2:data1 = f1.read()data2 = f2.read()

由于使用python打开文件的时候是通过操作系统完成的,如果打开的文件是文本文件,会涉及到字符编码的问题,如果在打开文件时没有指定字符编码,操作系统就会使用自己默认的编码打开文件(windows下是gbk,在linux下是utf-8),如果要保证不乱码,文件以什么编码格式存的就要以什么格式打开。

操作文件的模式

打开文件后,需要对文件进行进行不同的操作,比如读文件、改文件,因此在使用python打开文件时也需要指定操作文件的方式。控制文件读写操作的模式有三种。

1.只读(r)---默认的操作文件的方式

当文件不存在时会报错,文件存在时,文件内的指针(可以理解为光标)直接跳到文件开头。

with open('a.txt', mode='r', encoding='utf-8') as f:data = f.read()

2.只写(w)

在文件不存在时会在程序文件所在文件夹创建一个文件,如果文件存在,会清空文件中的内容,文件指针跳到文件开头,进行写操作。需要注意的是,在文件不关闭的情况下,写入的数据是按照先后顺序的,如果文件关闭后重新以w模式打开,会清空文件数据。

with open('a.txt', 'w', encoding='utf-8') as f:f.write('hello world\n')  # \n表示换行f.write('my name is python')

3.只追加写(a)

文件不存在时会在当前文件夹创建文件,文件存在时,文件指针直接移动到文件末尾,不会清空文件数据。

a模式和w模式的异同:

相同点:文件不存在都会创建文件,文件不关闭的情况下,数据依次写入

不同点:a模式重新打开文件不会清空文件,文件指针一道末尾,新写的内容跟在旧的内容之后。

with open('a.txt', 'a', encoding='utf-8') as f:f.write('追加的1\n')f.write('追加的2\n')

使用这三种模式操作文件时一定要注意,对文件的操作要么只读,要么只写,不能使用只读的模式打开文件,然后去进行写的操作。但是python提供了可读可写的方法r+ a+ w+,但是在实际开发中要么只读要么只写,一般不使用可读可写的模式。

控制文件读写单位

文件的读写单位有两种模式,一种是字符串模式(t模式),另一种是bytes(二进制)模式(b模式),这两种模式必须和r/w/a之一结合使用。

t模式,文本模式,默认模式,读写文件都是以字符串为单位,只针对文本文件,必须指定encoding参数。

# 如果打开文件时指定打开模式为r/w/a,其实默认就是rt/wt/at
with open('a.txt', 'wt', encoding='utf-8') as f:f.write('haha')  # 写入的数据必须也是字符串格式

b模式,二进制模式,读写文件都是以bytes/二进制为单位,可以针对所有文件,一定不能指定encoding参数。

with open('a.txt', 'wb') as f:info = 'name'# 需要将写入文件的数据转成二进制格式,使用encode()方法指定编码格式可以实现res = info.encode('utf-8')f.write(res)

b模式和t模式对比:

在操作纯文本文件方面,t模式帮助我们省去了编码与解码的环节,所以t模式更方便。

在针对非文本文件(图片、音频等)只能使用b模式。

操作文件的方法 - 读和写

在使用r模式打开文件的时候有几种读取数据的方式

f.read()  # 一次性读取所有内容,如果文件过大,会导致内存不足
f.readline()  # 每次读取文件的一行内容,读完一行后,光标移至第二行行首
f.readlines()  # 一次性读取所有内容,将每一行内容存放于列表中

f.read()和f.readlines()都是将文件一次性读取,如果内容过大,会导致内存不足,如果想要将文件全部读取到内存中,建议分多次读入,有两种实现方式:

# 方式一
with open('a.txt',mode='rt',encoding='utf-8') as f:for line in f:print(line) # 同一时刻只读入一行内容到内存中
# 方式二
with open('好汉歌.mp3', mode='rb') as f:while True:data=f.read(1024) # 同一时刻只读入1024个Bytes到内存中if len(data) == 0:breakprint(data)

同样针对写操作也有几种不同的方式

f.write('hello\nworld\n')  # 针对文本模式的写,需要自己写换行符
f.write('1111\n222\n'.encode('utf-8'))  # 针对b模式的写,需要自己写换行符
f.writelines(['333\n','444\n'])  # 文件模式
f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式

控制文件指针移动

文件内的指针类似于光标,但不同的是文件的指针移动的单位是以bytes为单位,唯一例外的是t模式下的read(n),n是以字符为单位。

with open('a.txt',mode='rt',encoding='utf-8') as f:data=f.read(3) # 读取3个字符with open('a.txt',mode='rb') as f:data=f.read(3) # 读取3个Bytes

r/w/a模式下文件指针的移动是被动触发的,如果想要读取文件某一指定位置的数据,需要使用f.seek()方法主动控制文件内指针的移动。

f.seek()方法需要接收两个参数,第一个参数是指针移动的字节数,第二个参数是模式控制。模式控制有三种:

0模式:默认的模式,表示指针移动的字节数以文件开头作为参照

1模式:表示指针移动的字节数以文件指针当前所在位置作为参照

2模式:表示指针移动的字节数以文件末尾作为参照

其中0模式可以在t/b模式下使用,1模式和2模式只能在b模式下使用。

# 0模式
with open('a.txt',mode='rt',encoding='utf-8') as f:f.seek(3,0)     # 参照文件开头移动了3个字节print(f.tell())  # 查看当前文件指针相对于文件开头的位置# 1模式
with open('a.txt',mode='rb') as f:f.seek(3,1) # 从当前位置往后移动3个字节,而此时的当前位置就是文件开头print(f.tell()) # 输出结果为:3# 2模式
with open('a.txt',mode='rb') as f:f.seek(-3,2)     # 参照文件末尾往前移动了3个字节print(f.read().decode('utf-8')) # 输出结果为:好

修改文件

文件是操作系统为了方便应用程序操作硬盘出现的虚拟概念,本质上文件对应的就是硬盘,硬盘是无法被修改的,一次本质上来说文件是无法被修改的,我们看到的文件的内容可以被修改的原因是:将硬盘中的文件读入内存,在内存中修改之后再覆盖回硬盘。实现的方式有两种:

第一种,将文件中的数据一次性全部读入内存,在内存中修改完成后再覆盖回原文件

'''
优点:文件修改过程中只有同一份数据
缺点:内存占用过多
'''
# 先读入内存
with open('db.txt',mode='rt',encoding='utf-8') as f:data=f.read()
# 修改内存中的数据
with open('db.txt',mode='wt',encoding='utf-8') as f:f.write(data.replace('xxx','python'))

第二种,以读的方式打开一个文件,以写的方式打开另一个文件,一行一行读取原文件,修改后写入新文件

'''
优点:不会占用过多的内存
缺点:需要借助临时文件
'''
import os  # 需要借助os模块进行删除文件和文件重命名操作with open('old.txt',mode='rt',encoding='utf-8') as read_f,\open('new.txt',mode='wt',encoding='utf-8') as wrife_f:for line in read_f:wrife_f.write(line.replace('python','xxx'))os.remove('old.txt')   # 删除未修改的文件
os.rename('new.txt','old.txt')  # 将新文件重命名为和旧文件相同的名字

practice

r模式---使用文件存储用户名密码,实现登陆功能

username = input('please input your username:').strip()
password = input('please input your password:').strip()
with open(r'F:\FullStack\Python_based\info', 'r', encoding='utf-8') as f:for line in f:info = line.strip('\n')  # 去掉每一行后面的换行符,默认文件中每换一行,每行后面都会有换行符name, pwd = info.split(':')  # 解压赋值if username == name and password == pwd:print('successful!')else:  # 要循环完成所有信息之后才知道用户名和密码是否正确print('invalid username or password!')

a模式---使用文件存储用户名密码,实现注册功能

username = input('please input your username:').strip()
password = input('please input your password:').strip()
with open(r'F:\FullStack\Python_based\info', 'a', encoding='utf-8') as f:info = f'{username}:{password}\n'f.write(info)

t/b模式---实现文件拷贝工具

src_path = input('Please enter the path where you want to copy the file:')
target_path = input('please enter the target path:')
with open(r'{}'.format(src_path), mode='rb') as f,\open('{}'.format(target_path), mode='wb') as f1:for line in f:f1.write(line)

最后感谢每一个认真阅读我文章的人,礼尚往来总是要有的,这些资料,对于【软件测试】的朋友来说应该是最全面最完整的备战仓库,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走:

这些资料,对于【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴上万个测试工程师们走过最艰难的路程,希望也能帮助到你! 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/638198.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构:顺序循环队列

队列是限制在两端操作进行插入操作与删除操作的线性表,允许进行插入操作的一端称为"队尾",允许进行删除操作的一端称为“队头”。当线性表中没有元素时,称为“空队”。队列的特点是先进先出。 队列两种规定: 1、front…

使用RSVP进行带宽预留

使用RSVP进行带宽预留 服务质量(QoS)工具包括 标记, 管制和 整形 机制,主要是区分服务(DiffServ)工具。DiffServ机制可提供带宽保证(在各种刚性级别上),但是它们都不提供…

B站提示:“当前浏览器版本较低……”可行的解决方案(edge浏览器)

文章目录 问题研究和分析使用User-Agent Switcher for Chrome插件的解决方法使用userAgent switcher的解决方法 问题研究和分析 问题:使用最新版浏览器访问B站,首页总是有一条横幅提示:当前浏览器版本较低,为保证您的使用体验&am…

JS-WebAPIs- Window对象(五)

• BOM(浏览器对象模型) BOM(Browser Object Model ) 是浏览器对象模型 window对象是一个全局对象,也可以说是JavaScript中的顶级对象像document、alert()、console.log()这些都是window的属性,基本BOM的属性和方法都是window的。所有通过var定义在全局…

cmake构建和简单实操

构建方式 有两种构建方式,分别为内部构建和外部构建。 内部构建 (不建议使用) 内部构建会在 同级目录下产生一大堆中间文件,这些中间文件并不是我们最终所需要的,和工程源文件放在一起会显得杂乱无章。 外部构建&…

一键合并,轻松管理,尽在新一代TXT文本管理工具

你是否经常遇到多个文本文件需要合并的情况?是否曾经为了整理这些文件而头痛不已?现在,我们为你带来了一款全新的TXT文本管理工具,让你一键即可合并多个TXT文本,轻松管理你的文本文件 首先,在首助编辑高手…

【蓝桥杯日记】复盘篇一:深入浅出顺序结构

🚀前言 本期是一篇关于顺序结构的题目的复盘,通过复盘基础知识,进而把基础知识学习牢固!通过例题而进行复习基础知识。 🚩目录 前言 1.字符三角形 分析: 知识点: 代码如下 2. 字母转换 题目分析: 知…

Mac M1 Parallels CentOS7.9 Deploy Typecho

一、创建名称空间 kubectl create ns prod二、创建PV & PVC vim local-pv1.yamlapiVersion: v1 kind: PersistentVolume metadata:name: local-pv-1 spec:capacity:storage: 1GiaccessModes:- ReadWriteOncepersistentVolumeReclaimPolicy: RetainstorageClassName: loca…

使用JFLASH实现文件程序自动化合并及下载功能

主要总结下使用 SEGGER 工具集的 JFLASH 软件实现hex/bin文件合并以及程序的自动下载使用方法。 起因是最近使用到LVGL字库文件的制作,每次都要将分散的bin文件按既定分配的偏移作合并处理,刚开始使用的是二进制文件合并工具,文件少的时候还行&#xff…

Mediapipe框架介绍及使用说明

介绍 Mediapipe是Google开发的一款开源的跨平台框架,用于构建实时多媒体应用程序。它提供了一系列预训练的机器学习模型和工具,可以用于各种计算机视觉、音频处理和姿态估计等任务。 特点 Mediapipe库的主要特点包括: 1.实时性能&#xff…

mysql 容器化安装(docker)离线和在线

前言:在部署hive或airflow 升级过程中,总需要一个对应的数据库存储元数据,一个轻量级的mysql容器刚刚好。轻量、可快速移植、具有隔离性。 文章目录 1、查看机器版本2、安装 docker3、启动docker 服务4、docker 常用命令docker5、拉取mysql …

6种解决msvcp140.dll文件丢失的有效方法讲解

msvcp140.dll是一个动态链接库文件,它是Microsoft Visual C 2015 Redistributable的一部分。这个文件通常位于Windows操作系统的System32文件夹中,它包含了许多用于支持C编程语言的函数和类。当您在运行一个需要使用这些函数和类的应用程序时&#xff0c…

支付宝小程序开发踩坑笔记(支付宝、学习强国小程序)

1、接口请求安卓端回调 success,IOS 端回调 fail 原因:dataType 设置不对,默认是 json 格式,对返回数据会进行 json 解析,如果解析失败,就会回调 fail 。加密传输一般是 text 格式。 2、input 禁止输入空格…

【Docker】未来已来 | Docker技术在云计算、边缘计算领域的应用前景

欢迎来到英杰社区: https://bbs.csdn.net/topics/617804998 欢迎来到阿Q社区: https://bbs.csdn.net/topics/617897397 📕作者简介:热爱跑步的恒川,致力于C/C、Java、Python等多编程语言,热爱跑步&#xff…

【轮式平衡机器人】——角度/速度/方向控制分析软件控制框架

轮式平衡机器人具有自不稳定性,可类比一级倒立摆系统的控制方法,常见有反馈线性化方法、非线性PID控制、自适应控制、自抗扰控制,还有改进的传统缺乏对外界干扰和参数改变鲁棒性的滑模变结构控制。我们采用较为简单的双闭环PID控制实现平衡模…

解锁黑匣子:Chain-of-Note如何为(RAG)带来透明度

英文原文地址:https://ai.plainenglish.io/unlocking-the-black-box-how-chain-of-note-brings-transparency-to-retrieval-augmented-models-rag-ae1ebb007876 论文地址:https://arxiv.org/pdf/2311.09210.pdf 2023 年 11 月 16 日 介绍 检索增强语…

HTML CSS 发光字头特效

效果展示&#xff1a; 代码&#xff1a; <html><head> </head><style>*{margin: 0;padding: 0;}body {text-align: center;}h1{/* border: 3px solid rgb(201, 201, 201); */margin-bottom: 20px;}.hcqFont {position: relative;letter-spacing: 0.07…

构建高可用消息队列系统 01

构建高可用消息队列系统 01 引言1. RabbitMQ简介介绍1.1 什么是RabbitMQ1.2 RabbitMQ的核心特性1.3 RabbitMQ与AMQP 2.安装RabbitMQ3.消息队列实践总结 引言 在当今互联网时代&#xff0c;消息队列系统扮演着至关重要的角色&#xff0c;它们被广泛应用于分布式系统、微服务架构…

REVIT二次开发根据类别选择元素

步骤1 选择高亮选择的元素 步骤2 高亮显示 using System; using System.Collections.Generic; using System.Linq; using System.Text;

JVM(上)

目录 一、JVM概述 一、JVM作用 二、JVM整体组成部分 二、JVM结构-类加载 一、类加载子系统概述 二、类加载过程 1.加载 2.链接 3.初始化&#xff08;类加载过程中的初始化&#xff09; 三、类加载器分类 大致分两类&#xff1a; 细致分类&#xff1a; 四、双亲委派机制 五、打…