开头th_是什么文件_Python文件读写最详细的讲解

本文来自公众号:可乐的数据分析之路

今天这篇文章来详细讲解一下Python中的文件读写。

1、文件读写的流程

1)类比windows中手动操作txt文档,说明python中如何操作txt文件?

① windows中手动操作txt文件的步骤

  • 找到word文档

  • 打开word文档

  • 查看(或操作)word文档中的内容

  • 关闭word文档

② python操作txt文件的步骤

  • 获取被打开的文件的内存对象,该内存对象又叫做“文件句柄”。

  • 通过这个内存对象(文件句柄),来对文件进行操作(读取,写入等操作)。

  • 关闭文件

2)什么是文件的内存对象(文件句柄)?

使用python读取一个txt文件的时候,相当于把这个文件从硬盘上,读取到了内存中。我们如果想要操作这个文件,是不是先要获取这个文件对象?只有获取这个文件对象后,才能够真正的去操作这个文件,不管是读取文件中的内容,还是向文件中写入内容。

这个“文件句柄”包含了文件的文件名、文件的字符集、文件的大小、文件在硬盘上的起始位置。

3)演示怎么读取文件

① 演示如下

f = open(r"G:\6Tipdm\file_read_write\yesterday.txt","r",encoding="utf-8")
data  = f.read()
print(data[:245])
f.close()

结果如下:

cb2975438c855b25ed9bf18f01720841.png

② 一个很奇怪的现象?

f = open(r"G:\6Tipdm\file_read_write\yesterday.txt","r",encoding="utf-8")
data  = f.read()
data1 = f.read()
print(data[:245])
print("-------------------------------------")
print(data1[:245])
f.close()

结果如下:

10b3e88a92e0337fc8c437a74d3fd01c.png
问题:我们读取了2遍内容,为什么只显示了一次读取的结果呢?对于上述问题,我们用一张图回答上述问题。
ae8fbd5d96eb7d069c8df3bae4ae1535.png

通过上图我们可以发现,当我们操作这个“文件句柄”的read()方法去读取文件的时候,这个句柄会从文件的开头位置1,移动到文件的结束位置2。如果不做任何操作,读取完毕之后,句柄就会停止在2这个位置。因此当我们再次读取文件的时候,该句柄是从2这个位置,往后面读取内容。由于后面没有任何内容,因此第二次读取为空。

那么,如果我们想要第二次同样能够读取到文件中的内容,应该怎么办呢?那么接着往下看。

4)演示怎么写文件

f = open(r"G:\6Tipdm\file_read_write\yesterday2.txt","w",encoding="utf-8")
f.write("我爱北京天安门")
f.close()

结果如下:

a999d942558558e4b8047c4803907171.png

假如我们在写一句“天安门上太阳升”,会出现啥情况呢?
f = open(r"G:\6Tipdm\file_read_write\yesterday2.txt","w",encoding="utf-8")
f.write("天安门上太阳升")
f.write("很好,很好")
f.close()

结果如下:

e8f9aae0233117394871d64bff561d12.png

意外发生。当我们再次写入新的内容的时候,发现之前写的内容不见了,这是为啥呢?这就是我们下面要讲述的“文件读写的几种常见模式”。

2、文件读写的几种常见模式(你不清楚的知识点)

738f5de92a5d8aec61cfa0edccc52f67.png

1)关于r+、w+、a+使用说明(易错点)

当我们读取某个文件,向文件中写入某些内容(覆盖写),向文件中追加写入某写内容时,最好的方式就是分别使用r、w、a这三种模式。对于这三种模式,要么读,要么写,读模式就不能写,写模式就不能读。

对于r+、w+、a+这三种模式,如果你不是特别清楚python文件读写的原理,就不要轻易使用,因为会出现很多问题,下面我们仅演示r+、w+、a+这三种模式。

2)r+模式:可读可写

对于这种模式,不管是读取文件中的内容,还是朝文件中写入内容。前提条件:文件存在。

# 只读取文件中的内容
f = open(r"G:\6Tipdm\file_read_write\yesterday1.txt","r+",encoding="utf-8")
data = f.read()
print(data)
f.close()

# 朝文件中写入内容后,立即读取,会出现啥问题?
f = open(r"G:\6Tipdm\file_read_write\yesterday1.txt","r+",encoding="utf-8")
f.write("丽丽姑娘")

data = f.read()
print(data)
f.close()

# 朝文件中写入内容后,调整句柄位置后,再读取,会出现啥问题?
f = open(r"G:\6Tipdm\file_read_write\yesterday1.txt","r+",encoding="utf-8")
f.write("丽丽姑娘")
f.seek(0)
data = f.read()
print(data)
f.close()

结果如下:

b0d4080fa280cdca8cc6056883a0bc2a.png
结果分析:
使用r+模式,当只读文件的时候,可以读取到其中的内容。

当写入内容后,立即读取文件内容,发现什么也读取不到。这是由于当你写入内容后,文件句柄会放在写入内容的最后面,因此当你立即读取的时候,句柄会从上次内容最后的位置,朝后面读,因此读取为空。

当朝文件中写入内容后,调整句柄位置后,再读取文件中的内容,发现就有了内容。这是由于我们使用了f.seek(0)方法,将句柄由内容末尾调整到了内容开头,因此就又有了内容。

3)w+:可读可写

# 直接往文件中写入内容
f = open(r"G:\6Tipdm\file_read_write\yesterday3.txt","w+",encoding="utf-8")
f.write("bbbbbb")
f.close()

# 直接读取上述文件,看看会发生啥问题?(特别注意这一步)
f = open(r"G:\6Tipdm\file_read_write\yesterday3.txt","w+",encoding="utf-8")
data = f.read()
print(data)
f.close()

# 朝文件中写入内容后,立即读取,又会发生什么?
f = open(r"G:\6Tipdm\file_read_write\yesterday3.txt","w+",encoding="utf-8")
f.write("哈哈哈哈哈")
data = f.read()
print(data)
f.close()

# 朝文件中写入内容后,调整句柄位置后,再读取,会发生什么?
f = open(r"G:\6Tipdm\file_read_write\yesterday3.txt","w+",encoding="utf-8")
f.write("嘿嘿嘿嘿嘿")
f.seek(0)
data = f.read()
print(data)
f.close()

结果如下:

7cf0d4a1a1c4e9cce7da1b565aaad534.png
结果分析:
使用w+模式,当我们直接朝文件中写入bbbbbb,毋庸置疑,肯定是可以的。

接着,我们直接读取这个文件中的内容,奇怪的现象发生了,什么都读取不到。这是因为w+模式,在进行文件读取的时候,默认是先写再读。但是我们确实没有写入任何东西呀?这是由于系统默认帮我们写入了一个空值,因此把原有内容覆盖了。所以再当我们读取文件中的内容的时候,发现读取为空。

再接着,我们朝文件中,写入内容后再立即读取,这下仍然读取不到任何内容,这又是为什么呢?这是由于我们第一次写入“哈哈哈哈哈哈”的时候,句柄移动到了内容最后。当我们立即读取的时候,句柄从内容最后的位置,继续朝后面读,因此啥也没有。

最后,当朝文件中写入内容后,调整句柄位置后,再读取文件中的内容,发现就有了内容。这是由于我们使用了f.seek(0)方法,将句柄由内容末尾调整到了内容开头,因此就又有了内容。

4)a+:可读可写

# 直接朝文件中写入内容
f = open(r"G:\6Tipdm\file_read_write\yesterday4.txt","a+",encoding="utf-8")
f.write("哈哈")
f.close()

# 直接读取文件中的内容
f = open(r"G:\6Tipdm\file_read_write\yesterday4.txt","a+",encoding="utf-8")
data = f.read()
print(data)
f.close()

# 调整句柄位置后,再读取文件中的内容
f = open(r"G:\6Tipdm\file_read_write\yesterday4.txt","a+",encoding="utf-8")
f.seek(0)
data = f.read()
print(data)
f.close()

结果如下:

1cacaa8f053f09c9f2a133d3a47f6fe2.png
结果分析:
使用a+模式,朝文件中写入内容,毋庸置疑,肯定是没问题的。

接着,当我们读取上述文件中的内容,会发现什么也读取不到。这是由于,使用r+模式打开文件,文件句柄默认放在内容的最后面,因此你直接读取其中的内容,什么也没有。

最后,在读取文件中内容之前,我们使用了f.seek(0)方法,将句柄由内容末尾调整到了内容开头,再次读取文件中的内容,发现就有了内容。

3、read、readline、readlines的区别

b01701b2114c0a4051359630f962a440.png

1)read()方法的使用说明

f = open(r"G:\6Tipdm\file_read_write\test.txt","r",encoding="utf-8")
data = f.read()
print(type(data))
print(data)
f.close()

结果如下:

a301d413116d3b38e6e8454844db992c.png

2)readline()方法的使用说明

f = open(r"G:\6Tipdm\file_read_write\test.txt","r",encoding="utf-8")
data = f.readline()
print(type(data))
print(data)
f.close()

f = open(r"G:\6Tipdm\file_read_write\test.txt","r",encoding="utf-8")
for i in range(3):
    data = f.readline()
    print(data)
f.close()

结果如下:

2c32dab84403077872a0a2150f5762ee.png

去掉每一行末尾的换行符:
f = open(r"G:\6Tipdm\file_read_write\test.txt","r",encoding="utf-8")
for i in range(3):
    data = f.readline().strip()
    print(data)
f.close()

结果如下:

1371ad2c7efe87f935caf8a7955ba71a.png

3)readlines()方法的使用说明

f = open(r"G:\6Tipdm\file_read_write\test.txt","r",encoding="utf-8")
data = f.readlines()
print(type(data))
print(data)
f.close()

结果如下:

70ba7e6f70acdd1e7a346fb94f5783f8.png

4、对于一个10G的大文件,怎么高效的查看文件中的内容呢?

1)相关说明

当我们读取文件中的内容,相当于是把写在硬盘上的东西,读取到内存中。不管你是使用read()或者readlines()一次性读取到到内存中,还是使用readline()一行行的将整个内容读取到内存中,如果文件很大,都将会耗用很大的内存。同时,从硬盘读取文件内容到内存中,也会很慢。

因此,有没有一种高效的方式?既让我们看到了文件中的内容,又不会占用内存呢?下面我们将进行说明。

2)操作说明

f = open(r"G:\6Tipdm\file_read_write\yesterday.txt","r",encoding="utf-8")
for line in f:
    print(line.strip())

部分截图如下:

07045182aaabc769688eb8c4f966e9fa.png
结果说明:
上述方式中,f相当于一个迭代器,我们使用for循环迭代f中元素。每循环一次,就相当于读取一行到内存中,并记住这一次读取到的位置。当进行下次迭代的时候,上一次读取到内存中的内容,就会被销毁了,当前内存中读取的就是第二行的内容。当进行第三次循环的时候,内存中第二行的内容也会被销毁,此时内存中只会保存第三行的内容,这样依次进行下去。直到最后一次循环,读取最后一行的内容,此时,内存中保留的也只是最后一行的内容。

迭代器有一个特性:每次进行迭代的时候,就会记住当前读取的位置。当进行下一次迭代的时候,前面的内容会被销毁掉,在内存中只会保留当前循环得到的内容。

欢迎扫码关注作者的CSDN:

d94d752b268167f35de2b58178f8fc35.png

687aba826f5824d78056a6a69d4f9c9c.png

戳一下右下角在看,小小举动,大大支持~

加入机器学习微信群,请后台回复「入群

推荐阅读:

当当撒币了这是一份优秀的机器学习书单极度通俗易懂:《漫画算法》(Python篇)

06924f9bee04d4b6785ec2e20848e675.png

喜欢文章,点个在看 71ed3d03ce7e2c498e32ce146c865ff6.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/307114.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

把 Console 部署成 Windows 服务,四种方式总有一款适合你!

一:背景 1. 讲故事上周有一个项目交付,因为是医院级项目需要在客户的局域网独立部署。程序:netcore 2.0,操作系统:windows server 2012,坑爹的事情就来了, netcore sdk 一直装不上,网上找了资料…

AQS ReentrantLock 实现原理

参考链接 文章目录1 AQS (AbstractQuenedSynchronizer)2 Lock 接口与显式条件3 转账 Demo:解决死锁的两种方案4 ReentrantLock 非公平锁加锁流程5 ReentrantLock 和 synchronized 的异同6 ReentrantReadWriteLock1 AQS (AbstractQuenedSynchronizer) 基于 AQS 的同步…

TensorFlow 2学习和工业CV领域应用 心得分享

我是一名来自苏州的机器视觉开发者,从事传统的机器视觉算法开发有11年了,从2018年开始,因为一些复杂微弱的瑕疵检测项目遇到的传统算法瓶颈,开始接触到了深度学习,并选择了使用TensorFlow,期间也是不断摸索…

历史版本_新版本爆料第弹丨英雄练习新去处,荣耀历史秀出来!

《万物有灵》新版本即将到来新版本来临之前妲己宝宝给自己定下了2个小目标!via.小五怎么不开心目标一扩展自己小得可怜的英雄勺成为一名拥有英雄海的补位大神目标二通过自己的实力获得N1个响当当的荣耀称号很多召唤师会有疑问:凭妲己宝宝的实力&#xff…

循环遍历多层json_面试官:JSON.stringify() 实现深拷贝有什么问题

为什么要进行深拷贝JS中的变量在内存中存储分为值类型和引用类型: 值类型: 1、占用空间固定,保存在栈中; 2、保存与复制的是值本身; 3、基本类型数据是值类型(String,Number,undefined,Boolean,Null&#x…

.NET架构小技巧(6)——什么是好的架构

首先声明,可能本篇文章的含金量配不上这个标题,因为说起架构,可能大家都比较关注高大上的架构,比如分布式的,高并发的,低耦合的,易扩展的等等,本篇可能使你失望了,因为这…

电子工程系庆贺电贺信_创造下一代光电子集成电路

全球互联网正以每年24%的复合速度增长,到2021年将达到每年3.3 zb字节。高速光通信在这个不断连接的世界中是迫切需要的,为了跟上这种增长,光模块的制造的发展是迫切需要的。复旦大学电子工程系博士研究生刘晓研究了集成构成光模块的电子电路和…

禁用笔记本键盘_如何禁用/启用笔记本内置键盘?

有些小伙伴外接了USB键盘想屏蔽掉笔记本的内置键盘,绞尽脑汁都没有办法禁用,其实方法很简单只需要一个简单的命令即可。1、右键点击左下角开始图标(WinX),选择Windows Powershell(管理员)。2、在打开的窗口中,输入cmd。3、然后输入…

IdentityServer4系列 | 资源密码凭证模式

一、前言从上一篇关于客户端凭证模式中,我们通过创建一个认证授权访问服务,定义一个API和要访问它的客户端,客户端通过IdentityServer上请求访问令牌,并使用它来控制访问API。其中,我们也注意到了在4.x版本中于之前3.x…

深入探究ASP.NET Core Startup的初始化

前言Startup类相信大家都比较熟悉,在我们使用ASP.NET Core开发过程中经常用到的类,我们通常使用它进行IOC服务注册,配置中间件信息等。虽然它不是必须的,但是将这些操作统一在Startup中做处理,会在实际开发中带来许多方便。当我们…

【源码】常用的人脸识别数据库以及上篇性别识别源码

上一篇《使用ML.NET模型生成器来完成图片性别识别》发布后,很多朋友希望得到源码,这里附上地址:https://github.com/xin-lai/GenderRecognition常用的人脸数据库对于部分朋友说,找不到训练的数据,这里也给出部分数据&a…

程序员过关斩将--真的可以用版本号的方式来保证MQ消费消息的幂等性?

灵魂拷问MQ消息的消费为什么有时候要求幂等性?你们都说可以用版本号来解决幂等性消费?什么才是消息幂等性消费的根本性问题?随着系统的复杂性不断增加,多数系统都会引入MQ来进行解耦,其实从引入MQ的初衷来说&#xff0…

spring的钩子_spring提供的钩子,你知道哪些

俗话说得好“工欲善其事必先利其器”,现如今springboot与springcloud已成为快速构建web应用的利器。作为一个爪洼工程师,知道如下的spring扩展点,可能会让你编写出扩展性、维护性更高的代码。spring提供的钩子,你知道哪些bean的生…

.Net 5性能改进

起因在.Net Core跳过4.0,避免和先.Net Framework 4.0同名,版本号变为5.0,同时也不在叫.Net Core改为.Net 5(统一的叫法),先看看官方对.Net版本规划.本文主要是根据https://devblogs.microsoft.com/dotnet/performance-improvements-in-net-5/ 翻译而来.不完全翻译.顺序也有所调…

开放数字世界中的复杂图数据挑战 —— 以教育与开源场景为例

摘要:开源开放的数字世界开始成为时代的潮流,云原生、数据中台、智能PRA开始成为数字世界中的新一代中流砥柱。随着第四范式的普遍流行,各个行业中的数字化转型都会带了海量的具有无限关联的复杂图数据。本报告将以教育与开源两个场景为例&am…

在IIS中部署SPA应用,多么痛的领悟!

目前公司的Web项目是SPA应用,采用前后端分离开发,所以有时也会倒腾Vue框架。“前后端应用最终以容器形态、在k8s中部署, 为此我搭建了基于Gitlab flow的Devops流程。在Devops实践中,容器部署成为良方和事实标准。但是在开发和自测阶段&#x…

mysql闪回工具下载_MySQL闪回工具之myflash 和 binlog2sql

实践利用binlog2sql查询两个binlog之间的SQL:必须是两个binlog日志,指定start-file和stop-filebinlog2sql -h127.0.0.1 -P3309 -udba -pxxxxxx -dsakila -t employee --start-filemysql-bin.000112 --stop-filemysql-bin.000113 > /tmp/db.sql利用bin…

MySQL大表优化方案

背景阿里云RDS FOR MySQL(MySQL5.7版本)数据库业务表每月新增数据量超过千万,随着数据量持续增加,我们业务出现大表慢查询,在业务高峰期主业务表的慢查询需要几十秒严重影响业务方案概述一、数据库设计及索引优化MySQL数据库本身高度灵活,造成…

使用Azure静态Web应用部署Blazor Webassembly应用

上一次演示了如何使用Azure静态web应用部署VUE前端项目(使用Azure静态web应用全自动部署VUE站点)。我们知道静态web应用支持VUE,react,angular等项目的部署。除了支持这些常见前端框架,静态web应用同样支持微软推出的最…

TIOBE 11 月榜单:Python 挤掉 Java,Java的下跌趋势确立了?

喜欢就关注我们吧!TIOBE 公布了 2020 年 11 月的编程语言排行榜。Python 已成功跃居榜单第二名,本月排名率为 12.12%;Java 被挤到第三位,排名率降至 11.68%。自有 TIOBE 榜单以来,C 和 Java 之前一直占据着前两名的位置…