Python从入门到网络爬虫(文件I/O详解)

Python提供了强大而灵活的文件I/O(输入/输出)工具,能够读取、写入和处理各种文件类型。本文将深入介绍Python文件I/O的技巧和示例代码,帮助大家更好地理解如何在Python中处理文件。

打开文件

在Python中,可以使用open()函数来打开文件,指定文件名和打开模式。常见的打开模式包括:

'r':只读模式(默认),用于读取文件内容。

'w':写入模式,用于创建新文件或覆盖已有文件。

'a':追加模式,用于在文件末尾添加内容。

'b':二进制模式,用于处理二进制文件(如图像、音频等)。

't':文本模式(默认),用于处理文本文件。

以下是打开文件的示例代码:

1

2

3

4

5

6

7

8

9

10

11

12

# 打开一个文本文件以供读取

with open('example.txt', 'r') as file:

    data = file.read()

    print(data)

# 打开一个文本文件以供写入

with open('new_file.txt', 'w') as file:

    file.write('Hello, World!')

# 打开一个二进制文件以供读取

with open('image.jpg', 'rb') as file:

    image_data = file.read()

逐行读取文件

如果需要逐行读取文件内容,可以使用readline()方法或迭代文件对象。以下是示例代码:

1

2

3

4

5

6

7

8

9

10

11

12

# 使用readline()逐行读取文件

with open('example.txt', 'r') as file:

    while True:

        line = file.readline()

        if not line:

            break

        print(line.strip())  # 去除行末的换行符

# 使用迭代文件对象逐行读取

with open('example.txt', 'r') as file:

    for line in file:

        print(line.strip())

写入文件

要将数据写入文件,可以使用write()方法。如果想写入多行内容,可以使用writelines()方法。以下是示例代码:

1

2

3

4

5

6

7

8

9

# 写入文本到文件

with open('new_file.txt', 'w') as file:

    file.write('Line 1\n')

    file.write('Line 2\n')

# 写入多行文本到文件

lines = ['Line 1\n', 'Line 2\n', 'Line 3\n']

with open('new_file.txt', 'w') as file:

    file.writelines(lines)

处理CSV文件

CSV文件常用于存储表格数据。Python提供了csv模块来处理CSV文件。以下是一个读取CSV文件的示例:

1

2

3

4

5

6

import csv

with open('data.csv', 'r') as file:

    csv_reader = csv.reader(file)

    for row in csv_reader:

        print(row)

还可以使用csv模块来写入CSV文件。

使用上下文管理器

使用with语句和上下文管理器可以确保在文件使用完毕后自动关闭文件,无需手动调用close()方法。

1

2

3

4

5

6

7

8

# 使用上下文管理器来读取文件

with open('example.txt', 'r') as file:

    data = file.read()

    print(data)  # 在此块中,文件已自动关闭

# 使用上下文管理器来写入文件

with open('new_file.txt', 'w') as file:

    file.write('Hello, World!'# 在此块中,文件已自动关闭

异常处理

在文件I/O操作中,异常处理是确保程序稳定性的重要部分。文件可能会出现各种问题,如文件不存在、权限问题、文件格式错误等。适当的异常处理可以避免程序因异常而崩溃,同时提供有用的错误信息。

以下是一个处理文件不存在异常的示例:

1

2

3

4

5

6

try:

    with open('non_existent_file.txt', 'r') as file:

        data = file.read()

        print(data)

except FileNotFoundError:

    print("文件不存在")

在这个示例中,使用try和except语句来捕获FileNotFoundError异常。如果文件不存在,程序将打印"文件不存在",而不会中断执行。

除了FileNotFoundError,还有其他可能的异常,如PermissionError(权限问题)和IOError(一般I/O错误)。根据具体情况,可以选择处理不同类型的异常。

移动文件指针

在读取文件时,文件指针表示当前读取的位置。可以使用seek()方法来移动文件指针到文件中的特定位置。

例如,要从文件的开头开始读取,可以将文件指针移动到偏移量为0的位置:

1

2

3

4

with open('example.txt', 'r') as file:

    file.seek(0# 将文件指针移动到文件开头

    data = file.read()

    print(data)

使用os模块操作文件系统

os模块提供了许多与文件系统交互的功能,包括创建文件夹、删除文件、重命名文件等。

以下是一些示例:

1

2

3

4

5

6

7

8

9

10

11

12

13

import os

# 创建文件夹

os.mkdir('my_folder')

# 删除文件

os.remove('file_to_delete.txt')

# 重命名文件

os.rename('old_file.txt', 'new_file.txt')

# 获取文件列表

file_list = os.listdir('.')

使用shutil模块复制和移动文件

shutil模块提供了复制、移动和删除文件的功能。

以下是一些示例:

1

2

3

4

5

6

7

8

9

10

import shutil

# 复制文件

shutil.copy('source_file.txt', 'destination_file.txt')

# 移动文件

shutil.move('source_file.txt', 'new_location/destination_file.txt')

# 删除文件夹及其内容

shutil.rmtree('folder_to_delete')

总结

文件I/O是Python编程中的重要部分,它涵盖了读取、写入、处理各种文件类型的操作。在本文中,探讨了文件I/O的各种技巧和最佳实践,以帮助大家更好地处理文件操作。

文件I/O是Python编程中的关键技能之一,它涵盖了多种操作和最佳实践。掌握这些技巧将使你能够处理各种文件操作,从而更好地完成任务并编写健壮的Python代码。无论是处理文本文件、二进制文件,还是操作文件系统,Python提供了丰富的工具和库来支持你的需求。希望本文的内容能够帮助大家更好地理解和应用文件I/O。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/600924.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【安全篇 / FortiGuard】(7.4) ❀ 01. FortiGuard服务到期后会怎么样?❀ FortiGate 防火墙

【简介】很多企业为了网络的安全,都会购买FortiGuard服务,但是FortiGuard服务都是有期限的,由于各种原因,企业在超过服务期限后没有继续购买FortiGuard服务,那么会出现什么情况?防火墙还能继续工作吗&#…

61.网游逆向分析与插件开发-游戏增加自动化助手接口-游戏红字公告功能的逆向分析

内容来源于:易道云信息技术研究院VIP课 上一节内容:游戏公告功能的逆向分析与测试-CSDN博客 码云地址(master分支):https://gitee.com/dye_your_fingers/sro_-ex.git 码云版本号:63e04cc40f649d10ba2f4f…

【卡梅德生物】制备兔单抗常见问题及解决方法

在制备兔单抗的过程中,可能会遇到一些常见问题,以下是一些可能的问题和相应的解决方法: 1、低抗体产量: 问题原因:免疫兔子后,可能出现抗体产量较低的情况。 解决方法:提高抗原免疫方案、增加…

参加CTF比赛不会这些技术点,过去也是当炮灰!【CTF要掌握哪些技术点】

文章目录 0.前言1. Web技术2. 逆向工程3. 密码学4. 网络分析5. 系统编程6. 二进制分析7. 密码破解8. 隐写术9. 社会工程学10. 日志分析 0.前言 很多人学了很久网络安全方面的技术出来还是找不到工作,这到底是为什么?其实是没弄清楚现在企业在网络安全方…

伦茨科技Apple Find My认证芯片-ST17H6x芯片

深圳市伦茨科技有限公司(以下简称“伦茨科技”)发布ST17H6x Soc平台。成为继Nordic之后全球第二家取得Apple Find My「查找」认证的芯片厂家,该平台提供可通过Apple Find My认证的Apple查找(Find My)功能集成解决方案。…

Docker网络相关操作

文章目录 网络相关操作1 网络模式1.1 bridge模式1.2 host模式1.3 Container网络模式1.4 none模式1.5 overlay网络模式1.6 macvlan网络模式 2 bridge网络2.1 通过link的方式2.2 新建bridge网络 3 none网络4 host网络5 网络命令汇总5.1 查看网络5.2 创建网络5.3 删除网络5.4 查看…

(适趣AI)Vue笔试题

📑前言 本文主要是【Vue】——(适趣AI)Vue笔试题的文章,如果有什么需要改进的地方还请大佬指出⛺️ 🎬作者简介:大家好,我是听风与他🥇 ☁️博客首页:CSDN主页听风与他 …

C++——类型转换

在文章的开始,先祝大家牢大年快乐 C语言中的类型转换 在C语言中,如果赋值运算两边类型不同,则会发生类型转换。一般来说,C语言有两种形式的类型转换:隐式转换和显式转换。 隐式转换,就是编译器自动根据其…

YOLOv8改进 | 主干篇 | EfficientNetV2均衡缩放网络改进特征提取层

一、本文介绍 这次给大家带来的改进机制是EfficientNetV2,其在其V1版本通过均衡地缩放网络的深度、宽度和分辨率,以提高卷积神经网络的性能的基础上,又提出了一种改进的渐进式学习方法,通过在训练过程中逐步增加图像尺寸并适应性调整正则化来加快训练速度,同时保持准确性…

小白入门基础 - spring Boot 入门

1.简介 spring Boot是为了简化java的开发流程而构建的,即使是使用springMVC框架,也依然需要大量配置和依赖导入, 这无疑是繁琐的,spring Boot采用了”习惯由于配置“的原则,进行一键化部署,这样极大…

214.【2023年华为OD机试真题(C卷)】测试用例执行计划(排序题-JavaPythonC++JS实现)

🚀点击这里可直接跳转到本专栏,可查阅顶置最新的华为OD机试宝典~ 本专栏所有题目均包含优质解题思路,高质量解题代码(Java&Python&C++&JS分别实现),详细代码讲解,助你深入学习,深度掌握! 文章目录 一. 题目-测试用例执行计划二.解题思路三.题解代码Pytho…

Java解决峰与谷问题

Java解决峰与谷问题 01 题目 在一个整数数组中,“峰”是大于或等于相邻整数的元素,相应地,“谷”是小于或等于相邻整数的元素。例如,在数组{5, 8, 4, 2, 3, 4, 6}中,{8, 6}是峰, {5, 2}是谷。现在给定一个…

三英战吕布web3游戏项目启动全流程

项目是一个学习相关的很好的例子并且开源,原本的项目是连接goerli网络,但我把它修改为可连接ganache网络的项目了,更方便启动。 智能合约部分 进入文件 hardhat.config.js ,增加一个钱包私钥 2.执行npm install 3.测试合约 npx ha…

【Linux】linux配置静态IP、动态IP方法汇总

1、systemd-networkd 1.1 说明 systemd-networkd是systemd 的一部分 ,负责 systemd 生态中的网络配置部分(systemd-networkd.service, systemd-resolved.service)。使用 systemd-networkd,你可以为网络设备配置基础的 DHCP/静态IP网络等,还可以配置虚拟网络功能,例如网桥…

在pycharm中jupyter连接上了以后显示无此库,但是确实已经安装好了某个库,使用python可以跑,但是使用ipython就跑不了

今天遇到一个事情,就是用pycharm的jupyter时,连接不上,后来手动连接上了以后,发现环境好像不对。 一般来说,这里会是python3,所以里面的环境也是普通python的环境,并没有我下载的库,…

金和OA C6 SAP_B1Config.aspx 未授权漏洞

产品介绍 金和网络是专业信息化服务商,为城市监管部门提供了互联网监管解决方案,为企事业单位提供组织协同OA系统开发平台,电子政务一体化平台,智慧电商平台等服务。 漏洞描述 金和OA C6 SAP_B1Config.aspx接口 未授权,攻击者可通过此漏洞获取数据库账户密码等敏…

2015年电赛控制类—STM32风力摆控制系统资料+源程序

目录 一、项目背景 二、主要研究内容 三、总体思路与研究方案 四、主要研究结果 五、程序 六、图片 一、项目背景 风力摆控制系统是一种利用风力控制物体做简谐运动的系统,风力的利用和控制技术在我国的发展尚未完善,国内正处于起步阶段。风力摆的…

idea设置注释在鼠标当前位置,使其不从顶格位置添加注释

idea设置注释在鼠标当前位置,使其不从顶格位置添加注释 默认情况下,注释都是从改行的顶格开始,看起来不太美观而且不易清除分级 设置让其从代码处开始,步骤:File–>Sttings–>Editor–>Code Style &#xff…

Mysq之——分库分表

Mysq之——分库分表 简介分库分表的方式垂直分表垂直分库水平分库水平分表 图解:垂直分表与水平分表(分库类似)分库分表带来的问题 简介 分库分表就是为了解决由于数据量过大而导致数据库性能降低的问题,将原来独立的数据库拆分成…

[英语学习][24][Word Power Made Easy]的精读与翻译优化

[序言] 译者的这次翻译, 中规中矩, 就是遗漏了2个单词没有翻译出来 [英文学习的目标] 提升自身的英语水平, 对日后编程技能的提升有很大帮助. 希望大家这次能学到东西, 同时加入我的社区讨论与交流英语相关的内容. [原著英文与翻译版对照][第22页] This book is designed…