python文件操作(Windows路径,内置os库)+ 正则表达式(语法与re库)

文章目录

  • 前言
    • 1 Windows路径
      • (1)绝对路径 (Absolute Path)
      • (2)相对路径 (Relative Path)
  • 一、python文件的读写操作
    • 1 读写
      • (1)打开文件
        • file = open('test1.txt','r',encoding='utf-8') --- 打开文件
      • (2)读取文件内容
        • content = file.read() --- 读取全部内容,返回字符串
        • lines = readlines(): 读取所有行并返回一个包含每行内容的列表(逐行读取)
      • (3)写入内容
        • 写入新文件或覆盖文件 (write) - w
        • 追加内容 (append) - a
      • (4)file.close() : 关闭文件
      • (5)with open('test1.txt','r',encoding='utf-8')as f 语句
    • 2 二进制读写模式
  • 二、os 内置路径操作库
    • os.path.realpath(__file__):获取当前执行的脚本文件的绝对路径。
    • os.path.abspath(path): 把相对路径转成绝对路径。
    • os.getcwd():获取当前工作目录的绝对路径。
    • os.path.dirname(path): 返回path上一级的绝对路径
    • os.path.basename(path):返回路径path中的文件名或者目录名
    • os.listdir(path): 返回指定目录中的文件和子目录列表。
    • os.makedirs(path,exist_ok=True) --- 在给定路径创建目录
    • os.path.join(path1, path2,...): 将多个个路径组合成一个完整的路径。
    • os.path.exists(path): 检查路径是否存在。
    • os.path.isfile(path): 检查是否为文件。
    • os.path.isdir(path): 检查是否为目录。
    • os.remove(path): 删除指定文件。
    • os.rmdir(path): 删除指定空目录,必须是空目录;不是递归的删除,所以者函数屁用没有
  • 三、正则表达式
    • 1 正则表达式语法
    • 2 re 正则表达式处理库
      • (1)匹配对象obj获取信息的方法
        • • group(): 返回匹配的字符串。
        • • start(): 返回匹配的起始位置。
        • • end(): 返回匹配的结束位置。
        • • span(): 返回一个元组,包含匹配的起始和结束位置。
      • (2)返回第一个匹配到的信息
        • re.search(pattern, string): 在字符串中搜索模式,如果成功匹配,则返回第一个匹配对象obj。
      • (3)返回所有匹配结果
        • re.findall(pattern, string) :返回的是包含所有匹配字符串组成的列表
        • re.finditer(pattern, string):返回的是包含所有匹配项信息的迭代器,迭代器里面每一项都是一个匹配对象obj
      • (4)替换文本
        • re.sub(pattern, repl, string): 在字符串中查找匹配的模式,并用替换字符串替换它们。 并返回替换后的文本
      • (5)根据匹配拆分
        • re.split(pattern, string): 根据模式将字符串拆分为列表。返回拆分的列表
      • (6)练习:综合案例:编写一个软件的文本查找功能,要求全文查找所有符合条件的匹配项
  • 总结


前言

先介绍本部分的前置知识 ---- Windows路径知识。

1 Windows路径

在 Windows 操作系统中,处理文件和目录时,绝对路径和相对路径是两个非常重要的概念。理解和正确使用它们有助于高效地管理文件系统。以下是对 Windows 绝对路径和相对路径的详细说明以及在 Python 中的用法。

(1)绝对路径 (Absolute Path)

绝对路径是指从磁盘的根目录开始,完整地指向文件或目录的路径。它不依赖于当前的工作目录,无论在哪个位置,绝对路径始终指向同一个文件或目录。

Windows 中的绝对路径格式

在 Windows 中,绝对路径通常以驱动器号开头,后跟路径中的每个目录,使用反斜杠 (\) 分隔。例如:

C:\Users\JohnDoe\Documents\example.txt
  • C: 是驱动器号。
  • \Users\JohnDoe\Documents\example.txt 是从驱动器根目录到目标文件的完整路径。

在 Python 中,绝对路径可以直接使用。例如:

file_path = r"C:\Users\JohnDoe\Documents\example.txt"
with open(file_path, 'r') as file:content = file.read()print(content)

注意:

  • 使用 r 字符串前缀,表示原始字符串,避免反斜杠作为转义字符(如 \n)。
  • 也可以使用双反斜杠 (\\) 来避免转义问题:
file_path = "C:\\Users\\JohnDoe\\Documents\\example.txt"

(2)相对路径 (Relative Path)

相对路径是相对于当前工作目录的路径。它表示文件或目录相对于某个参考点的位置。

Windows 中的相对路径格式

在 Windows 中,相对路径通常不包括驱动器号,而是从当前工作目录或参考点开始。例如,如果当前工作目录是 C:\Users\JohnDoe,相对路径 .\Documents\example.txt 实际上表示 C:\Users\JohnDoe\Documents\example.txt

  • . 表示当前目录。
  • .. 表示上一级目录。
    相对路径的使用主要就是这两个点点的使用,下面用一个具体的文件结构来说明:
C:\
│
├── Users\
│   ├── JohnDoe\
│   │   ├── Documents\
│   │   │   ├── Project\
│   │   │   │   ├── report.txt
│   │   │   │   ├── data\
│   │   │   │   │   ├── analysis1.csv
│   │   │   │   │   ├── analysis2.csv
│   │   │   │   └── results\
│   │   │   │       ├── summary.docx
│   │   │   │
│   │   │   ├── Notes.txt
│   │   │
│   │   └── Pictures\
│   │       ├── vacation.jpg
│   │
│   ├── JaneDoe\
│   │   └── Downloads\
│   │       └── movie.mp4
│
└── Program Files\└── App\└── app.exe

假设我们当前的工作目录是 C:\Users\JohnDoe\Documents\Project\data
那么:

  • C:\Users\JohnDoe\Documents\Project\data\analysis1.csv的相对路径就可以写为 .\analysis1.csv,当前工作目录下面的文件路径也可以直接文件名就是相对路径analysis1.csv
  • C:\Users\JohnDoe\Documents\Project\report.txt的相对路径就可以写为 ..\report.txt
  • C:\Users\JohnDoe\Documents\Notes.txt的相对路径就可以写为..\..\Notes.txt
  • C:\Users\JohnDoe\Pictures\vacation.jpg的相对路径就可以写为 ..\..\..\Pictures\vacation.jpg

【注】:python中获取当前工作目录的函数 os 库里面含有。

一、python文件的读写操作

先介绍本节会用到的常见参数:
常用参数有:

  • file: 文件的路径或名称。
  • mode: 打开文件的模式,如只读(‘r’)、写入(‘w’)、追加(‘a’)、读写(‘r+’)等。
  • encoding: 文件的编码方式,如 ‘utf-8’。

常见模式说明:

  • ‘r’:只读模式,文件必须存在。
  • ‘w’:写入模式,文件不存在则创建,存在则清空。
  • ‘a’:追加模式,文件不存在则创建。
  • ‘b’:二进制模式,与其他模式结合使用,例如 ‘rb’ 表示以二进制读取。

1 读写

假设有以下txt文本在test1.txt中:
在这里插入图片描述

(1)打开文件

file = open(‘test1.txt’,‘r’,encoding=‘utf-8’) — 打开文件

(2)读取文件内容

content = file.read() — 读取全部内容,返回字符串
f = open('test1.txt','r',encoding='utf-8')
data = f.read()
f.close()
print(type(data))
# 可以看到返回的类型是str
print(data)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/853592.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【QT5】<知识点> QT常用知识(更新中)

目录 一、更改文本颜色和格式 二、QT容器类 三、字符串与整数、浮点数之间的转换 四、QString常用功能 五、SpinBox的属性介绍 六、滑动、滚动、进度条和表盘LCD 七、时间、日期、定时器 一、更改文本颜色和格式 动态设置字体粗体:QFont对象的setBold方法动态…

java第二十四课 —— super 关键字 | 方法重写

super 关键字 基本介绍 super 代表父类的引用,用于访问父类的属性、方法、构造器。 基本语法 访问父类的属性,但不能访问父类的 private 属性。 super.属性名; 访问父类的方法,不能访问父类的 private 方法。 super.方法名(参数列表); 访…

面试题——Redis

★1.简述一下缓存穿透,缓存击穿,缓存雪崩 ? 缓存穿透:大量恶意请求一个不存在的数据,使得压力绕过Redis缓存层打到数据库,造成数据库瘫痪 处理:①设置黑名单,维护一个可能存在也可能不存在的黑名单数据列表,对请求进行过滤(简单高效) ②布隆过滤器,会出现误删,且相对麻烦(不…

车载网络安全指南 生产、运行和服务阶段(九)

返回总目录->返回总目录<- 目录 一、现场检测 二、事件响应 三、事件跟踪管理 一、现场检测 具有联网功能的汽车电子产品宜具备网络安全监测能力。当汽车或相关基础设施被公众使用时,可实施现场监测,以便通过监测日常事件获得有关网络安全的威胁预警,根据预定程序…

【Qt 6.3基础教程 02】 Qt Creator入门与界面概览

文章目录 前言开始之前启动Qt Creator主要区域介绍 创建一个新项目界面概览菜单栏工具栏模式选择器编辑区项目管理区侧边栏底部面板 常用功能代码编写与自动补全UI设计构建与运行版本控制插件和扩展 总结 前言 Qt Creator是一个跨平台的集成开发环境&#xff08;IDE&#xff0…

数据仓库数据集成开源工具

数据集成是数据仓库建设的重要环节&#xff0c;开源工具在这一领域提供了许多强大的解决方案。以下是一些常见的开源数据集成工具&#xff0c;它们各自有独特的功能和特点&#xff1a; 1. Talend Open Studio for Data Integration 概述&#xff1a;Talend Open Studio 是一款…

C++设计模式---外观模式

1、介绍 外观模式&#xff08;Facade Pattern&#xff09;是一种结构型设计模式&#xff0c;它为子系统中的一组接口提供一个统一的、高层次的接口&#xff0c;使得子系统更容易使用。这种模式隐藏了子系统的复杂性&#xff0c;并为客户端提供了一个简单的接口。 外观模式的结…

node环境常见问题

文章目录 node运行环境常见问题1. node环境不支持ES6的import解决2. node版本太高&#xff0c;导致gitbook报错 node运行环境常见问题 1. node环境不支持ES6的import解决 在我学习ES6的import语法的时候&#xff0c;在自己电脑的node环境下模拟运行import&#xff0c;发现nod…

「C系列」C 位域

文章目录 一、C 位域位域的定义位域的使用注意事项位域示例代码 二、C 位域应用场景1. 访问硬件寄存器2. 节省内存空间3. 网络通信协议 三、相关链接 一、C 位域 在C语言中&#xff0c;位域&#xff08;bit-field&#xff09;是结构体&#xff08;struct&#xff09;中的一个特…

个人网站制作 Part 27 添加网站导航搜索功能 | Web开发项目添加页面缓存

文章目录 &#x1f680; 添加网站导航搜索功能&#x1f528;使用搜索服务&#x1f527;步骤 1: 选择搜索服务&#x1f527;步骤 2: 注册Algolia账户&#x1f527;步骤 3: 获取Algolia搜索配置 使用Vue.js&#x1f527;步骤 4: 安装Algolia搜索库&#x1f527;步骤 5: 创建搜索组…

C++中的指针和引用的区别

在C中&#xff0c;指针和引用都是用于间接访问内存位置的工具&#xff0c;但它们之间存在一些重要的区别。以下是它们之间的一些主要区别&#xff1a; 定义和初始化&#xff1a; 指针是一个变量&#xff0c;其值为另一个变量的地址。在定义指针时&#xff0c;需要为其指定类型。…

DNS域名解析----分离解析、多域名解析、父域与子域

1 理论部分 1.1 分离解析 DNS的分离解析&#xff0c;是指根据不同的客户端提供不同的域名解析记录。来自不同地址的客户机请求解析同一域名时&#xff0c;为其提供不同的解析结果。也就是内外网客户请求访问相同的域名时&#xff0c;能解析出不同的IP地址&#xff0c;实现负载…

Vue3 打包:优化与部署

Vue3 打包:优化与部署 Vue.js 是目前最流行的前端框架之一,以其轻量级、高性能和易用性著称。Vue3 是 Vue.js 的最新版本,带来了许多新特性和性能改进。在开发 Vue3 应用程序时,打包是一个关键步骤,它涉及到将源代码转换成可在浏览器中运行的代码。本文将详细介绍 Vue3 打…

【机器学习】机器学习中的人工神经元模型有哪些?

线性神经元 线性神经元&#xff08;Linear Neuron&#xff09;是一种基本的人工神经元模型&#xff0c;特点是其输出是输入的线性组合。线性神经元是神经网络中最简单的一种形式&#xff0c;适用于处理线性关系的问题。数学模型如下&#xff0c; y w ⋅ x b ∑ i 1 n w i x…

springboot原理篇-配置优先级

springboot原理篇-配置优先级&#xff08;一&#xff09; springboot项目一个支持三种配置文件 application.propertiesapplication.ymlapplication.yaml 其中&#xff0c;优先级的顺序是&#xff1a; application.properties > application.yml > application.yaml 也…

块级元素与行内元素详解

在网页设计与开发中&#xff0c;元素根据其在页面布局中的表现可分为两大类&#xff1a;块级元素&#xff08;Block-level Elements&#xff09;和行内元素&#xff08;Inline Elements&#xff09;。理解它们的特性和使用规则对于构建结构清晰、布局合理的网页至关重要。 块级…

MATLAB算法实战应用案例精讲-【数模应用】事后多重比较(附python、MATLAB和R语言代码实现)

目录 几个高频面试题目 事后检验,多重比较,简单效应分析有什么区别? 事后多重对比如何使用? 算法原理 SPSSAU 疑难解惑 提示‘数据质量异常’如何解决? 如何做Dunnett法事后多重比较? 方差分析事后多重比较提供‘字母标记法!’? 关于方差分析时的效应量? 字母…

HashMap详解(含动画演示)

目录 HashMap1、HashMap的继承体系2、HashMap底层数据结构3、HashMap的构造函数①、无参构造②、有参构造1 和 有参构造2 (可以自定义初始容量和负载因子)③、有参构造3(接受一个Map参数)JDK 8之前版本的哈希方法&#xff1a;JDK 8版本的哈希方法 4、拉链法解决哈希冲突什么是拉…

HTML动画效果技术指南:打造引人注目的网页悬浮体验

HTML动画效果技术指南&#xff1a;打造引人注目的网页悬浮体验 引言 在现代网页设计中&#xff0c;动画效果已经成为了提升用户体验和吸引用户注意力的重要手段。HTML、CSS和JavaScript的结合使用&#xff0c;使得开发者能够创造出丰富多彩的网页动画效果&#xff0c;其中悬浮…

Langchain的向量索引(3)

文章目录 前言一、 Chroma 的优点1. 易用性和集成&#xff1a;2. 内存管理&#xff1a;3. 功能丰富&#xff1a;4. 内置存储和检索优化&#xff1a; 二、 FAISS 的优点1. 高性能&#xff1a;2. **灵活性**&#xff1a;3. GPU 加速&#xff1a;4. 社区支持和文档&#xff1a; 三…