【Python】【os.path】【pathlib】告别os.path,拥抱pathlib

目录

1. os.path VS pathlib

1.1. 路径规范化

1.2. 字符串和对象

1.3. 读写文件

2. pathlib的性能

3. 总结


pathlib 模块是在Python3.4版本中首次被引入到标准库中的,作为一个可选模块。
Python3.6开始,内置的 open 函数以及 os 、 shutil 和 os.path 模块中的各种函数都可以正确地使用 pathlib.Path 对象了。

 最初,pathlib给人的感觉只是os.path的一个不必要的面向对象版本,
不过,当你实际去了解pathlib之后,会发现pathlib实际上绝不是一个简单的面向对象版本,
而是实实在在的解决了os.path存在的一些问题。

1. os.path VS pathlib

1.1. 路径规范化

对于os.path来说,路径的分隔用正斜杆\)还是反斜杠/)需要自己根据操作系统来确定。
或者,每一个路径拼接的地方,都用os.path.join来连接。
而使用pathlib的话,直接用反斜杠/)即可,不用担心操作系统的不同。

比如:

import os# windows系统中测试os.path.join("a/b", "c.txt")
# 运行结果 错误
# 'a/b\\c.txt'os.path.join("a", "b", "c.txt")
# 运行结果 正确
# 'a\\b\\c.txt'

从代码可以看出,每一层文件夹都必须用join连接才能正确适应不同系统。
而在pathlib中,则不需要考虑这么多。

from pathlib import PathPath("a/b").joinpath("c.txt")
# WindowsPath('a/b/c.txt')Path("a").joinpath("b").joinpath("c.txt")
# WindowsPath('a/b/c.txt')

使用pathlib,在windows或者linux中,统一使用反斜杠/)来分隔文件夹。

路径规范化之后的好处就是代码更加简洁。
比如:下面这个重命名文件的例子(a/b/c/d.csv => a/b/c.csv

# os.path 方式
os.rename(os.path.join("a", "b", "c", "d.csv"), os.path.join("a", "b", "c.csv"))# pathlib 方式
Path("a/b/c/d.csv").reanme("a/b/c.csv")

哪种方式更清晰简洁不言而喻。

1.2. 字符串和对象

为什么要用对象来表示路径?

先看下面3个字符串变量:

student = '{"name": "databook", "score": "90"}'
graduate_date = "2023-07-01"
home_directory = '/home/databook'

这3个字符串其实代表不同的事物:一种是 JSON blob,一种是日期,一种是文件路径。

再看下面3个用对象表示的变量:

from datetime import date
from pathlib import Pathstudent = {"name": "databook", "score": "90"}
graduate_date = date(2023, 7, 1)
home_directory = Path('/home/databook')

用字符串来表示变量确实简洁,但也导致每个变量失去了其本身的意义,
程序无法区分这个变量代表的是JSON,还是日期,还是一个路径,从而增加了程序的不确定性。
程序规模大了,或者复杂性提高了之后,存在很大的隐患。

os.path和pathlib就是这样的关系,os.path使用字符串表示路径,pathlib使用Path对象表示路径。

1.3. 读写文件


pathlib的路径对象(Path)可以直接读写文件,因此也能大大简化读写文件的代码。

不用pathlib的读写文件方式

import os# 读取文件
fp = os.path.join("a", "b.txt")
with open(fp, "r") as f:f.read()# 写入文件
with open(fp, "w") as f:f.write("hello")

使用pathlib的话:

from pathlib import Path# 读取文件
Path("a/b.txt").read_text()# 写入文件
Path("a/b.txt").write_text("hello)

2. pathlib的性能

pathlib用面向对象的方式处理路径,难免让人觉得会比传统的方式慢很多,也就是存在性能问题。
那么,pathlib到底会比传统方式慢多少?通过下面的简单示例来看看。

传统方式:

def a(d="D:/miniconda3/Lib/site-packages"):from os import getcwd, walkextension = ".py"count = 0for root, directories, filenames in walk(d):for filename in filenames:if filename.endswith(extension):count += 1print(f"{count} Python files found")if __name__ == "__main__":import timet0 = time.time()a()t1 = time.time()print(t1 - t0)# 运行结果:
7875 Python files found
0.31201744079589844

pathlib方式:

def b(d="D:/miniconda3/Lib/site-packages"):from pathlib import Pathextension = ".py"count = 0for filename in Path(d).rglob(f"*{extension}"):count += 1print(f"{count} Python files found")if __name__ == "__main__":import timet0 = time.time()b()t1 = time.time()print(t1 - t0)# 运行结果:
7875 Python files found
0.44898128509521484

读取的标准库中的文件,总共将近8000个文件,运行多次后,时间大概相差0.1秒左右。
pathlib的性能确实略逊于传统方式,但是将近8000个文件,也只慢了0.1秒
如果不是大规模处理文件的话,还是用pathlib更好。

3. 总结

        总的来说,与传统的 os.path 模块相比,pathlib 提供了一种更现代和面向对象的方式来处理文件路径。它支持跨平台的文件路径操作,使得开发者可以更容易地编写可移植的代码。此外,pathlib 还提供了链式调用的能力,使得代码更加简洁和易读。

        因此,为了代码更加简洁、易读和可维护,推荐使用 pathlib 来替代传统的 os.path

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/745927.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

环境安装篇 之 Kind 搭建 kubernetes 测试集群

云原生学习路线导航页(持续更新中) 本文是 环境安装 系列文章,介绍 使用Kind工具 快速安装 kubernetes 测试集群的详细步骤 1.Kind简介 Kind 是一个使用 Docker 容器“节点”运行本地 Kubernetes 集群的工具。Kind 主要用于测试kubernetes本…

微博热搜榜单采集,微博热搜榜单爬虫,微博热搜榜单解析,完整代码(话题榜+热搜榜+文娱榜和要闻榜)

文章目录 代码1. 话题榜2. 热搜榜3. 文娱榜和要闻榜 过程1. 话题榜2. 热搜榜3. 文娱榜和要闻榜 代码 1. 话题榜 import requests import pandas as pd import urllib from urllib import parse headers { authority: weibo.com, accept: application/json, text/pl…

win10磁盘删除卷里面数据怎么恢复 win10磁盘删除卷怎么恢复

大家好,我是你们的小助手,今天我们来聊一下一个非常重要的话题——win10磁盘删除卷里面数据怎么恢复?相信很多小伙伴都曾经遇到过这种情况,不小心把重要的文件删掉了,或者格式化了整个磁盘,导致数据丢失。那…

【华为OD机试】CPU 算力分配【C卷|100分】

【华为OD机试】-真题 !!点这里!! 【华为OD机试】真题考点分类 !!点这里 !! 题目描述 现有两组服务器A和B,每组有多个算力不同的CPU,其中 A[i] 是 A 组第 i 个CPU的运算能力, B[i] 是 B组 第 i 个CPU的运算能力。 一组服务器的总算力是各CPU的算力之和。 为了让两组服务器…

LeetCode350:两个数组的交集Ⅱ

题目描述 给你两个整数数组 nums1 和 nums2 ,请你以数组形式返回两数组的交集。返回结果中每个元素出现的次数,应与元素在两个数组中都出现的次数一致(如果出现次数不一致,则考虑取较小值)。可以不考虑输出结果的顺序。…

Halcon中的交集、补集、全选和反选等操作

1、交集:两个ROI相交的部分 dev_open_window (0, 0, 512, 512, black, WindowHandle) gen_circle (ROI_0, 65, 150, 43) gen_circle (ROI_1, 155, 180, 63) * 交集:两个ROI相交的部分 intersection (ROI_0, ROI_1, RegionIntersection) dev_set_color (…

ResNet学习笔记

一、residual结构 优点: (1)超深的网络结构(突破1000层) (2)提出residual模块 (3)使用Batch Normalization加速训练(丢弃dropout) 解决问题: (1) 梯度消失和…

基于springboot+vue的企业人事管理系统

一、系统架构 前端:vue | element-ui 后端:springboot | mybatis-plus 环境:jdk1.8 | mysql | maven | node14 | redis 二、代码及数据库 三、功能介绍 01. 登录页 02. 首页 03. 员工入职 04. 部门员工管理-部门管理 05. 部门…

聚观早报 | 阿里巴巴计划投资韩国;魏牌蓝山新车型曝光

聚观早报每日整理最值得关注的行业重点事件,帮助大家及时了解最新行业动态,每日读报,就读聚观365资讯简报。 整理丨Cutie 3月15日消息 阿里巴巴计划投资韩国 魏牌蓝山新车型曝光 蔚来提出长寿命电池解决方案 OpenAI与多家出版商合作 零…

《计算机网络》复试问答题总结

简述交换机工作原理?: 交换机工作在数据链路层,相当于一个多端口的网桥,它允许端口之间建立多个并发连接,实现多个结点之间的并发传输。 TCP/IP的核心思想是什么: ​ TCP/IP即传输控制协议/网际协议——指…

Python之Web开发中级教程----创建Django项目

Python之Web开发中级教程----创建Django项目 使用虚拟环境: Workon py3_django3 1.创建Django项目 django-admin startproject name 例:git的本地仓库下新建studentmanager的项目 cd /home/go/work/gtest/ django-admin startproject bookmanager 新…

Qt+FFmpeg+opengl从零制作视频播放器-3.解封装

解封装:如下图所示,就是将FLV、MKV、MP4等文件解封装为视频H.264或H.265压缩数据,音频MP3或AAC的压缩数据,下图为常用的基本操作。 ffmpeg使用解封装的基本流程如下: 在使用FFmpeg API之前,需要先注册API&a…

福派斯猫粮的适口性有何特点?

亲爱的朋友们,今天我想和大家分享一下福派斯猫粮的适口性特点。作为一位养猫多年的铲屎官,我深知猫粮的适口性对于猫咪的健康和幸福是多么重要。那么,福派斯猫粮在这方面究竟有何独到之处呢? 1️⃣ 首先,福派斯猫粮的口…

第2周 Python列表、元组刷题

第2周 Python列表、元组刷题 单击题目,直接跳转到页面刷题,一周后公布答案。 1.B2124:判断字符串是否为回文 2. P1427:小鱼的数字游戏 3. B2057:最高的分数 4. B2055:均值 5. B2056:求整数的和…

【Java多线程】关于多线程的一些案例 —— 单例模式中的饿汉模式和懒汉模式以及阻塞队列

目录 1、单例模式 1.1、饿汉模式 2.1、懒汉模式 2、阻塞队列 2.1、BlockingQueue 阻塞队列数据结构 1、单例模式 对框架和设计模式的简单理解就是,这两者都是“大佬”设计出来的,让即使是一个代码写的不太好的“菜鸡程序员”也能写出还可以的代码…

全球化服务能力,助力企业拓展海外市场,仓储物流行业解决方案

随着全球化的加速推进,越来越多的企业开始将目光投向海外市场,寻求更广阔的发展空间。然而,海外市场的拓展并非易事,需要企业具备强大的全球化服务能力。作为通信行业的领军企业,中国联通凭借其强大的网络资源和技术实…

基于SCIP的约束处理器Conshdlr添加惰性约束——以TSP问题为例

文章目录 1. TSP案例引入2. 考虑惰性约束的求解效率对比2.1 求解基础TSP模型2.2 基于SCIP的Conshdlr添加惰性约束1. TSP案例引入 在运筹学建模和求解过程中,“lazy constraints”(惰性约束)是一种动态添加约束的策略,松弛部分约束后求解得到的“可行解”,不断地进行可行性…

求职分享123

阿里学长 简历:github上找,填信息 项目: 1. 教研室项目 2. github上下载项目下来做 3. 对于项目,要把个人工作详细地准备下来。 4. 给面试官挖坑。 5. 企业实习是巨大的加分项。 知识储备 刷题 不卷,leetcod…

同步和异步程序的关联和区别是?Guide to Synchronous and Asynchronous Code

2024/3/12 发布 正在寻觅一份前端开发工作,如果您觉得这篇文章对你有所帮助,这是我的简历1 在这篇文章中你能学习和理解:NodeJS是如何工作、如何处理所有发送给服务器的函数(无论同步或者异步)和请求、Event Loops in …

rk36566 uboot - dm 模型数据结构与常见接口

文章目录 一、数据结构1、udevice2、driver3、uclass4、uclass\_driver5、 总结6、device\_probe 二、常用接口1、udevice 创建接口1) device_bind_with_driver_data2) device_bind3) device_bind_by_name 2、uclass 操作函数1) uclass_get2) uclass_get_name3) uclass_find_de…