pathlib:面向对象的文件系统路径
pathlib官方介绍: Python3.4+内置的标准库,Object-oriented filesystem paths(面向对象的文件系统路径)
文章目录
- pathlib:面向对象的文件系统路径
- 1. 使用示例
- 1.1 最常用:获取项目目录
- 1.2 遍历一个目录下指定文件
- 1.3 递归目录下的所有文件
- 2. 优势对比
- 3. 基本介绍
- 4. 常见用法
- 5. 参考资料
1. 使用示例
1.1 最常用:获取项目目录
os.path方法
import os
project_dir = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))
print(project_dir) # /Users/root/Code/project
print(type(project_dir)) # <class 'str'>
pathlib方法
from pathlib import Path
project_dir = Path(__file__).resolve().parent.parent
print(project_dir) # /Users/root/Code/project
print(type(project_dir)) # <class 'pathlib.PosixPath'>
1.2 遍历一个目录下指定文件
os方法
file_list = []
for file in os.listdir(csv_dir):if not file.endswith('.csv'):continuefile_list.append(file)
pathlib方法
from pathlib import Path
csv_dir = Path(csv_dir)
file_list = csv_dir.glob('*.csv')
1.3 递归目录下的所有文件
os方法
os.walk方法
file_list = []
for root, dirs, files in os.walk('/Users/root/Code/project'):for f in files:if f.endswith('.py'):file_list.append(os.path.join(root, f))
# glob方法
from glob import glob
file_list = glob('/Users/root/Code/project/**/*.py', recursive=True)
pathlib方法
file_list = csv_dir.rglob('*.csv') # 生成器对象
2. 优势对比
1、当需要获取多个层级目录时,os.path需要使用嵌套的写法,而pathlib则是正常的链式调用。pathlib的使用更加友好,使得路径对象更加明确。
2、os.path只用于基本的路径处理,如果需要其他操作如重命名/新建/复制文件等,需要用os下的其他模块。而pathlib可以用于处理路径相关操作,并且是一个轻量级的库。
3、os.path操作的路径时字符串,而pathlib操作的路径时对象。提供了对资源路径和资源命名结构的通用抽象。它把文件系统接口从os模块中隔离出来,打开了从应用层配置文件系统的大门。
换句话说,pathlib.Path这个接口代表的可以不仅是os的资源路径,还可以是HDFS的资源路径,RESTful API的资源路径。
3. 基本介绍
1、官网上给出的该模块提供表示文件系统路径的类,如下,其语义适用于不同的操作系统,路径类被分为提供纯计算操作而没有 I/O 的纯路径,以及从纯路径继承而来但提供 I/O 操作的具体路径。一般情况下,直接使用Path即可。
2、Path属性
4. 常见用法
- 获取当前文件绝对路径
from pathlib import Path
path = Path(__file__).resolve()
path
>>> /Users/root/Code/project/conf/path_conf.py
- 获取当前文件的上级目录
from pathlib import Path
path = Path(__file__).resolve()
path.parent
>>> /Users/root/Code/project/conf
path.parent.parent
>>> /Users/root/Code/project
- 获取文件名
from pathlib import Path
path = Path(__file__).resolve()
path.name
>>> path_conf.py
path.stem
>>> path_conf
path.suffix
>>> .py
- 修改文件名,修改后缀
from pathlib import Path
file = Path('data.csv')
new_file = file.with_name('result.csv')
new_file = file.with_suffix('.txt')
- 路径拼接
from pathlib import Path
root = Path(__file__).resolve().parent
# 方式1
conf_file = root / 'conf/path_conf.py'
# 方式2
conf_file = root / Path('conf/path_conf.py')
# 方式3
conf_file = root.joinpath('conf/path_conf.py')
- 路径判断
from pathlib import Path
path = Path(__file__).resolve()
path.is_file() # 是否为文件
path.is_dir() # 是否为目录
path.exists() # 是否存在
- 文件操作
from pathlib import Path
file = Path(__file__).resolve()
file.touch() # 新建文件
file.replace('../data.csv') # 移动文件
file.unlink() # 删除文件
- 读取文件
file = Path('../data/1.csv')
data = file.read_text() # 读取文件
data = file.write_text() # 写入文件
# 也可以作为普通路径使用
with open(file, 'r') as f:data = f.read()
5. 参考资料
https://docs.python.org/zh-cn/3/library/pathlib.html
https://www.cnblogs.com/heniu/p/12872604.html
https://zhuanlan.zhihu.com/p/87940289
https://zhuanlan.zhihu.com/p/33524938
https://www.jianshu.com/p/a820038e65c3
https://cloud.tencent.com/developer/article/1640696