Python高效遍历文件和目录的方法

在 Python 中,遍历文件和目录可以使用 ospathlib 等模块。以下是一些高效遍历文件和目录的方法:

使用 os.walk()

os.walk() 是一个高效的递归遍历指定目录及其子目录的方法,返回一个生成器,生成一个三元组 (root, dirs, files)。这里 root 是当前目录的路径,dirs 是该目录下的子目录列表,files 是该目录下的文件列表。

import osdef traverse_directory(directory):for root, dirs, files in os.walk(directory):print(f"Current directory: {root}")print("Directories:")for d in dirs:print(os.path.join(root, d))print("Files:")for f in files:print(os.path.join(root, f))traverse_directory('.')

使用 pathlib.Path

.rglob('*')是 pathlib.Path中的一种方法,用于递归地匹配目录及其所有子目录中的所有文件和目录。它返回一个生成器,生成匹配的Path对象,适用于高效遍历文件系统。

以下是如何使用 `pathlib.Path` 和 `.rglob('*')` 方法的示例:

### 使用 `pathlib.Path.rglob('*')` 遍历目录和文件

from pathlib import Pathdef traverse_directory(directory):path = Path(directory)for item in path.rglob('*'):if item.is_dir():print(f"Directory: {item}")elif item.is_file():print(f"File: {item}")
# 调用函数遍历当前目录并处理文件
traverse_directory('.')

### .rglob('*') 的优点

1. **递归遍历**:rglob 会递归遍历目录及其所有子目录。
2. **简单语法**:使用 pathlib.Path 的方法,可以更简洁和面向对象地处理路径。
3. **跨平台**:pathlib提供了跨平台的路径操作,确保在不同操作系统上的兼容性。

进一步优化

如果需要对文件进行特定处理,可以在遍历过程中添加相应的逻辑:

from pathlib import Pathdef process_file(file_path):# 自定义处理逻辑print(f"Processing file: {file_path}")def traverse_directory(directory):path = Path(directory)for item in path.rglob('*'):if item.is_file():process_file(item)# 调用函数遍历当前目录并处理文件
traverse_directory('.')

这种方法使得代码更加模块化和可维护。你可以根据具体需求修改 process_file函数来处理文件,比如读取文件内容、过滤特定类型的文件、统计文件数量等。

示例:统计文件数量和目录数量

以下示例展示了如何使用 rglob 统计目录中所有文件和目录的数量:

from pathlib import Pathdef count_files_and_directories(directory):file_count = 0dir_count = 0path = Path(directory)for item in path.rglob('*'):if item.is_file():file_count += 1elif item.is_dir():dir_count += 1return file_count, dir_count# 调用函数并打印结果
file_count, dir_count = count_files_and_directories('.')
print(f"Total files: {file_count}")
print(f"Total directories: {dir_count}")

通过使用 pathlib.Path 和 .rglob('*'),你可以高效、简洁地遍历文件和目录,并进行各种操作和统计。

使用 os.listdir()

os.listdir() 函数返回指定目录下的所有文件和目录,但不会递归遍历子目录

import osdef traverse_directory(directory):for item in os.listdir(directory):full_path = os.path.join(directory, item)if os.path.isdir(full_path):print(f"Directory: {full_path}")elif os.path.isfile(full_path):print(f"File: {full_path}")traverse_directory('.')

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/21417.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Instruction-Tuningpromote tuning原理,对比区别

Instruction-Tuning 原理 Instruction-Tuning(指令调优)是一种通过对模型提供明确指令或任务描述,从而提升其在特定任务上的表现的技术。这种方法通过预先定义好的任务说明(instructions)对模型进行微调,使…

鸿蒙应用开发之OpenGL应用和X组件9

接着下来,我们来分析函数CreateProgram的实现,它是实现着色器程序的编译、加载和删除资源。 GLuint EGLCore::CreateProgram(const char *vertexShader, const char *fragShader) { if ((nullptr == vertexShader) || (nullptr == fragShader)) { OH_LOG_Print(L…

MySQL—函数—函数小结

一、引言 前面博客我们已经学完了MySQL的函数,下面快速的对MySQL的函数做一个小结。 在讲解了MySQL的函数的时候,主要有四个方面: 1、字符串函数 (1)CONCAT:字符串连接 (2)LOWER、…

Java 多线程创建:三种主要方法

多线程编程是Java中一个重要的技术点,它允许程序并行执行多个任务,从而提高程序的执行效率。本文将详细介绍在Java中创建多线程的三种主要方法:继承Thread类、实现Runnable接口以及使用Callable和Future接口。 1. 继承 Thread 类 继承Threa…

【前端每日基础】day34——HTTP和HTTPS

HTTP(Hypertext Transfer Protocol)和HTTPS(Hypertext Transfer Protocol Secure)是互联网通信协议,用于在Web浏览器和Web服务器之间传输数据。以下是对HTTP和HTTPS的详细介绍: HTTP(Hypertext…

Ubuntu server 24 (Linux) IPtables 双网卡 共享上网NAT 安装配置DHCP

一 开启路由转发功能 sudo vim /etc/sysctl.conf net.ipv4.ip_forward1 sudo sysctl -p 二 安装DHCP #更新软件包列表: sudo apt update #安装DHCP服务器 sudo apt install isc-dhcp-server #修改监听网卡,根据实际修改 sudo vi /etc/default/isc-dhcp-server …

配置 HTTP 代理 (HTTP proxy)

配置 HTTP 代理 [HTTP proxy] 1. Proxies2. curl2.1. Environment2.2. Proxy protocol prefixes 3. Use an HTTP proxy (使用 HTTP 代理)3.1. Using the examples (使用示例)3.1.1. Linux or macOS3.1.2. Windows Command Prompt 3.2. Authenticating to a proxy (向代理进行身…

Tailwindcss Layout布局相关样式及实战案例,5万字长文,附完整源码和效果截图

aspect 相关样式类 基础样式 ClassPropertiesaspect-autoaspect-ratio: auto;aspect-squareaspect-ratio: 1 / 1;aspect-videoaspect-ratio: 16 / 9; 案例:引入B站视频 Use the aspect-* utilities to set the desired aspect ratio of an element. 使用’ asp…

两款 IntelliJ IDEA 的 AI 编程插件

介绍两款 IntelliJ IDEA 的 AI 编程插件:通义灵码和 CodeGeeX。 通义灵码 这是由阿里推出的一个基于通义大模型的 AI 编码助手。 它提供了代码智能生成、研发智能问答等功能。通义灵码经过海量优秀开源代码数据训练,可以根据当前代码文件及跨文件的上下…

kafka-偏移量图解

生产者偏移量:生产者发送消息时写入到哪个位置(主题的每个分区会存储一个 leo 即将写入消息的偏移量),每次写完消息 leo 会 1 消费者偏移量:消费者从哪个位置开始消费消息,小于等于 leo,每个组…

数据赋能(107)——体系:数据采集——概述、关注焦点

概述 数据采集是指利用特定设备或技术,从原始数据源中捕获和记录数据的过程。 数据采集的主要目的是为了获取特定目标或现象的相关信息,以支持后续的数据分析、决策制定、业务优化等过程。 数据采集的重要性在于为企业和组织提供了关键的信息基础&…

【Qt】对话框

文章目录 1 :peach:对话框介绍:peach:2 :peach:对话框的分类:peach:2.1 :apple:模态对话框:apple:2.2 :apple:非模态对话框:apple:2.3 :apple:混合属性对话框:apple: 3 :peach:Qt 内置对话框:peach:3.1 :apple:消息对话框 QMessageBox:apple: 1 🍑对话框介绍&#x…

如何配置Oracle的ACL权限

配置Oracle的ACL(访问控制列表)权限是一个涉及多个步骤的过程。以下是一个清晰的步骤指南,用于配置Oracle的ACL权限: 1. 创建ACL 使用DBMS_NETWORK_ACL_ADMIN.CREATE_ACL过程来创建一个新的ACL。 sql BEGIN DBMS_NETWORK_ACL_…

pod 控制器介绍

一 pod 控制器相关理论介绍 1,Pod控制器 是什么 Pod控制器,又称之为工作负载(workload),是用于实现管理pod的中间层,确保pod资源符合预期的状态,pod的资源出现故障时,会尝试进行…

头歌springboot初体验

头歌(HeadGo)平台上的Spring Boot初体验课程为学习者提供了一个深入了解和实践Spring Boot 框架的机会。以下是对头歌Spring Boot初体验课程的清晰归纳和介绍: 1. 课程概述 目标:通过本课程,学习者将能够掌握Spring Boot的基础知识、核心特性和实践应用。 内容:课程内容…

[数据集][目标检测]水下管道泄漏破损检测数据集VOC+YOLO格式2069张2类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2069 标注数量(xml文件个数):2069 标注数量(txt文件个数):2069 标注…

【2024年5月备考新增】】 考前篇(30)《必备资料(13) - 论文串讲-干系人管理》

过程定义输入工具技术输出实际应用识别干系人识别能影响项目决策、 活动或结果的个人、 群体或组织,以及被 项目决策、活动或结 果所影响的个人、群 体或组织,并分析和 记录他们的相关信息 的过程1、项目章程2、立项管理文件 3、项目管理计划.沟通管理计划.干系人参与计划 4、…

时间序列的谱分解pt.2

16.dvi (berkeley.edu)https://www.stat.berkeley.edu/~bartlett/courses/153-fall2010/lectures/16.pdfpt1 时间序列的谱分解-CSDN博客

理解不同层的表示(layer representations)

在机器学习和深度学习领域,特别是在处理音频和自然语言处理(NLP)任务时,"层的表示"(layer representations)通常是指神经网络不同层在处理输入数据时生成的特征或嵌入。这些表示捕获了输入数据的…

PostgreSQL的视图pg_locks

PostgreSQL的视图pg_locks pg_locks 是 PostgreSQL 提供的系统视图,用于显示当前数据库中的锁信息。通过查询这个视图,数据库管理员可以监控锁的使用情况,识别潜在的锁争用和死锁问题,并优化数据库性能。 pg_locks 视图字段说明…