Python轮子:文件比较器——filecmp

原文链接:http://www.juzicode.com/python-module-filecmp

filecmp模块可以用来比较文件或者目录。

安装和导入

filecmp是Python自带的模块,不需要额外安装,直接导入即可:

import filecmp as fc
#或者
import filecmp

cmp()比较2个文件

直接调用cmp()函数就可以完成2个文件的比对。该函数接受3个入参,第1,2个入参是需要对比的2个文件路径,第3个入参shallow。如果shallow为True并且两个文件的os.stat()中的签名信息(文件类型、大小和修改时间)一致,则结果返回True。其他情况下如果文件大小或者文件内容不一样则结果返回False。

我们首先准备3个文件,分别为file-a.txt和它的拷贝file-a-copy.txt,以及file-b.txt,file-b.txt的内容和file-a.txt有差异。

#juzicode.com/VX公众号:juzicode
import filecmp as fcfn1 = 'file-a.txt'
fn2 = 'file-a-copy.txt'   # 文件内容和file-a.txt一模一样
fn3 = 'file-b.txt'        # 文件内容和file-a.txt有差异ret = fc.cmp(fn1,fn2)
print('文件%s 和文件%s 是否一样:'%(fn1,fn2), ret)ret = fc.cmp(fn1,fn3)
print('文件%s 和文件%s 是否一样:'%(fn1,fn3), ret)

运行结果:

文件file-a.txt 和文件file-a-copy.txt 是否一样: True
文件file-a.txt 和文件file-b.txt 是否一样: False

cmpfiles()比较2个目录

cmpfiles(dir1, dir2, common, shallow=True)

其中dir1和dir2确定要比较的2个目录中。

common指定名称的文件,可以是列表或者元组。

返回值为3个列表:match, mismatch, errors。其中match为匹配的文件; mismatch为不匹配的文件;errors 列出那些因为各种原因没有被比较的文件,比如文件不存在于两目录中的任一个、缺少读取它们的权限等等。

参数shallow含义和filecmp.cmp()一致。

例如,cmpfiles(‘dir-a’, ‘dir-b’, [‘c.txt’, ‘d/e.txt’,’f.txt’]) 将会比较dir-a/c.txt与dir-b/c.txt以及dir-a/d/e.txt与dir-b/d/e.txt、dir-a/f.txt与dir-b/f.txt 。’c.txt’、’d/e.txt’、’f.txt’ 将会出现在返回值的某一个列表中。

#juzicode.com/VX公众号:juzicode
import filecmp as fcdir1 = 'dir-a'  
dir2 = 'dir-b'match, mismatch, errors = fc.cmpfiles(dir1,dir2,['c.txt','d\\e.txt','f.txt'])
print('一样的文件:', match)
print('不同的文件:', mismatch)
print('未能比较的文件:', errors)

运行结果:

一样的文件: ['d\\e.txt']
不同的文件: ['f.txt']
未能比较的文件: ['c.txt']

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/867374.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ClickHouse中PRIMARY KEY和ORDER BY关键字的关系

在ClickHouse中,PRIMARY KEY和ORDER BY关键字在表的创建过程中扮演着重要的角色,它们共同决定了数据在物理存储上的排序方式,这对查询性能有着直接的影响。理解它们之间的关系对于设计高效的ClickHouse表结构至关重要。 ORDER BY ORDER BY定…

Lock4j简单的支持不同方案的高性能分布式锁实现及源码解析

文章目录 1.Lock4j是什么?1.1简介1.2项目地址1.3 我之前手写的分布式锁和限流的实现 2.特性3.如何使用3.1引入相关依赖3.2 配置redis或zookeeper3.3 使用方式3.3.1 注解式自动式3.3.2 手动式 4.源码解析4.1项目目录4.2实现思路 5.总结 1.Lock4j是什么? 1.1简介 lock4j是苞米…

昇思第6天

函数式自动微分 神经网络的训练主要使用反向传播算法,模型预测值(logits)与正确标签(label)送入损失函数(loss function)获得loss,然后进行反向传播计算,求得梯度&#…

【算法专题】双指针算法

1. 移动零 题目分析 对于这类数组分块的问题,我们应该首先想到用双指针的思路来进行处理,因为数组可以通过下标进行访问,所以说我们不用真的定义指针,用下标即可。比如本题就要求将数组划分为零区域和非零区域,我们不…

时序分析基本概念介绍——SI/crosstalk/delta delay/noise/timing Window

文章目录 前言一、Crosstalk1. Crosstalk Delay Effects2. Crosstalk Noise Effects 二、Crosstalk Analysis1. Crosstalk Delay Analysis2. Crosstalk Noise Analysis 三、如何 fix delta delay 和 noise violations1. 检查delta delay 和 noisedelta delay checknoise check …

【C语言小知识】缓冲区

缓冲区 当我们使用printf()将数据显示在屏幕上,或者使用scanf()函数将数据输入到电脑里,我们是否会产生些许疑问?为何输入的字符会直接显示到屏幕上等等。这里需要介绍一个C语言中的一个关键概念——缓冲区。 当我们使用老式系统进行运行代码…

suricata7 rule加载(一)加载 action

suricata7.0.5 一、前提条件 1.1 关键字注册 main | --> SuricataMain|--> PostConfLoadedSetup|--> SigTableSetupsigmatch_table是一个全局数组,每个元素就是一个关键字节点,是对关键字如何处理等相关回调函数。非常重要的一个结构&#x…

C语言牢大坠机

目录 开头程序程序的流程图《牢大坠机》&#xff08;视频正在审核中&#xff09;结尾 开头 大家好&#xff0c;我叫这是我58&#xff0c;今天&#xff0c;我们要来看关于牢大坠机的一些东西。 程序 #define _CRT_SECURE_NO_WARNINGS 1 #define HIGH 66 #include <stdio.h…

ubuntu防火墙指定端口开放设置

文章目录 打开某个端口查看防火墙状态和开放端口例子 在 Ubuntu 中管理防火墙通常使用 ufw&#xff08;Uncomplicated Firewall&#xff09;。以下是打开某个端口并查看防火墙状态的方法&#xff1a; 打开某个端口 启用 ufw&#xff08;如果尚未启用&#xff09;&#xff1a; …

PyCharm如何安装requirements.txt中的依赖包

问题&#xff1a;下载别人的源码&#xff0c;如何安装代码中requirement.txt中的依赖包。 解决方案&#xff1a; &#xff08;1&#xff09;打开PyCharm下面的Terminal&#xff0c;先为代码创建单独的虚拟环境并进入到虚拟环境中&#xff08;每个项目单独的环境&#xff0c;这…

GlusterFS分布式存储系统

GlusterFS分布式存储系统 一&#xff0c;分布式文件系统理论基础 1.1 分布式文件系统出现 计算机通过文件系统管理&#xff0c;存储数据&#xff0c;而现在数据信息爆炸的时代中人们可以获取的数据成指数倍的增长&#xff0c;单纯通过增加硬盘个数来扩展计算机文件系统的存储…

ubuntu的screen会话,断开远程连接也能照样运行程序

文章目录 创建新的 screen 会话管理 screen 会话例子关闭某一个 screen 会话删除某一个 screen 会话 在 Ubuntu 中使用 screen 工具可以创建和管理多个终端会话。以下是创建 screen 会话的方法&#xff1a; 创建新的 screen 会话 启动一个新的 screen 会话&#xff1a; screen…

Docker搭建MySQL双主复制详细教程

在此之前需要提前安装好Docker和 Docker Compose 。 一、创建目录 首先创建一个本地数据挂载目录。 mkdir -p master1-data master2-data二、编写docker-compose.yml version: 3.7services:mysql-master1:image: mysql:5.7.36container_name: mysql-master1environment:MYSQL_…

VBA初学:零件成本统计之四(汇总计算)

第四步&#xff0c;最后进行汇总计算 汇总统计的计算 Sub count() Dim rng As Range Dim i As Long, j As Long Dim arr_s, arr, brr, crr, drr Dim rowscount As Long Dim X As Variant Dim rg As Single, xb As Single, zj As SingleMsgBox "汇总计算时间较久&#xff…

【HTML入门】第二课 - head标签下的常见标签们

目录 1 本节概要 2 head下的常见标签 2.1 网页编码设置 2.2 网页的标题 2.3 样式标签 3 head标签的内容不会显示到网页上 4 查看网页源代码 1 本节概要 上一节&#xff0c;我们说了HTML网页最基本的框架标签&#xff0c;说到标签分为head头部和body身体部分。这一小节呢…

sqlite3数据库常用的API接口

使用sqlite3的API接口 需要加头文件 #include 编译时&#xff0c;需要连接sqlite3的库 -lsqlite3 1.打开数据库文件的函数int sqlite3_open(const char *filename, /* Database filename (UTF-8) */sqlite3 **ppDb /* OUT: SQLite db handle */ );功能&#xff1…

Windows Server 2016 搭建 网络负载平衡 服务

网络负载平衡功能的安装 添加角色 默认不动————功能 勾选上 < 网络负载平衡 > 在工具中————打开 < 网络负载平衡管理器 > 网络负载平衡群集创建 注意 : 提前 将两台 web 站点服务器 都安装好 < 网络负载平衡功能 > 右键 选择 ————新建群集 ——…

5、RDB与AOF对比

RDB与AOF对比 1、RDB优势与不足 1.1、优势 RDB文件小 数据恢复快 1.2、不足 数据安全性较差写时复制技术会减低性能可读性较差 2、AOF优势与不足 2.1、优势 数据安全性高可读性高 2.2、不足 数据恢复较慢AOF文件较大写操作会影响性能 3、执行化技术的选型 官方推荐…

刷题——二叉搜索书的最近公共祖先

二叉搜索树的最近公共祖先_牛客题霸_牛客网 vector<int>getPath(TreeNode* root, int target) {TreeNode* node root;vector<int>path;while(node->val ! target){path.push_back(node->val);if(target < node->val)node node->left;elsenode n…

【学习笔记】爱立信SPO 1400 CRAFT软件基础知识6——配置的备份与恢复的详细方法

一、前期准备 提示&#xff1a;下面所有学习内容都是基于以下条件完成的 条件1.已经正确安装并正常运行SPO 1400 CRAFT软件&#xff08;以下简称LCT&#xff09; 条件2.确认已正确使用爱立信SPO 1400 CRAFT软件通过网络登录设备&#xff08;以下简称NE&#xff09; 具体登录…