Linux 的 diff 命令

 

读懂 diff:http://www.ruanyifeng.com/blog/2012/08/how_to_read_diff.html

菜鸟教程:https://www.runoob.com/linux/linux-comm-diff.html
diff 命令详解:https://www.cnblogs.com/wf-linux/p/9488257.html
http://man.linuxde.net/diff
https://www.cnblogs.com/everest33Tong/p/6868654.html

 

Linux diff (diff different 简写)命令用于比较文件的差异。

diff 以逐行的方式,比较文本文件的异同处。如果指定要比较目录,则diff会比较目录中相同文件名的文件,但不会比较其中子目录

 

diff file_1 file_2  diff 就会告诉你,这两个文件有何差异。它的显示结果不太好懂,下面我就来说明,如何读懂diff。

 

参数:

-<行数>:指定要显示多少行的文本。此参数必须与-c或-u参数一并使用;
-a或--text:diff预设只会逐行比较文本文件;
-b或--ignore-space-change:不检查空格字符的不同;
-B或--ignore-blank-lines:不检查空白行;
-c:显示全部内容,并标出不同之处;
-C<行数>或--context<行数>:与执行“-c-<行数>”指令相同;
-d或--minimal:使用不同的演算法,以小的单位来做比较;
-D<巨集名称>或ifdef<巨集名称>:此参数的输出格式可用于前置处理器巨集;
-e或--ed:此参数的输出格式可用于ed的script文件;
-f或-forward-ed:输出的格式类似ed的script文件,但按照原来文件的顺序来显示不同处;
-H或--speed-large-files:比较大文件时,可加快速度;
-l<字符或字符串>或--ignore-matching-lines<字符或字符串>:若两个文件在某几行有所不同,而之际航同时都包含了选项中指定的字符或字符串,则不显示这两个文件的差异;
-i或--ignore-case:不检查大小写的不同;
-l或--paginate:将结果交由pr程序来分页;
-n或--rcs:将比较结果以RCS的格式来显示;
-N或--new-file:在比较目录时,若文件A仅出现在某个目录中,预设会显示:Only in目录,文件A 若使用-N参数,则diff会将文件A 与一个空白的文件比较;
-p:若比较的文件为C语言的程序码文件时,显示差异所在的函数名称;
-P或--unidirectional-new-file:与-N类似,但只有当第二个目录包含了第一个目录所没有的文件时,才会将这个文件与空白的文件做比较;
-q或--brief:仅显示有无差异,不显示详细的信息;
-r或--recursive:比较子目录中的文件;
-s或--report-identical-files:若没有发现任何差异,仍然显示信息;
-S<文件>或--starting-file<文件>:在比较目录时,从指定的文件开始比较;
-t或--expand-tabs:在输出时,将tab字符展开;
-T或--initial-tab:在每行前面加上tab字符以便对齐;
-u,-U<列数>或--unified=<列数>:以合并的方式来显示文件内容的不同;
-v或--version:显示版本信息;
-w或--ignore-all-space:忽略全部的空格字符;
-W<宽度>或--width<宽度>:在使用-y参数时,指定栏宽;
-x<文件名或目录>或--exclude<文件名或目录>:不比较选项中所指定的文件或目录;
-X<文件>或--exclude-from<文件>;您可以将文件或目录类型存成文本文件,然后在=<文件>中指定此文本文件;
-y或--side-by-side:以并列的方式显示文件的异同之处;
--help:显示帮助;
--left-column:在使用-y参数时,若两个文件某一行内容相同,则仅在左侧的栏位显示该行内容;
--suppress-common-lines:在使用-y参数时,仅显示不同之处。

 

 

diff 的 三种格式

 

由于历史原因,diff 有三种格式:

  1. 正常格式(normal diff)
  2. 上下文格式(context diff)
  3. 合并格式(unified diff)

我们依次来看。

 

 

示例文件

 

为了便于讲解,先新建两个示例文件。

第一个文件叫做 f1,内容是每行一个 a,一共 7 行。

a
a
a
a
a
a
a

第二个文件叫做 f2,修改 f1 而成,第 4 行变成 hello,其他不变

a
a
a
hello
a
a
a

 

 

正常格式的 diff

 

diff命令的Normal模式,这也是diff命令的默认模式,也就是说diff两个文件的时候如果不加模式参数则是默认模式进行比较,其效果与(--normal)一样,我们举一些例子来说明Normal模式下的输出结果(前面已经说明了一种比较结果),为了直观查看两个文件的不同我在windows下面通过BeyondCompare工具列出两个文件的不同,而截图下面的黑色部分则是diff的比较输出截图。

第一个文件比第二个文件少了行的情况:

第一个文件比第二个文件多出行的情况:

2

第一个文件与第二个文件不相同的情况:

3

以上 diff 命令执行的时候没有指定额外的模式参数,所以其使用的是默认的 Normal 模式,效果与添加命令行参数 --normal 是一样的。

 

使用示例分析

现在对 f1 和 f2 进行比较:$ diff f1 f2

这时,diff 就会显示正常格式的结果:

  4c4< a---> hello
  1. 第一行:4c4  是一个提示,用来说明变动位置。4c4 分成 三个部分:前面的"4",表示 f1 的第 4 行有变化;中间的 "c" 表示变动的模式是内容改变(change),其他模式还有"增加"(a,代表addition)和"删除"(d,代表deletion);后面的"4",表示变动后变成 f2 的第 4 行。
  2. 第二行:< a  分成两个部分。< a:前面的 小于号,表示要从 f1 当中去除该行(也就是第 4 行),后面的 "a" 表示该行的内容。
  3. 第三行:--- 用来分割 f1 和 f2。
  4. 第四行:> b  类似于第二行。> b :前面的 大于号 表示 f2 增加了该行,后面的 "hello" 表示该行的内容。最早的Unix(即AT&T版本的Unix),使用的就是这种格式的diff。

 

 

上下文格式的 diff :Context 模式

 

上个世纪80年代初,加州大学伯克利分校推出 BSD版本的 Unix 时,觉得 diff 的显示结果太简单,最好加入上下文,便于了解发生的变动。因此,推出了上下文格式的 diff。

默认情况下的模式输出结果实际上是符合计算机的思维方式,不太直观,所以其输出结果并不能够很好的被人理解,diff命令除了默认模式之外还提供了另外两种模式,Context 和 Unified 模式。

diff 命令应用 Context 模式只需要添加命令行参数 diff -c  即可,我们先看看两个案例文件:

33

接下来说明这两个文件以diff  -c 方式比较的结果:

3

 

使用示例分析

上下文模式 使用方法加入 c 参数(代表context):$ diff -c f1 f2

显示结果如下:

$ diff -c f1 f2
*** f1	2019-05-20 14:22:15.111801433 +0800
--- f2	2019-05-20 14:22:27.401207382 +0800
***************
*** 1,7 ****aaa
! aaaa
--- 1,7 ----aaa
! helloaaa

这个结果分成四个部分。

  1. 第一部分的两行,显示两个文件的基本情况:文件名和时间信息。
            *** f1    2019-05-20 14:22:15.111801433 +0800
            --- f2    2019-05-20 14:22:27.401207382 +0800
    提示:"***" 表示变动前的文件"---" 表示变动后的文件。
  2. 第二部分是15个星号,将文件的基本情况与变动内容分割开。
    ***************
  3. 第三部分显示变动前的文件,即 f1。

      *** 1,7 ****
       a
       a
       a
      !a
       a
       a
       a

    这时不仅显示发生变化的第 4 行,还显示第 4 行的前面三行和后面三行,因此一共显示7行。所以,前面的"*** 1,7 ****"就表示,从第 1 行开始连续 7 行。

    另外,文件内容的每一行最前面,还有一个标记位。
    如果为空,表示该行无变化;
    如果是感叹号(!),表示该行有改动;
    如果是减号(-),表示该行被删除;
    如果是加号(+),表示该行为新增。

  4. 第四部分显示变动后的文件,即f2。
      --- 1,7 ----
       a
       a
       a
      !hello
       a
       a
       a
    除了变动行(第4行)以外,也是上下文各显示三行,总共显示7行。

 

 

合并格式的 diff:也即 Unified 模式

 

如果两个文件相似度很高,那么上下文格式的 diff,将显示大量重复的内容,很浪费空间。1990年,GNU diff 率先推出了"合并格式"的 diff,将 f1 和 f2 的上下文合并在一起显示。

diff 还有一种比较方式,也即 Unified 模式,使用命令行 –u 来执行该模式的比较。其比较结果与Context模式很像,但是简化了一些输出,我们看看我们的案例文件,与上面的一样:

3

使用diff –u 比较的结果:

3

可以看到其比较结果与Context模式实际上差不多,只不过将比较结果合并到一起了

 

使用示例分析

加入u参数(代表unified):$ diff -u f1 f2

显示结果如下:

$ diff -u f1 f2
--- f1	2019-05-20 14:22:15.111801433 +0800
+++ f2	2019-05-20 14:22:27.401207382 +0800
@@ -1,7 +1,7 @@aaa
-a
+helloaaa

第一部分,也是文件的基本信息。
            --- f1    2019-05-20 14:22:15.111801433 +0800
            +++ f2    2019-05-20 14:22:27.401207382 +0800
            "---"表示变动前的文件,"+++"表示变动后的文件。

第二部分,变动的位置用两个@作为起首和结束。
            @@ -1,7 +1,7 @@
            前面的"-1,7"分成三个部分:减号表示第一个文件(即f1),"1"表示第1行,"7"表示连续7行。合在一起,就表示下面是第一个文件从第1行开始的连续7行。
            同样的,"+1,7"表示变动后,成为第二个文件从第1行开始的连续7行。

第三部分,是变动的具体内容。
   a
   a
   a
  -a
  +hello
   a
   a
   a

除了有变动的那些行以外,也是上下文各显示3行。它将两个文件的上下文,合并显示在一起,所以叫做"合并格式"。
每一行最前面的标志位,空表示无变动,减号表示第一个文件删除的行,加号表示第二个文件新增的行。

 

 

git 格式的 diff

 

版本管理系统git,使用的是合并格式 diff 的变体:$ git diff

显示结果如下:

        diff --git a/f1 b/f1index 6f8a38c..3235643 100644--- a/f1+++ b/f1@@ -1,7 +1,7 @@aaa-a+helloaaa

第一行 表示结果为 git 格式的diff。
    diff --git a/f1 b/f1
    进行比较的是,a版本的f1(即变动前)和b版本的f1(即变动后)。

第二行 表示两个版本的 git 哈希值(index区域的6f8a38c对象,与工作目录区域的449b072对象进行比较),最后的六位数字是对象的模式(普通文件,644权限)。
    index 6f8a38c..449b072 100644

第三行 表示进行比较的两个文件。
  --- a/f1
  +++ b/f1

"---"表示变动前的版本,"+++"表示变动后的版本。

后面的行都与官方的合并格式diff相同。

  @@ -1,7 +1,7 @@
   a
   a
   a
  -a
  +hello
   a
   a
   a

 

 

比较目录

 

使用diff可以比较两个目录,其比较格式是  diff  directory1  directory2 查看如下目录比较结果:

3

比较两个目录的时候无非是有的文件仅仅存在于某个目录中而在另一个目录中没有,如果存在同名的文件,则比较这两个文件的不同。diff比较目录的结果我们可以结合grep命令筛选出我们想要的输出,例如仅仅输出两个目录下不同的文件而忽略掉某一个目录独有另一个目录不存在的输出记录

 

 

 

实例1:比较两个文件

[root@localhost test3]# diff log2014.log log2013.log 
3c3
< 2014-03
---
> 2013-03
8c8
< 2013-07
---
> 2013-08
11,12d10
< 2013-11
< 2013-12

上面的"3c3"和"8c8"表示log2014.log和log20143log文件在3行和第8行内容有所不同;"11,12d10"表示第一个文件比第二个文件多了第11和12行。

 

实例2:并排格式输出

[root@localhost test3]# diff log2014.log log2013.log  -y -W 50
2013-01                 2013-01
2013-02                 2013-02
2014-03               | 2013-03
2013-04                 2013-04
2013-05                 2013-05
2013-06                 2013-06
2013-07                 2013-07
2013-07               | 2013-08
2013-09                 2013-09
2013-10                 2013-10
2013-11               <
2013-12               <
[root@localhost test3]# diff log2013.log log2014.log  -y -W 50
2013-01                 2013-01
2013-02                 2013-02
2013-03               | 2014-03
2013-04                 2013-04
2013-05                 2013-05
2013-06                 2013-06
2013-07                 2013-07
2013-08               | 2013-07
2013-09                 2013-09
2013-10                 2013-10> 2013-11> 2013-12

说明:

  • "|"表示前后2个文件内容有不同
  • "<"表示后面文件比前面文件少了1行内容
  • ">"表示后面文件比前面文件多了1行内容

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/495844.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器人大潮中暗藏多少伪命题

来源&#xff1a;中国青年报摘要&#xff1a;伴随着巨大的产业浪潮&#xff0c;一种担忧在人群中弥漫&#xff0c;即机器人的“步伐”如此之快&#xff0c;未来究竟会否抢走人类的饭碗&#xff0c;和人类之间爆发一场就业战争&#xff0c;进而夺走人类的一切&#xff1f;2018 R…

哈佛医学院解析:触发医学深度学习系统受到「对抗攻击」的诱因有哪些?

原文来源&#xff1a;arXiv作者&#xff1a;Samuel G. Finlayson、Isaac S. Kohane、Andrew L. Beam「雷克世界」编译&#xff1a;EVA对抗样本的发现引起了人们对深度学习系统的实际部署的关注。在本文中&#xff0c;我们认为&#xff0c;就货币激励和技术脆弱性&#xff08;mo…

Git 详解 和 廖雪峰 Git 教程

转载&#xff1a;廖雪峰 git 教程&#xff1a;https://www.liaoxuefeng.com/wiki/896043488029600 GitHub 秘籍&#xff1a;https://github.com/tiimgreen/github-cheat-sheet/blob/master/README.zh-cn.md Git Community Book 中文版&#xff1a;http://gitbook.liuhui998.c…

ASP.NET MVC: 构建不带 Web 窗体的 Web 应用程序(转载)

我 从事专业开发迄今为止已有 15 年&#xff0c;在此之前&#xff0c;我利用业余时间从事开发至少也有 10 年了。与我这一代的大多数人一样&#xff0c;我是从 8 位计算机起步&#xff0c;然后转用 PC 平台的。随着计算机的复杂性日益增加&#xff0c;我编写的应用程序涵盖了从…

2018人工智能前沿报告:深度学习的应用和价值

来源&#xff1a; 199IT互联网数据中心摘要&#xff1a;报告重点强调了前沿AI技术的应用范围之广&#xff0c;以及经济潜力之盛&#xff0c;也提到了发展中的一些局限和挑战。报告包含400个应用案例&#xff0c;横跨19个行业的9种业务功能。报告重点强调了前沿AI技术的应用范围…

跟我学Telerik公司的RadControls控件(四)

朋友们、同行们通过前面《跟我学Telerik公司的RadControls控件》系列三篇的学习&#xff0c;你一定会内心有一种涌动&#xff0c;有种相见&#xff08;RadControls&#xff09;恨晚的感觉。那就和晓军一起加入学习RadControls控件的行列&#xff0c;为IT的朋友提供更加明了化的…

puppeteer( Nodejs 版 selenium )快速入门

From&#xff1a;https://www.cnblogs.com/CyLee/p/9310839.html puppeteer 官网&#xff1a;https://pptr.dev/ Puppeteer 中文文档 &#xff08;与官方同步更新&#xff09;&#xff1a;https://segmentfault.com/a/1190000015913821 Puppeteer 中文文档 &#xff1a;https…

硅谷人眼中的2018年十大前沿科技预测

来源&#xff1a; 和米资本近日&#xff0c;由斯坦福大学的顶级学术研究团队、美国国防部高级研究计划局、硅谷最具创新力和影响力的创业公司以及和米资本一起精心策划&#xff0c;共同探讨技术将如何重新塑造行业和社会等问题&#xff0c;分析预测了2018年全球十大前沿科技的未…

麦肯锡AI应用报告:深度学习是蓝海还是深坑?

来源&#xff1a;网络大数据AI的价值并不在模型自身&#xff0c;而在于公司怎样用好它们。麦肯锡出品&#xff0c;一份深度学习领域的分析报告&#xff0c;包含400个应用案例&#xff0c;横跨19个行业的9种业务功能。报告重点强调了前沿AI技术的应用范围之广&#xff0c;以及经…

pyppeteer:比 selenium 更高效的爬虫利器

API 接口文档&#xff1a;API Reference&#xff1a;https://miyakogi.github.io/pyppeteer/reference.html pyppeteer github 地址&#xff1a;https://github.com/miyakogi/pyppeteer pyppeteer 英文文档地址&#xff1a;https://miyakogi.github.io/pyppeteer/ pyppeteer…

全球机器学习领域顶尖的16家公司

来源&#xff1a;网络大数据 作者&#xff1a;Andy Patrizio摘要&#xff1a;机器学习是众多公司颇感兴趣的一个新兴领域。本文介绍了几大领先的机器学习公司&#xff0c;包括老牌技术厂商和后起之秀。机器学习是与人工智能一同急剧发展的领域。IDC预测&#xff0c;人工智能和…

突破淘宝对于 selenium 检测

From&#xff1a;https://blog.csdn.net/qq_42196922/article/details/89400988 多加一行代码&#xff0c;突破淘宝模拟登录滑块&#xff1a;http://www.imooc.com/article/285729 爬虫自动化&#xff1a;https://www.jianshu.com/p/b3b92f327374 selenium 跳过 webdriver 检…

18年你需要了解的15个人工智能统计数据

来源&#xff1a;网络大数据人工智能(AI)每天都在以惊人的速度增长&#xff0c;并且与此同时&#xff0c;围绕着各行业的统计数据也在发生变化。该技术在简化医疗保健行业工作流程方面取得了巨大成功&#xff0c;减少了教育部门行政任务的工时&#xff0c;同时也降低了制造业的…

Python GUI 开发工具

Python Tkinter教程&#xff08;GUI图形界面开发教程&#xff09;&#xff1a;http://c.biancheng.net/python/tkinter/ PyQt5教程&#xff1a;http://code.py40.com/face 作为 Pyhon 开发者&#xff0c;我们迟早都会碰到 图形用户界面&#xff08;GUI&#xff09;应用 开发任…

pandas 读写 excel

Python开发 之 Python3读写Excel文件&#xff08;较全&#xff09;&#xff1a;https://blog.csdn.net/u014597198/article/details/83104653 python读取excel&#xff08;Python处理xls&#xff09;&#xff1a;https://blog.csdn.net/chenggong2dm/article/details/44956805…

7张图了解2018物联网产业发展新趋势

来源&#xff1a;硅谷动力 作者&#xff1a;文乾摘要&#xff1a;物联网其本质上是互联网的延伸&#xff0c;利用以传感器为主的嵌入式计算机系统进行各终端之间的彼此数据交互。本篇文章用7张图片讲述了物联网应用的各个领域。随着互联网红利逐渐消失&#xff0c;“Interne…

安装 Python 包时解决 Microsoft visual c++ 14.0 is required 问题

参考&#xff1a;http://www.hongweipeng.com/index.php/archives/1532/ 在 windows 上安装 scrapy 时经常会遇到这个问题&#xff0c;安装其他组件也可能会遇到。但问题解决办法都是大致相同的。 如&#xff1a;pip install scrapy 时出现&#xff1a;error: Microsoft Visua…

硅基光电子芯片:换道超车的核心技术

来源&#xff1a;光电子先导院 作者&#xff1a;周治平2018年4月16日&#xff0c;美国商务部激活了对中兴通讯的拒绝令&#xff0c;禁止美国公司向中兴通讯销售任何零部件、商品、软件和技术&#xff0c;直到2025年3月13日。这一禁令立刻使中兴通讯业务陷入休克状态&#xff…

AI虚拟偶像:知识图谱赋予AI“生命感”

来源&#xff1a;脑极体AI是个非常有趣的词&#xff0c;不管是中文翻译的&#xff0c;还是英文的Artificial Intelligence&#xff0c;都有“生物性”的含义。一个是集结了地球顶尖智慧的“人工”&#xff0c;另一个Intelligence则专指生物拥有的智慧。不过在当今的AI风潮中&am…

PySide6、PyQt6、ui文件转py文件、Qt Designer 使用

QT 官网&#xff1a;https://www.qt.io/zh-cn/develop 用 Python 编写安卓 APK&#xff1a;https://zhuanlan.zhihu.com/p/398126847 1、PySide6、PyQt6、PyQt5 PySide6、PySide2、PyQt5 都是基于 Qt 库&#xff0c;Qt 是一组 C 库和开发工具&#xff0c;包括图形用户界面、网…