Linux系统三剑客之grep和正则表达式的介绍(一)

1.正则表达式

目录

1.正则表达式

1.什么是正则表达式 ?

2.正则表达式的使用场景

3.正则表达式字符表示

4.它们之间的区别

2.grep命令

作用:

语法:

说明:

选项:options

重点

实例

3.后面的下次再更新。 


1.什么是正则表达式 ?

一个正则表达式就是描述了一个字符串集合的方式。正则表达式的表示就是一些特殊符号的组合,而每个符号代表着一些具体的意思。符合的组合就定义了一套规则和方法,其主要作用就是从大量文本从匹配出符合条件行。

2.正则表达式的使用场景

在Linux中,正则表达式的主要使用场景就是文本处理三剑客。grep,sed,awk .除此之外,vi指令也支持正则表达式。

3.正则表达式字符表示

在正则表达式中,又可以分为基本正则表达式和扩展正则表达式 。其主要区别在于:

  • 基本正则表达式只认识元字符,其元字符主要包括:^ $ . [] * ,具体含义见下表格

  • 扩展正则表达式有添加了() {} ? + | 等符号

以下为各个元字符的含义

元字符含义实例
^匹配行首^abc : 匹配以abc开头的字符
$匹配行尾abc$ : 匹配以abc结尾的字符
^$空行表示空行的意思
.匹配任意单个字符.a : 匹配任意和a结合的两个字符,其中必须是在后面
*字符* 匹配0或多个此字符*.a : 匹配任意个一个或多个含有a的字符
.*代表任意多个字符就是代表任意多个字符
\屏蔽一个元字符的特殊含义表示去掉有意义的元字符的含义
[]匹配中括号内的字符[abc] : 代表匹配a或b或c
[^abc]匹配不包含括号内的任意字符[^abc] : 代表对abc的取反 ,这个^abc意义不同。

扩展正则中支持的字符

字符含义实例
+重复前一个字符一次或多次a+ : 匹配包含一个a或多个a的字符 。
重复前面一个字符0次或一次a? :匹配包含0个或一个a字符
|同时匹配|两边的字符"abc\|bcd" : 匹配包含abc或bcd的字符
()可以和()的字符分组匹配abc (d\|e\|f)” :匹配abcd,abce,abcf字符
{}匹配前面字符的次数
{n}abc{2}” : 至少匹配abc两次
{n,m}abc{2,5}” : 匹配abc两到五次

预定义字符类

正则表达式描述示例
[:alnum:][a-zA-Z0-9]匹配任意一个字母或数字字符[[:alnum:]]+
[:alpha:]匹配任意一个字母字符(包括大小写字母)[[:alpha:]]
[:blank:]空格与制表符(横向纵向)[[:blank:]]
[:digit:]匹配任意一个数字字符[[:digit:]]+
[:lower:]匹配小写字母[[:lower:]]
[:upper:]匹配大写字母[[:upper:]]
[:punct:]匹配标点符号[[:punct:]]
[:space:]匹配一个包括换行符,回车等在内的所有空白符[[:space:]]+
[:graph:]匹配任何一个可以看得见的且可以打印的字符[[:graph:]]
[:xdigit:]任何一个十六进制数[[:xdigit:]]+
[:cntrl:]任何一个控制字符(ASCII字符集中的前32个字符)[[:cntrl:]]
[:print:]任何一个可以打印的字符[[:print:]]
4.它们之间的区别

在上面我们提到正则包括基础正则和扩展正则,但是它们有什么区别呢?在什么地方使用呢 ? 接下来我们主要说明在Linux 三剑客中的不同(grep,sed,awk)

  • grep : 在grep中,如果只是使用grep ,那只能使用原字符的正则以及预定义字符类,而若想使用扩展正则中包含的字符,就必须在grep后加参数-E 。

  • sed :若要使用而扩展正则中包含的字符,就必须在sed后加参数-r。

2.grep命令

作用
  • 用于打印匹配给定模式的行

语法:

grep [options] PATTERN [FILE...] ​ grep [options] [-e PATTERN | -f FILE] [FILE...]

说明:

grep指令用于搜索所给定的模式(PATTERN )的FILE 文件里的内容 ,如果从文件内容里找到了该模式的文件内容,grep会把匹配的该行显示出来。若不指定任何文件,或给的文件名为- , 则grep会从标准输入读取内容。

 另外,也可以使用两个变种程序 egrep 和 fgrep 。 Egrep 与 grep -E 相同。 Fgrep 与 grep -F 相同。

选项:options
说明: 以下的NUM代表的是一个数字,代表的是行数
-A NUM 或者 --after-context=NUM
除了显示符合条件的那一行之外,并显示该行之后NUM行的内容
-a 或者--text
将一个二进制文件视为一个文本文件来处理;它与--binary-files=text 选项等价。-B NUM 或者--before-context=NUM
除了显示符合条件的那一行之外,并显示该行之前NUM行的内容。-C NUM 或者--context=NUM
除了显示符合条件的那一行之外,并显示该行之前和之后的NUM行的内容-b 或者--byte-offset
在输出的每行前面同时打印出当前行在输入文件中的字节偏移量。--colour[=WHEN] 或者 --color[=WHEN]
在匹配的行中,已匹配到字符串进行着色显示。WHEN可以是never,always,或是auto。-c 或者--count
计算符合条件的行数-d ACTION 或者 --directories=ACTION
如果输入文件是一个目录,使用动作ACTION来处理它。
默认情况下,动作ACTION是read,意味着目录将视为普通文件那样来读。
如果动作 ACTION是skip ,将不处理而直接跳过目录。
如果动作ACTION是recurse,grep 将递归地读每一目录下的所有文件。这样做和-r选项等价。-E 或者 --extended-regexp
将E后面的模式作为一个正则表达式来使用。-e PATTERN 或者 --regexp=PATTERN
使用PATTERN作为查找文件内容的模式(支持正则),但是在单条命令中可使用多个-e选项-F 或者 --fixed-strings
将模式 PATTERN 视为一个固定的字符串的列表,用新行 (newlines) 分隔,只要匹配其中之一即可。-f FILE 或者--file=FILE
从文件 FILE 中获取模式,每行一个。空文件含有0个模式,因此不匹配任何东西。-G 或者--basic-regexp
将模式 PATTERN 作为一个基本的正则表达式这是默认值。-H 或者 --with-filename
为每个匹配打印文件名。-h 或者 --no-filename
当搜索多个文件时,禁止在输出的前面加上文件名前缀。-i 或者 --ignore-case
忽略大小写的区别-L 或者 --files-without-match
打印在文件内容中无法找到匹配后的文件名称-l 或者 --files-with-matches
打印出在文件内容中找到匹配后的文件名-m NUM 或者 --max-count=NUM
在找到NUM个匹配的行之后,不再读这个文件。-n 或者 --line-number
在输出的每行前面加上它所在的文件中它的行号。-o 或者 --only-matching
只显示匹配的行中与 PATTERN 相匹配的部分。--label=LABEL
将来自标准输入的匹配输出视为来自输入文件LABEL的值--line-buffering
使用行缓冲,it can be a performance penality.-q, --quiet, --silent
不显示任何信息。-R, -r, --recursive
递归地读每一目录下的所有文件。这样做和 -d recurse选项等价。--include=PATTERN
仅仅在搜索匹配 PATTERN 的文件时在目录中递归搜索。--exclude=PATTERN
在目录中递归搜索,但是跳过匹配 PATTERN 的文件。-s 或者 --no-messages
禁止输出关于文件不存在或不可读的错误信息。-u 或者 --unix-byte-offsets
报告Unix风格的字节偏移量。这个开关使得grep报告字节偏移量时,将文件作为Unix
风格的文本文件看待,也就是说将CR字符去掉。这将产生与在一台Unix主机上运行grep完全相同的结果。除非同时使用-b选项,否则这个选项无效。这个选项在MS-DOS和MS-Windows之外的系统中无效。-V 或者 --version
向标准错误输出打印 grep 的版本号。-v 或者 invert-match
显示不包含匹配模式的所有行。-w 或者 --word-regexp
只选择含有能组成完整的词的匹配的行。判断方法是匹配的子字符串必须是一行的开始,或者是在一个不可能-x 或者 --line-regexp
完全匹配。-Z, --null
文件内容全部显示,不同字体通过颜色加以标注
重点

虽然在上面我们可以看到,grep中有很多选项,但是在工作中,大多数的选项是用不到的,这里我们划一下重点。

常用参数

-E将后面的模式作为一个正则表达式(扩展正则)
-e支持一个命令中多个正则匹配
-i忽略大小写
-n在匹配的行前加入编号
-v只显示不匹配的行
实例

使用到文件info,通过grep来进行过滤,info的文件内容如下:

  1. 查找文件info中包含ccc的内容并打印行数

grep -n "ccc" info

2.查找文件info中包含ggg且忽略大小写的字符并打印,

grep -i "ggg" info

3.过滤掉含有ccc的行

grep -v "ccc" info

 

4.查找包含ddd,eee,fff的行(注意:以下匹配用到正则)

grep -E "ddd|eee|fff" info

5.查找以c开头的行

grep ^c info

6.查找以ccx开头且结尾的行

grep ^ccx$ info

7.查找d字符前可以是任意字符的行

grep .d info

8.查找包含一个或多个d字符的行

grep -E d{1} info

9.显示包含a,b,c的字符的行 ; 显示不包含a,b,c字符的行

包含:grep -i ^[abc] info
不包含: grep -i [^abc] info (是全部字符不包含a或b或c)

10.显示包含一个或多个含有a字符的行

grep -E a+ info

11.查找以cc开头且包含c,x,ld字符的行

grep -E "cc(c|x|ld)" info

12.查找文件中所有的大写字符

grep [[:upper:]] info

13.匹配任意一个字母和数字字符

grep [[:alnum:]] info

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/631648.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

始祖鸟母公司亚玛芬冲刺IPO:持续大额亏损,凸显安踏全球化野心

2024年赴美上市第一枪,由户外运动品牌始祖鸟母公司亚玛芬打响。 近日,安踏体育(HK:02020,下称“安踏”)旗下合营公司Amer Sports Holding(Cayman)Limited(下称“AS Holding”&#…

Pyspark 安装(Mac M2版)

引言 本文为个人本地部署pyspark遇到的问题以及解决办法,包含个人的一些理解,仅供参考。设备: Mac M2 安装过程 安装HomeBrew Mac 上用来管理安装包的,可能早期的 Macos 自带但是起码我个人的 Mac 是需要安装的(以下安装方法个…

异步Merkle Tree

1. 引言 前序博客: 利用多核的Rust快速Merkle tree Anoushk Kharangate 2023年论文《Asynchronous Merkle Trees》,其对Merkle tree数据结构进行修改,使得可跨多线程异步计算。 开源代码实现见: https://github.com/anoushk1…

Java SE入门及基础(19)

二维数组 1. 数组的本质 数组从本质上来说只有一维,二维数组是指在一维数组中再放入一个一维数组。三维数组、四维数组依次类推。 2. 二维数组的定义 语法 数据类型[][] 数组名 new 数据类型[数组的长度][数组的长度]; 示例 public static void main ( Str…

解密Oracle数据库引擎:揭开数据存储的神秘面纱

目录 1、介绍Oracle数据库引擎 1.1 什么是Oracle数据库引擎 1.2 Oracle数据库引擎的作用和功能 1.3 Oracle数据库引擎的历史和发展 2、Oracle数据库引擎的体系结构 2.1 Oracle数据库实例的组成部分 2.2 Oracle数据库引擎的层次结构 2.3 Oracle数据库引擎的关键组件 3、…

Uniapp多选Popup(弹出层)

uniapp中多选组件很少,故个人简单开发了一个,可简单使用,也可根据个人需求稍微改进 支持的功能 单选多选(默认)限制选择数量默认选中禁用选项 属性说明 属性默认值说明singlefalsetrue为开启单选,否则为…

FFMPEG命令生成各国国旗

文章目录 亚洲篇中国~待完善朝鲜~待补充韩国~待补充蒙古~待补充日本越南~待补充老挝 欧洲篇挪威~待补充瑞典~待补充芬兰~待补充冰岛~待补充丹麦~待补充爱沙尼亚拉脱维亚立陶宛白俄罗斯~待补充乌克兰摩尔多瓦~待补充俄罗斯德国 亚洲篇 中国~待完善 先画个五角星 在100x100的画…

Tokenization 指南:字节对编码,WordPiece等方法Python代码详解

在2022年11月OpenAI的ChatGPT发布之后,大型语言模型(llm)变得非常受欢迎。从那时起,这些语言模型的使用得到了爆炸式的发展,这在一定程度上得益于HuggingFace的Transformer库和PyTorch等库。 计算机要处理语言,首先需要将文本转…

在自定义数据集上训练 YOLOv8 进行目标检测

这是目标检测中令人惊叹的 AI 模型之一。在这种情况下,您无需克隆存储库、设置要求并配置模型,就像在 YOLOv5 及其之前的版本中所做的那样。 在 YOLOv8 中,不需要执行这些手动任务。您只需安装 Ultralytics 即可,我将向您展示如何…

uniapp开发小程序—scroll-view实现内容滚动时, 标题也滚动

一、需求 scroll-view实现内容滚动时&#xff0c; 标题也滚动 二、效果 三、代码实现 <template><view class"content"><view class"head">头部固定区域</view><view class"list_box"><!-- 菜单左边 -->&l…

【c++】栈(satck)和队列(queue)

目录 一、stack 1.stack的介绍 2.stack的使用 3.stack的模拟实现 二、queue 1.queue的介绍 2.queue的使用 3.queue的模拟实现 三、priority_queue 1.priority_queue的介绍 2.priority_queue的使用 一、stack 1.stack的介绍 &#xff08;1&#xff09;stack是一种容…

pytest -- 基本使用详解

1. pytest基本介绍 pytest 是一个功能强大且易于使用的 Python 测试框架&#xff0c;用于编写单元测试、集成测试和功能测试。 它提供了丰富的功能和灵活的用法&#xff0c;使得编写和运行测试变得简单而高效。 --------------->>>>> pytest框架优点&#xff1a…

企业怎么传输大容量视频?

在企业中&#xff0c;视频的应用越来越广泛&#xff0c;不论是在内部沟通、培训、宣传&#xff0c;还是在外部合作、推广、展示方面&#xff0c;视频都扮演着不可或缺的角色。然而&#xff0c;由于视频文件通常较大&#xff0c;传输时往往会面临网速慢、容量限制、安全风险等问…

flutter 五点一:MaterialApp Theme

ThemeData factory ThemeData({bool? applyElevationOverlayColor, //material2的darkTheme下 增加一个半透明遮罩 来凸显阴影效果 material3下无效 貌似没啥用NoDefaultCupertinoThemeData? cupertinoOverrideTheme, //ios组件样式 Iterable<ThemeExtension<dyn…

【Java基础_01】Java运行机制及运行过程

【Java基础_01】Java运行机制及运行过程 文章目录 【Java基础_01】Java运行机制及运行过程1.Java 运行机制及运行过程1.1 Java 核心机制-Java 虚拟机 [JVM java virtual machine] 1.2 JDK&#xff0c;JRE1.3 JVM,JDK和JRE1.4 环境变量path1.4.1 为什么要配置path1.4.2 配置环…

Mesh自组网通信技术概述

Mesh自组网核心技术 Mesh自组网&#xff08;Mesh Networking&#xff09;是一种网络技术&#xff0c;主要用于在多个节点之间建立动态的、自我管理的网络连接。这种技术的核心在于其自我组织和自我修复的能力&#xff0c;使得网络能够在节点移动或节点故障时自动调整。以下是Me…

2024.1.17 用户画像day02 - Elastic Search

目录 ES和数据库的类比 ELK集中日志协议栈介绍 ES的介绍 ES的架构 ES中的名词 ES中的角色 分片与副本的区别在于: MYSQL分库与分表: 倒排序索引: ES写入数据原理: ES读取、检索数据原理: 重点: ES 的架构 , ES读写的原理 ES和数据库的类比 关系型数据库非关系型数…

C++发展史

目录 什么是C C的发展史 C的重要性 C在实际工作中的应用 “21天教你学会C” 什么是C 先看看祖师爷&#xff0c;记得多拜拜&#x1f92d; C语言是结构化和模块化的语言&#xff0c;适合处理较小规模的程序。对于复杂的问题&#xff0c;规模较大的 程序&#xff0c;需要高度…

Vue3 + Electron框架读取程序外部配置文件

网上找了一堆都不行&#xff0c;根据这个步骤来肯定能用 1. 在项目下新建一个config.json文件 2. json文件中写入一些配置 3. vue.config.js中配置打包时把config.json文件copy到应用目录下 pluginOptions:{electronBuilder:{nodeIntegration:true,builderOptions: {extraReso…

MySQL表的基本插入查询操作详解

博学而笃志&#xff0c;切问而近思 文章目录 插入插入更新 替换查询全列查询指定列查询查询字段为表达式查询结果指定别名查询结果去重 WHERE 条件基本比较逻辑运算符使用LIKE进行模糊匹配使用IN进行多个值匹配 排序筛选分页结果更新数据删除数据截断表聚合函数COUNTSUMAVGMAXM…