Shell 脚本应用(四)

正则表达式概述

        正则表达式又称正规表达式,常规表达式。在代码中常简写为regex,regexp 或RE.正则表达式 是使用单个字符串来描述,匹配一系列符合某个句法规则的字符串,简单来说,是一种匹配字符串 的方法,通过一些特殊符号,实现快速查找,删除、替换某个特定字符串。 正则表达式是由普通字符与元字符组成的文字模式。模式用于描述在搜索文本时要匹配的一 个或多个字符串,正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。其中 普通字符包括大小写字母,数字,标点符号及一些其他符号,元字符则是指那些在正则表达式中 具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中 的出现模式.

 

基础正则表达式

        正则表达式的字符串表达方法根据不同的严谨程度与功能分为基本正则表达式与扩展正则表达 式,基础正则表达式是常用的正则表达式的最基础的部分,在Linux系统中常见的文件处理工具中 grep 与sed支持基础正则表达式,而egrep与awk支持扩展正则表达式。掌握基础正则表达式的使用 方法,首先必须了解基本正则表达式所包含的元字符的含义,下面通过grep命令以举例的方式逐个介绍。

1.基础正则表达式示例

下面的操作需要提前准备一个名为test.txt的测试文件,文件具体内容如下所示.

76aa11725e444f9a8424195552af0b19.png

 (1)查找特定字符

        查找特定字符非常简单,如执行以下命令即可从test.txt文件中查找出特定字符“the"所在位置. 其中“-n”表示显示行号,“-i”表示不区分大小写,命令执行后,符合匹配标准的字符,字体颜色 会变为红色(本章中全部通过加粗显示代替)

[root@lgcllc ~]# grep -n 'the' test.txt 

[root@lgcllc ~]# grep -in 'the' test.txt 

65abd08048d24753bd6bb806f1d94706.png

 

若反向选择,如查找不包含“the”字符的行,则需要通过grep命令的‘-vn”选项实现.

[root@lgcllc ~]# grep -vn 'the' test.txt 

575f784d7329497bb8e6adeef0bf8e0d.png 

(2)利用中括号“[ ]”来查找集合字符

                想要查找“shirt”与“short”这两个字符串时,可以发现这两个字符串均包含“sh与rt".此 时执行以下命令即可同时查找到“shirt与“short”这两个字符串.“I”中无论有几个字符,都仅代表一个字符,也就是说“[io]”表示匹配"i”或者“o”.

[root@lgcllc ~]# grep -n 'sh[io]rt' test.txt 

7aa301530cd74404b8c99da8f3b627dd.png

 若要查找包含重复单个字符‘oo”时,只需要执行以下命令即可。

[root@lgcllc ~]# grep -n 'oo' test.txt 

5d2c1fa7d0344f6a9c81a4595bb415bd.png

 若查找‘oo”前面不是‘w”的字符串,只需要通过集合字符的反向选择“[]”来实现该目的, 如执行“grep -n“[^w]oo'test.txt”命令表示在test.txt文本中查找“oo”前面不是“w”的字符串。

[root@lgcllc ~]# grep -n '[^w]oo' test.txt

7ce7b30e5e0d40d0b8bf837630332ae3.png

 (3)查找行首“^” 与行尾字符“$” 

查询the字符串时出现了很多包含“the”的行,如果想要查询以“the”字符串为行首的行,则可以通过 ' ^'元字符来实现。

[root@lgcllc ~]# grep -n '^the' test.txt 

d224886f4391484a8f8e8924648f4a8b.png

 

查询以小写字母开头的行可以通过“[a-z]”规则来过滤,查询大写字母开头的行则使用“[A-Z]” 规则,若查询不以字母开头的行则使用“[^a-zA-Z]”规则。

[root@lgcllc ~]# grep -n '^the' test.txt

[root@lgcllc ~]# grep -n '^[A-Z]' test.txt 
[root@lgcllc ~]# grep -n '^[^a-zA-Z]' test.txt 

3a29b3454e9444aba559fc4b46303df6.png 

当查询空白行时.执行“grep-n““s'test.txt”命令即可。

 [root@lgcllc ~]# grep -n '^$' test.txt 

 (4)查找任意一个字符”.”与重复字符”*”

        在正则表达式中小数点(.)也是一个元字符,代表任意一个字符。例如,执行以下 命令就可以查找“w??d”的字符串,即共有四个字符,以w开头d结尾.

[root@lgcllc ~]# grep -n 'w..d' test.txt

64a233232d69466db96d97a4746fb8fd.png 

若查询包含至少两个o以上的字符串,可执行以下语句

[root@lgcllc ~]# grep -n 'ooo*' test.txt 

425b4be8a43943c9b5357219806eed30.png 

(5)查找连续字符范围“{ }”

        在上面的示例中,我们使用“.”与“*”来设定零个到无限多个重复的字符,如果想要限制一 个范围内的重复的字符串该如何实现呢?例如,查找三到五个o的连续字符,这个时候就需要使用基础正则表达式中的限定范围的字符“{ }”.因为“{ }”在Shell中具有特殊意义,所以在使用“{}” 字符时,需要利用转义字符“\”,将“{ }”字符转换成普通字符。“{}”字符的使用方法如下所示。 

        查询两个o的字符。

[root@lgcllc ~]# grep -n 'o\{2\}' test.txt 

6f2bb5db85204a4abc9d4153cf0f3f73.png 

         查询以w开头以d结尾,中间包含2~5个o的字符串。 

[root@lgcllc ~]# grep -n 'wo\{2,5\}d' test.txt 

256acc4cfa0d4bbe8abc4727a805da13.png 

        查询以w开头以d结尾,中间包含2以上o的字符串。 

[root@lgcllc ~]# grep -n 'wo\{2,\}d' test.txt 

b61a0506599d4b40b9d0e8b9773fc42b.png 

2.元字符总结 

05d6adbc767e4d12bf3cd5c1ea83c371.png

 

文本处理器 

        在Linux/UNX系统中包含很多种文本处理器或文本编辑器,其中包括我们之前学习过的VM编辑器 与grep等。而 grep,sed,awk 更是shell编程中经常用到的文本处理工具,被称之为Shell编程三剑客。

sed工具

        通常情况下调用sed命令有两种格式,如下所示,其中,“参数”是指操作的目标文件,当存在 多个操作对象时用,文件之间用逗号””分隔:而scriptfile表示脚本文件,需要用“-f”选项指定. 当脚本文件出现在目标文件之前时,表示通过指定的脚本文件来处理输入的目标文件。      

a96a8729ec424e4580985c4b9599b833.png  7a497d585325459c81a30d57275742b0.png

d987ebbf1d374a868e581b6eb00cc927.png

awk工具 

        通常情况下awk所使用的命令格式如下所示,其中,单引号加上大括号“{ }”用于设置对数据 进行的处理动作。awk可以直接处理目标文件,也可以通过“-f ”读取脚本对目标文件进行处理。

fb22e9be1a954ae8b8e962229dfaa51a.png

        默认情况下字段的分隔符为空格或者tab键。awk执行结果可以通过 print的功能将字段数 据打印显示。在使用awk命令的过程中,可以使用逻辑操作符“&&”,表示“与”,“II”表示“或”, “!”表示“非”:还可以进行简单的数学运算,如+,一、*./.%、“分别表示加、减、乘、除、取余和乘方。

72da6a30cfb8478b92cadc1aa1467ee5.png 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/579323.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JVM入门到入土-Java虚拟机寄存器指令集与栈指令集

JVM入门到入土-Java虚拟机寄存器指令集与栈指令集 HotSpot虚拟机中的任何操作都需要入栈和出栈的步骤。 由于跨平台性的设计,Java的指令都是根据栈来设计的。不同平台CPU架构不同,所以不能设计为基于寄存器的。优点是跨平台,指令集小&#x…

PyCharm安装PyQt5一系列工具

目录 目录 一、安装IDE 二、安装Pycharm 三、Pycharm内安装一系列工具 1.新建一个项目 2.点击左上角File-Setting-点击加号 3.添加环境变量 4.配置qtdesigner,pyuic,pyrcc 三、用Pyinstaller打包成exe(简单版) 四、我的解释器装在了中文路径&a…

如何分析信号的频率信息?

1 简介 当信号的频率信息是已知的,或者近似已知的,则采样频率容易选择,选择最大采样频率的2倍以上(奈奎斯特采样)。 这里,将讨论信号频率未知的情况。尤其是,考虑如何避免混叠错误。 2 低通滤波(反混叠) 去除混叠错…

二、基于图像和结构化数据多模态融合的回归预测网络【框图讲解+源码】

整理读研期间做的项目与日常小实验 本篇未完待续…代码部分整理后补充 0. 背景 实验室有一些材料的SEM(扫描电镜)图像、也有对应的组分信息(结构化数据,包含类别特征和连续的数值特征),以及对应的力学性能…

WEB 3D技术 three.js带着大家简单在文档上过一下集合体 并理解如何在文档中调试参数

前面讲了 自己创建集合体 顶点分组 但是这样其实挺麻烦的 three.js 其实已经给我们封装好了 官网直接搜索 geometry 这边这个立方体 应该算是我们用的最多的 这里 这个就是通过三个参数设置 它们分别对应 高度 宽度 厚度 拉下来 我们看到 其实他有六个参数 前面的 x y z三个…

有什么好用的C/C++源代码混淆工具?

​ 有什么好用的C/C源代码混淆工具? 开始使用ipaguard 前言 iOS加固保护是直接针对ios ipa二进制文件的保护技术,可以对iOS APP中的可执行文件进行深度混淆、加密。使用任何工具都无法逆向、破解还原源文件。对APP进行完整性保护,防止应用…

sqlmap各个命令的解释及其基本用法

各个命令的用法 -h,--help Show basic help message and exit(显示基本帮助消息并退出) -hh Show advanced help message and exit(显示高级帮助信息并退出) --version Show programs version number and exit(显示程序的版本…

力扣刷题记录(18)LeetCode:474、518、377、322

目录 474. 一和零 518. 零钱兑换 II 377. 组合总和 Ⅳ 322. 零钱兑换 总结&#xff1a; 474. 一和零 这道题和前面的思路一样&#xff0c;就是需要将背包扩展到二维。 class Solution { public:int findMaxForm(vector<string>& strs, int m, int n) {vector&l…

C语言结构体内存对齐

文章目录 一、结构体内存对齐问题二、查看结构体成员起始位置三、设置内存对齐方式 一、结构体内存对齐问题 如下的info_s结构体类型&#xff0c;包含一个int型成员age, 一个char型成员gender, 一个int型成员id。 单从数据成员的大小进行分析&#xff0c;整个结构体的大小应为…

输入两个时间,判断时间是否为非工作日,并且是日期否为同一天。是的话返回true,否返回false

工作遇到这么一个逻辑&#xff0c;前端回传两个时间&#xff08;必须是两个那一种&#xff09;。然后&#xff0c;我后端需要判断这两个时间是否为同一天&#xff0c;并且这个时间是否为非工作日&#xff0c;是的话返回true&#xff0c;反之返回false 代码&#xff1a; packa…

鸿蒙(HarmonyOS)项目方舟框架(ArkUI)之Dialog对话框组件

鸿蒙&#xff08;HarmonyOS&#xff09;项目方舟框架&#xff08;ArkUI&#xff09;之Dialog对话框组件 一、操作环境 操作系统: Windows 10 专业版、IDE:DevEco Studio 3.1、SDK:HarmonyOS 3.1 二、Dialog对话框组件 对话框的使用场景也很高频&#xff0c;比如 APP 上架应…

共享和独享的区别是什么?有必要用独享IP吗?

通俗地讲&#xff0c;共享IP就像乘坐公共汽车一样&#xff0c;您可以到达目的地&#xff0c;但将与其他乘客共享旅程&#xff0c;座位很可能是没有的。独享IP就像坐出租车一样&#xff0c;您可以更快到达目的地&#xff0c;由于车上只有您一个人&#xff0c;座位是您一个人专用…

安卓开发转鸿蒙开发到底有多简单?学习鸿蒙开发有什么价值?

相信各位小伙伴们多多少少都了解过鸿蒙了&#xff0c;有些一知半解而有些已经开始学习起来。那这个鸿蒙到底好不好搞&#xff1f;要不要搞&#xff1f; 据了解安卓反正目前工作感觉不好找&#xff0c;即便是上海这样的大城市也难搞&#xff0c;人员挺饱和的。最近临近年关裁员…

浅谈locust 性能压测使用

1. 基本介绍 Locust是一个开源的负载测试工具&#xff0c;用于模拟大量用户并发访问一个系统或服务&#xff0c;以评估其性能和稳定性。编写语言为Python&#xff0c;可通过Python来自定义构建性能压测场景脚本。Locust支持分 布式负载测试&#xff0c;可以通过多个机器协同工…

张江智荟毁约offer

毕业8年后&#xff0c;找工作被国企歧视学历&#xff01;已经收到了offer&#xff0c;在入职前一周被通知要撤回offer&#xff0c;拒绝录用&#xff0c;理由居然是他们只要本科211以上的人 这是我今天&#xff08;2023-12-26&#xff09;亲身经历的事&#xff0c;听说过面试前…

【树莓派4b的uboot编译移植】

树莓派4b的uboot编译移植 引言 0.1、什么是uboot OS跑起来前&#xff0c;需要的一段引导程序负责部署整个计算机系统&#xff0c;引导操作系统内核启动并给内核传参提供一个命令行界面供人操作是一个开源项目&#xff0c;uboot就是universal bootloader&#xff08;通用的启…

词法语法语义分析程序设计及实现,包含出错提示和错误恢复

词法说明 (1)关键字 main, int, char, if, else, for, while, void (2)运算符 - * / < < > > ! (3)界符 ; ( ) { } (4)标识符 ID letter(letter|digit)* (5)整型常数 NUM digit digit* (6)空格 ‘ ‘ ‘\n’ ‘\r’ ‘\t’ 空格用来分隔ID,NUM,运算符,界…

正则表达式:元字符

一、什么事元字符 正则是由一系列的元字符组成的&#xff0c;所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符&#xff0c;元字符是构成正则表达式的基本元件。 二、元字符的分类 1.特殊单字符 表达式含义\d匹配任意一个数字\D匹配任意非数字\w匹配任意一个字母、…

算法练习Day20 (Leetcode/Python-回溯算法)

虽然看似进入了一个新章节&#xff0c;但其实还是前几天二叉树章节的延续。。 回溯算法 &#xff08;以下内容摘抄自代码随想录&#xff09;&#xff1a; 回溯法解决的问题都可以抽象为树形结构&#xff0c;是的&#xff0c;我指的是所有回溯法的问题都可以抽象为树形结构&…

云原生Kubernetes:K8S集群版本升级(v1.22.14 - v1.23.14)

目录 一、理论 1.K8S集群升级 2.环境 3.升级集群&#xff08;v1.23.14&#xff09; 4.验证集群&#xff08;v1.23.14&#xff09; 二、实验 1. 环境 2.升级集群&#xff08;v1.23.14&#xff09; 2.验证集群&#xff08;v1.23.14&#xff09; 一、理论 1.K8S集群升级 …