掌握正则表达式的力量:全方位解析PCRE的基础与进阶技能

Perl 兼容正则表达式(PCRE)是 Perl scripting language 中所使用的正则表达式语法标准。这些正则表达式在 Linux 命令行工具(如 grep -P)及其他编程语言和工具中也有广泛应用。以下是一些基础和进阶特性,帮你掌握和使用 PCRE。

基本概念

1. 元字符
  • .: 匹配除了换行符之外的任何单个字符。
  • ^: 匹配行的开始。
  • $: 匹配行的结尾。
  • *: 匹配前一个字符或子表达式零次或多次。
  • +: 匹配前一个字符或子表达式一次或多次。
  • ?: 匹配前一个字符或子表达式零次或一次。
  • {n,m}: 匹配前一个字符或子表达式至少 n 次,但不超过 m 次。
  • []: 匹配括号内的任意字符。
  • |: 选择匹配,表示“或”。
  • \K:重置之前的匹配,使得最终匹配结果从 \K 之后开始。
2. 转义字符
  • \: 转义下一个字符,使其变为普通字符或启用特殊字符。
3. 字符类
  • \d: 匹配任何一个数字,相当于[0-9]
  • \D: 匹配任何一个非数字字符。
  • \w: 匹配任何一个字母、数字或下划线字符,相当于[a-zA-Z0-9_]
  • \W: 匹配任何一个非字母、数字或下划线字符。
  • \s: 匹配任何一个空白符(空格、制表符等)。
  • \S: 匹配任何一个非空白符。

特性与操作

捕获和非捕获组
  • (...): 捕获组,可以匹配并记住。
  • (?:...): 非捕获组,只进行匹配不记忆。
后向引用
  • \n: 引用前面第 n 个捕获组,例如 \1
零宽断言
  • 正向先行断言:(?=...),确保接下来的字符与…匹配。
  • 负向先行断言:(?!...),确保接下来的字符不与…匹配。
  • 正向后行断言:(?<=...),确保前面的字符与…匹配。
  • 负向后行断言:(?<!...),确保前面的字符不与…匹配。
贪婪与懒惰
  • *+?{n,}等默认是贪婪的,匹配尽可能多的字符。
  • *?+???{n,}?等是懒惰的,匹配尽可能少的字符。

示例

匹配 IP 地址
grep -oP '\b\d{1,3}(\.\d{1,3}){3}\b'
  • \b: 单词边界,确保 IP 地址独立。
  • \d{1,3}: 匹配 1 到 3 个数字。
  • (\.\d{1,3}){3}: 匹配 . 及 1 到 3 个数字的组合,重复 3 次。
提取 IP 地址

假设你有如下命令输出:

inet 192.168.134.128/24 brd 192.168.134.255 scope global dynamic noprefixroute ens160

使用 grep 结合 \K 来提取第一个 IP 地址的命令如下:

ip a show ens160 | grep -oP 'inet \K[\d.]+'

解释

  • 'inet \K[\d.]+'
    • inet :匹配前缀 inet
    • \K:重置匹配的开始位置,忽略掉之前的 inet
    • [\d.]+:匹配一个或多个数字和点字符,表示 IP 地址。

其他示例

提取域名

假设你有一行包含 URL 的文本:

Access the site at https://www.example.com/page now.

使用 grep 来提取域名的命令如下:

echo "Access the site at https://www.example.com/page now." | grep -oP 'https://\K[^/]+'

解释

  • 'https://\K[^/]+'
    • https://:匹配 URL 的前缀 https://
    • \K:重置匹配的开始位置,忽略掉之前的 https://
    • [^/]+:匹配非 / 字符的一个或多个,表示域名部分。

使用场景

  • 过滤文本:例如从大段文本中提取特定部分信息(如 IP 地址、域名、关键字段等)。
  • 增强脚本:在自动化任务和脚本中进行复杂文本处理。

注意事项

  • \K 只能在 PCRE 模式下使用,因此确保使用 grep -P 而不是 grep 或其它不支持 PCRE 的工具。
  • 对于更复杂的匹配,可能需要结合其他正则表达式特性(如捕获组、断言等)来实现。
邮箱地址
grep -oP '[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}'
  • [a-zA-Z0-9._%+-]+: 匹配邮箱用户名部分。
  • @: 匹配 @ 符号。
  • [a-zA-Z0-9.-]+: 匹配域名部分。
  • \.[a-zA-Z]{2,}: 匹配顶级域名部分。

实用工具

  • 在线测试工具:如 regex101,支持 PCRE 语法,并且可以实时测试和调试你的正则表达式。
  • 文本编辑工具:例如 Sublime Text 和 VSCode,都支持 PCRE 并提供强大的查找和替换功能。

实践

为了更好地掌握与应用 PCRE,多多练习和测试是最有效的方法。通过不断调整和优化你的正则表达式,会更好地理解它们的运行机制和应用场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/845386.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++容器之前向链表(std::forward_list)

目录 1 概述2 使用实例3 接口使用3.1 construct3.2 assigns3.3 iterators3.4 capacity3.5 access3.6 assign3.7 emplace_front3.8 push_front3.9 pop_front3.10 emplace_after3.11 insert_after

C++面试题其一

C和C的区别 C和C都是广泛使用的编程语言&#xff0c;但它们有显著的区别&#xff1a; 语言范式&#xff1a; C&#xff1a;是一种过程化编程语言&#xff0c;强调过程和函数的使用。C&#xff1a;是一种多范式编程语言&#xff0c;支持面向对象编程、泛型编程和过程化编程。 …

buuctf的RSA(五)

[RoarCTF2019]RSA 一看到题目&#xff0c;我就有些蒙了&#xff0c;A是代表了什么&#xff0c; 先来分解n 接下来可以暴力破解e了&#xff0c;因为e没有给出来&#xff0c;应该不会太大&#xff0c;猜测是四位数字 import gmpy2 import libnum from Crypto.Util.number import…

网卡配置基础知识

1、网络设置方式 首先科普下Virtual Box虚拟机的几种主流的网络设置方式&#xff0c;官方文档&#xff1a; 2解释 Host-only&#xff1a;仅主机模式 虚拟机和宿主机、虚拟机之间能互通&#xff0c;但是不能访问外网&#xff0c;虚拟机和宿主机同网段的其他主机不能互通这种…

JS实现时间段过滤搜索

你想要实现一个JavaScript函数&#xff0c;用于根据时间段过滤搜索结果吗&#xff1f;可以尝试以下的示例代码&#xff1a; // 假设这是你的数据 const data [{ id: 1, name: Alice, timestamp: 1622382000000 }, // 2021-05-30 12:00:00 UTC{ id: 2, name: Bob, timestamp: …

数据结构---栈队列

栈和队列是我们数据结构中经常使用的数据结构&#xff0c;所以现在来了解一下栈和队列。 栈 特点&#xff1a; 栈是一种特殊的线性表&#xff0c;其中进行数据插入和弹出的部分叫做栈顶&#xff0c;另一端叫做栈底。 只允许数据从栈顶压入&#xff0c;从栈顶弹出即先进后出的…

最佳实践:REST API 的 HTTP 请求参数

HTTP 请求中的请求参数解释 当客户端发起 HTTP 请求 时&#xff0c;它们可以在 URL 末尾添加请求参数&#xff08;也叫查询参数或 URL 参数&#xff09;来传递数据。这些参数以键值对的形式出现在 URL 中&#xff0c;方便浏览和操作。 请求参数示例 以下是一些带有请求参数的…

《mysql轻松学习·一》

SQL:结构化查询语言&#xff0c;用于访问和操作数据库&#xff0c;包括数据定义&#xff0c;数据操纵&#xff0c;数据查询&#xff0c;数据控制。 1、命令行 select version(); //查看当前版本 status; //查看用户信息&#xff0c;端口&#xff0c;版本号等信息 show databas…

C#中用 protobuf Struct 实现弱类型的json 序列化/反序列化

目标 在.net 大力支持使用 gRPC 的背景下&#xff0c;通过 jsontranscoding 可以实现 gRPC/WebAPI 一鱼两吃。有时候不想把json对象的所有属性都在 proto 中定义出来&#xff0c;比如设备对象&#xff0c;不同设备有不同的属性&#xff0c;要都强类型那C#里面的对象属性会很多&…

JS-Lodash工具库

文档&#xff1a;Lodash Documentation orderBy函数&#xff1a;根据条件进行排序 注&#xff1a;第一个是要排序的数组&#xff0c;第二个是根据什么字段进行排序&#xff0c;第三个是排序的方式&#xff08;desc倒序&#xff09; 安装方式&#xff1a;Lodash npm i lodash…

小型企业网络组网与配置仿真实验

实验要求如下: 我这里以学号46为例 一、IP 地址规划表 &#xff08;一&#xff09;主类网络 &#xff08;二&#xff09;子网划分 需要自己计算有效ip范围 在C类主网络192.168.46.0/24中&#xff0c;我们需要先了解这个网络的子网掩码为255.255.255.0&#xff0c;其二进制…

vue3 组件级权限控制

权限控制程度分为&#xff1a;1. 页面级 2. 组件级 3. 代码级 1. 页面级 这是大部分前端遇到的级别。依靠路由守卫&#xff0c;如果没有权限&#xff0c;就看不到菜单&#xff0c;就进不到页面。不会给页面带来侵入性。什么是侵入性&#xff0c;就是写页面组件的时候&#xf…

Flutter 中的 SliverFillViewport 小部件:全面指南

Flutter 中的 SliverFillViewport 小部件&#xff1a;全面指南 Flutter 是一个由 Google 开发的跨平台 UI 框架&#xff0c;它允许开发者使用 Dart 语言来构建高性能、美观的移动、Web 和桌面应用。在 Flutter 的丰富组件库中&#xff0c;SliverFillViewport 是一个用于 Custo…

『ZJUBCA MeetUP』 5月25日线下活动——Aptos 链的动态与应用

2024 求是创新 ZJUBCA Sponsored by the ALCOVE Community TIME&#xff1a;2024/05/25 ADD&#xff1a;浙江大学紫金港校区 --- Alcove 是 Aptos 公链与 Alibaba Cloud 共同打造的亚洲首个 Move 开发者社区&#xff0c;致力于支持开发者使用 Move 语言构建下一代 Web3 应用&am…

Linux的命令补全脚本

一 linux命令补全脚本 Linux的命令补全脚本是一个强大且高效的工具&#xff0c;它能够极大地提高用户在命令行界面的工作效率。这种脚本通过自动完成部分输入的命令或参数&#xff0c;帮助用户减少敲击键盘的次数并降低出错率。接下来将深入探讨其工作原理、安装方式以及如何自…

ffmpeg在特定时间点插入素材

如果要在视频的特定时间戳处插入图片&#xff0c;则可以使用以下命令&#xff1a; ffmpeg -i input.mp4 -i image.png -filter_complex “[0:v][1:v]overlay100&#x1f4af;enable‘between(t,5,10)’” -c:a copy output.mp4 这里使用了enable选项&#xff0c;指定了图片插入…

TPM之VMK密封

本篇文章主要介绍基于TPM的Bitlocker全盘加密时&#xff0c;VMK密钥的密封&#xff08;Seal&#xff09;流程&#xff0c;至于TPM、Bitlocker、密钥保护器、VMK密钥等这些东西是什么&#xff0c;这里不做解释&#xff0c;需要自己脑补一下&#xff08;╮(╯▽╰)╭&#xff09;…

【HarmonyOS】输入框焦点控制实现键盘显隐

【HarmonyOS】输入框焦点控制实现键盘显隐 问题背景&#xff1a; 鸿蒙中输入框控件&#xff0c;TextInput最常见的控制&#xff0c;即&#xff1a;针对输入框焦点控制&#xff0c;获取焦点&#xff0c;失去焦点。达到用户方便操作输入和退出输入。 因为输入框一定会伴随着键盘…

42.开发中对String.format()的使用之空位补齐

用于空位补齐 Int x1; //对于传入的数字做处理&#xff0c;如果传入的数字不足三位&#xff0c;则使用数字0自动补齐 String numString.format(“%”3”d”,x); System.out.println(“num”num);//输出结果为&#xff1a;001 也可以简写成&#xff1a; String num2String…

2024年大屏幕互动源码+动态背景图和配乐素材+搭建教程

2024年大屏幕互动源码动态背景图和配乐素材搭建教程 php宝塔搭建部署活动现场大屏幕互动系统php源码 运行环境&#xff1a;PHPMYSQL 下载源码地址&#xff1a;极速云