正则表达式解析与应用:深度剖析正则表达式的威力

在这里插入图片描述

😄 19年之后由于某些原因断更了三年,23年重新扬帆起航,推出更多优质博文,希望大家多多支持~
🌷 古之立大事者,不惟有超世之才,亦必有坚忍不拔之志
🎐 个人CSND主页——Micro麦可乐的博客
🐥《Docker实操教程》专栏以最新的Centos版本为基础进行Docker实操教程,入门到实战
🌺《RabbitMQ》本专栏主要介绍使用JAVA开发RabbitMQ的系列教程,从基础知识到项目实战
🌸《设计模式》专栏以实际的生活场景为案例进行讲解,让大家对设计模式有一个更清晰的理解
如果文章能够给大家带来一定的帮助!欢迎关注、评论互动~

正则表达式解析与应用:深度剖析正则表达式的威力

  • 概述
  • 正则表达式简介
  • 正则表达式的基本语法
  • 正则表达式的高级语法
  • 实战应用示例
        • 提取图片标签中的链接
        • 匹配IPv4地址
        • 匹配HTML注释
        • 邮箱验证
        • URL提取
        • HTML标签匹配
        • 验证身份证号(15位或18位数字)
        • 验证手机号码
        • 只能输入数字
        • 验证域名
  • 总结

概述

正则表达式是一种强大的文本匹配和处理工具,它在各种编程语言和文本编辑器中广泛应用。本文将深入解析正则表达式的概念、语法、常见用法以及在实际应用中的技巧。

正则表达式简介

正则表达式是一种用于描述字符串模式的表达式。它可以用来匹配、查找、替换文本中的字符串,具有强大而灵活的文本处理能力。正则表达式不仅仅是一种语法,更是一种强大的字符串处理思维方式。

正则表达式的基本语法

字符类

普通字符: 例如,a 匹配字符 a
转义字符: 使用反斜杠\转义特殊字符,如 \.匹配点号 .

元字符

.(点号): 匹配任意字符,除了换行符
^ 匹配字符串的开始
$ 匹配字符串的结束

字符集合

[...] 匹配括号内的任意一个字符
[^...] 匹配除了括号内字符的任意一个字符

量词

* 匹配前一个元素零次或多次
+ 匹配前一个元素一次或多次
? 匹配前一个元素零次或一次
{n} 匹配前一个元素恰好 n 次
{n,} 匹配前一个元素至少 n 次
{n,m} 匹配前一个元素至少 n 次但不超过 m 次

正则表达式的高级语法

转义与原始字符串
在正则表达式中,某些字符有特殊含义,如 .* 等。如果想匹配这些字符本身,需要使用反斜杠进行转义。在某些编程语言中,为了简化正则表达式的书写,还可以使用原始字符串(Raw String)来避免双重转义。例如,在Python中:

# 非原始字符串
pattern = "\\d+"# 原始字符串
pattern_raw = r"\d+"

非捕获分组
有时我们需要使用分组来对正则表达式的一部分进行重复,但又不希望捕获这个分组,可以使用非捕获分组 (?:...)。例如:

(?:https?://)?([^/\s]+)(/[^\s]*)?

上述正则表达式可以匹配 URL,但只捕获了主机名和路径,而不捕获协议部分。

后向引用
后向引用允许在正则表达式中引用先前匹配的子表达式,使用 \1\2等来表示。这在需要匹配对称字符(如括号)或重复出现的模式时非常有用。例如:

(\w)\1

上述正则表达式匹配连续两个相同的字母。

零宽断言
零宽断言是一种先行或后顾条件的匹配,但并不包含在最终的匹配结果中。它包括正向先行断言 (?=...)、负向先行断言 (?!...)、正向后顾断言 (?<=...) 和负向后顾断言 (?<!...)。例如:

(?<=@)\w+

上述正则表达式匹配 @ 后面的字母字符,但不包括 @。

命名分组
为了方便引用,我们可以给分组命名,使用 (?<name>...)(?'name'...)。例如:

(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})

实战应用示例

提取图片标签中的链接
<img[^>]*src=['"]([^'"]+)['"][^>]*>
匹配IPv4地址
\b(?:\d{1,3}\.){3}\d{1,3}\b
匹配HTML注释
<!--.*?-->
邮箱验证
^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
URL提取
https?://[^\s]+
HTML标签匹配
<[^>]+>
验证身份证号(15位或18位数字)
^\d{15}|\d{18}$
验证手机号码
^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$ 
只能输入数字
//限制只能输入数字
^[0-9]*$
//整数或者小数
^[0-9]+\.{0,1}[0-9]{0,2}$
验证域名
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.? 

总结

正则表达式作为文本处理的得力助手,在处理字符串时展现出强大的功能。通过深入理解正则表达式的语法和技巧,我们能更加高效地进行文本处理和匹配,为程序开发、数据清理等场景提供强大的支持。希望通过本文的介绍,大家能够更加深入地掌握正则表达式的使用方法,发挥其强大的匹配和处理能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/599335.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

前端页面锚点跳转

一&#xff0c;页面 二&#xff0c;获取需要跳转的标签class或者id 三&#xff0c;调用跳转方法 如果你的标签有唯一的ID&#xff0c;那么用getElementById方法更好 点击即可跳转锚点

柯桥职场英语中千万别把英文邮件中的“OOO”理解成“哦哦哦”!不然可就尴尬了!

有的同学工作中跟老外打交道比较多 尤其是写邮件&#xff0c;除了要把事情交代清楚 还有一些缩写我们也必须掌握 就拿发邮件时老外最爱用到的“OOO”来说 千万不要把“OOO”理解成“噢噢噢” 今天给大家分享几个关于邮件的常用表达 它们真正的意思你都知道吗 01 “OOO”可…

移动通信原理与关键技术学习(2)

1.多径信道滤波器表示&#xff0c;多径信道可以认为是线性时变滤波器&#xff0c;接收信号为发送信号与信道冲激响应的卷积。 2.调制就是对信号源的信息进行处理加到载波上&#xff0c;使其变为适合于信道传输的形式的过程&#xff0c;就是使载波随信号而改变的技术。 3.进行调…

java程序是如何执行的

我们开发的.java文件也就是源文件在经过了java编译器的编译之后变成了.class文件也就是字节码文件&#xff0c;当jvm在执行过程中用到某个类&#xff0c;而这个类还未被加载到内存中时&#xff0c;会由类加载器负责这个类的加载&#xff0c;整个的加载过程分成五步&#xff1a;…

Databend 的安装配置和使用

介绍 Databend 是一个内置在 Rust 中的开源、弹性和工作负载感知的云数据仓库&#xff0c;为 Snowflake 提供了具有成本效益的替代方案&#xff0c;专门对最大的数据集进行复杂分析而设计。 性能&#xff1a; 在存储对象上&#xff0c;能快速进行数据分析。没有索引和分区&a…

linux系统颜色的设置

颜色 颜色控制码 颜色 echo -e "\033[字背景颜色;文字颜色m字符串\033[0m" //设置文本颜色 echo -e "\033[0;32m字符串\033[0m" //设置文本为绿色&#xff0c;背景没有颜色 echo -e "\033[0;$(($RANDOM%730))m字符串\033[0m" //随机生…

【PythonRS】栅格数据/图片位深度(bit)转换

关于栅格数据/图片的位深度&#xff08;eg.8bit、16bit、32bit&#xff09;转换之前我就发过一篇文章&#xff0c;【Python&RS】基于GDAL栅格数据/图片位深度&#xff08;bit&#xff09;转换。但是最近在使用的时候发现好像效果不行&#xff0c;有时候转换不成功&#xff…

批量转换QQ音乐音频文件格式:从FLAC、OGG到MP3

目录 工具和库批量转换脚本结语 我们经常需要将音频文件从一种格式转换为另一种以满足不同的需求。例如&#xff0c;从QQ音乐中下载的 FLAC格式虽然提供了无损的音质&#xff0c;但文件大小较大&#xff0c;不适合在所有设备上播放。而MP3格式由于其较小的文件大小和广泛的兼容…

创意无限:火星文和变异字体的魅力世界

在互联网的浩瀚星空里&#xff0c;火星文和变异字体如同璀璨的繁星&#xff0c;照亮了网络世界的角落。它们以独特的创意和视觉冲击力&#xff0c;吸引着无数网友的目光。让我们一起走进这个充满创意和想象力的世界&#xff0c;感受火星文和变异字体的无限魅力。 火星文生成器…

软件测试|SQL中的LIKE模糊匹配该怎么用?

简介 在SQL&#xff08;Structured Query Language&#xff09;中&#xff0c;LIKE是一种用于模糊匹配的操作符。通过使用LIKE&#xff0c;我们可以根据模式匹配的方式进行数据检索&#xff0c;而不仅仅局限于完全匹配。本文将详细介绍SQL中LIKE操作符的语法、用法以及一些示例…

全志F1C100s Linux 系统编译出错:不能连接 github

环境 Ubuntu 20.04 LTS 64 位虚拟机 开发板:Lichee Pi Nano 源代码:GitHub - florpor/licheepi-nano 问题描述 该源码库使用了 git 子模块的概念,一个库中包含了 u-boot、Linux等代码库。不需要分别编译,一个 make 全搞定 编译时提示错误: >>> linux-hea…

Halcon根据特征值选择区域select_shape

Halcon根据特征值选择区域 关于提取图像的特征&#xff0c;比较常用的一个算子是select_shape算子&#xff0c;它能高效地根据特征提取出符合条件的区域。该算子的原型如下&#xff1a; select_shape (Regions : SelectedRegions : Features, Operation, Min, Max :)参数1和参…

win和linux打印tree命令目录结构命令

win 输入tree: cmd: tree 显示文件夹不显示文件 可以用相对路径&#xff1a;tree .\test_pipreqs 省略.\也可以&#xff1a;tree test_pipreqs 显示文件 上面只显示文件夹未能显示文件。我们继续看下面&#xff1a; cmd: tree [path] [/f] [/a] ----------/f 显示每个文件中文件…

修改 Git 仓库的远程地址

要修改 Git 仓库的远程地址&#xff0c;你可以使用以下命令&#xff1a; 首先&#xff0c;查看当前的远程地址列表&#xff0c;使用命令 git remote -v。如果你想修改已存在的远程地址&#xff0c;可以使用命令 git remote set-url <remote_name> <new_url>。在这…

【论文阅读笔记】Mip-NeRF 360: Unbounded Anti-Aliased Neural Radiance Fields

目录 概述摘要引言参数化效率歧义性 mip-NeRF场景和光线参数化从粗到细的在线蒸馏基于区间的模型的正则化实现细节实验限制总结&#xff1a;附录退火膨胀采样背景颜色 paper&#xff1a;https://arxiv.org/abs/2111.12077 code&#xff1a;https://github.com/google-research/…

【LeetCode】601. 体育馆的人流量

表&#xff1a;Stadium ------------------------ | Column Name | Type | ------------------------ | id | int | | visit_date | date | | people | int | ------------------------ visit_date 是该表中具有唯一值的列。 每日人流量…

Android 项目工程配置签名文件

1. Android签名证书(.keystore) Android平台打包发布apk应用&#xff0c;需要使用数字证书&#xff08;.keystore文件&#xff09;进行签名&#xff0c;用于表明开发者身份。   Android证书的生成是自助和免费的&#xff0c;不需要审批或付费。   可以使用JRE环境中的keyto…

【UML建模】部署图(Deployment Diagram)

1.概述 部署图是一种结构图&#xff0c;用于描述软件系统在不同计算机硬件或设备上的部署和配置情况&#xff0c;以图形化的方式展示系统中组件、节点和连接之间的物理部署关系。 通过部署图&#xff0c;可以清晰地了解系统的物理结构和部署方式&#xff0c;包括系统组件和节…

使用免费工具在 Windows 11/10/8/7 中扩展 C 盘的 3 种方法

越来越多的Windows 10笔记本电脑和台式机使用SSD作为系统盘&#xff0c;这对于提高计算机性能很有用&#xff0c;因为SSD的读写速度要快得多。但另一方面&#xff0c;SSD价格更高&#xff0c;因此比传统机械硬盘体积更小。当然C盘空间不足的可能性更大。在这种情况下&#xff0…

在Docker中安装和配置InfluxDB,设置SSL和密码保护

在Docker中安装和配置InfluxDB&#xff0c;设置SSL和密码保护 引言 InfluxDB是一个开源的时间序列数据库&#xff0c;常用于存储和查询大量时序数据。通过使用Docker&#xff0c;我们可以轻松地部署和管理InfluxDB容器&#xff0c;并配置SSL以及设置用户名和密码进行保护。本博…