正则表达式详细讲解

目录

一、正则表达式概念

二、八元素

1、普通字符:

2、元字符:

3、通配符 .:

4、字符类 []:

5、量词:

6、锚点 ^ 和 $:

7、捕获组 ():

8、转义字符 \:

三、日常使用的正则表达式

1、邮箱

2、电话(美国)

3、URL

4、日期(YYYY-MM-DD)

5、IP地址

6、用户名(仅包含字母和数字,且长度为6-12字符)

7、密码(包含大小写字母、数字、特殊字符,且长度为8-16个字符)

总结

我的其他博客


一、正则表达式概念

正则表达式(Regular Expression,简称Regex或RegExp)是一种用于描述字符串模式的表达式。它提供了一种灵活的方式来进行字符串的匹配、搜索、替换和提取操作。正则表达式是由普通字符和元字符(metacharacters)组成的字符串,这些元字符具有特殊的意义,用于定义匹配规则。

以下是正则表达式的一些基本概念和元素:

  1. 普通字符: 表达式中的普通字符(例如字母、数字、符号)表示它们自身,只有它们自身与输入字符串中的字符匹配。

  2. 元字符: 元字符是具有特殊含义的字符,它们用于构建匹配模式。例如,*+.^$ 等都是元字符。

  3. 通配符: .(点)是一个通配符,匹配任意单个字符,除了换行符。

  4. 字符类: 方括号 [] 用于定义一个字符类,匹配其中任意一个字符。例如,[aeiou] 可以匹配任何一个元音字母。

  5. 量词: 量词用于指定匹配模式中字符的数量。例如,* 表示零个或多个,+ 表示一个或多个,? 表示零个或一个。

  6. 锚点: ^(脱字符)用于匹配字符串的开头,$ 用于匹配字符串的结尾。

  7. 捕获组: 使用圆括号 () 可以创建捕获组,用于分组并记住匹配的子表达式。捕获组允许你提取匹配的部分。

  8. 转义字符: 反斜杠 \ 用于转义元字符,使其失去特殊含义,匹配字符本身。例如,\. 匹配实际的点字符。

正则表达式的语法因编程语言而异,但基本的概念和元素在大多数语言中是相似的。许多编程语言(如Python、JavaScript、Java)都提供了内置的正则表达式支持。正则表达式是一个强大而灵活的工具,但有时也可能变得复杂,特别是对于复杂的匹配模式。

二、八元素

1、普通字符:

普通字符是正则表达式中的字母、数字、符号等,它们表示它们自身。例如,正则表达式中的 a 将精确匹配字符串中的字母 "a"。

2、元字符:

元字符是具有特殊含义的字符,用于构建匹配模式。一些常见的元字符包括:

  • .:匹配任意单个字符(除了换行符)。
  • *:匹配前一个字符的零个或多个实例。
  • +:匹配前一个字符的一个或多个实例。
  • ?:匹配前一个字符的零个或一个实例。
  • ^:匹配字符串的开始。
  • $:匹配字符串的结束。
  • []:定义字符类,匹配其中任意一个字符。
  • ():创建捕获组。

3、通配符 .

点号 . 是一个通配符,用于匹配任意单个字符,除了换行符。例如,正则表达式 a.c 可以匹配 "abc"、"adc"、"a1c" 等。

4、字符类 []

字符类用于定义一个字符集合,匹配其中的任意一个字符。例如,正则表达式 [aeiou] 匹配任何一个元音字母。

5、量词:

  • 量词用于指定字符或字符类的重复次数。
    • *:匹配前一个字符的零个或多个实例。
    • +:匹配前一个字符的一个或多个实例。
    • ?:匹配前一个字符的零个或一个实例。
  • 例如,正则表达式 \d+ 可以匹配一个或多个数字。

6、锚点 ^$

^ 用于匹配字符串的开始,$ 用于匹配字符串的结束。例如,正则表达式 ^start 可以匹配以 "start" 开始的字符串。

7、捕获组 ()

捕获组用于创建子表达式,可以对其进行分组,以便后续引用或提取。例如,正则表达式 (\d+)-(\w+) 可以匹配像 "123-abc" 这样的字符串,并将数字和字母分别放入两个捕获组中。

8、转义字符 \

反斜杠 \ 用于转义元字符,使其失去特殊含义,匹配字符本身。例如,\. 可以匹配实际的点字符。

三、日常使用的正则表达式

1、邮箱

  • 正则表达式:^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
  • 用途:用于验证电子邮件地址的格式。

2、电话(美国)

  • 正则表达式:^\(?\d{3}\)?[-.\s]?\d{3}[-.\s]?\d{4}$
  • 用途:用于验证美国的电话号码格式,包括可选的括号、分隔符。

3、URL

  • 正则表达式:^(https?|ftp):\/\/[^\s/$.?#].[^\s]*$
  • 用途:用于验证URL的格式。

4、日期(YYYY-MM-DD)

  • 正则表达式:^\d{4}-\d{2}-\d{2}$
  • 用途:用于验证日期的格式,例如:2023-12-07。

5、IP地址

  • 正则表达式:^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$
  • 用途:用于验证IPv4地址的格式。

6、用户名(仅包含字母和数字,且长度为6-12字符)

  • 正则表达式:^[a-zA-Z0-9]{6,12}$
  • 用途:用于验证用户名的格式,只包含字母和数字,长度为6到12个字符。

7、密码(包含大小写字母、数字、特殊字符,且长度为8-16个字符)

  • 正则表达式:^(?=.*[a-z])(?=.*[A-Z])(?=.*\d)(?=.*[@$!%*?&])[A-Za-z\d@$!%*?&]{8,16}$
  • 用途:用于验证密码的格式,包含大小写字母、数字和特殊字符,长度为8到16个字符。

总结

正则表达式是一项强大而灵活的技能,它在许多编程语言和文本编辑器中都有广泛的应用。熟练地使用正则表达式可以大大提高文本处理和字符串操作的效率

我的其他博客

HTTP与HTTTPS的区别-CSDN博客

 

什么情况下会产生StackOverflowError(栈溢出)和OutOfMemoryError(堆溢出)怎么排查-CSDN博客

谈谈我对HashMap扩容机制的理解及底层实现-CSDN博客 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/208034.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

markdown记录

文章目录 基础操作使用一级列表、二级列表 博文链接 基础操作 使用一级列表、二级列表 博文链接 CSDN-Markdown语法集锦 CSDN-markdown语法之如何使用LaTeX语法编写数学公式 CSDN Markdown简明教程1-关于Markdown CSDN Markdown简明教程2-基本使用 CSDN Markdown简明教程3-表…

Bash脚本调用百度翻译API进行中文到英文的翻译

写一个bash脚本调用百度翻译API进行中文到英文的翻译,首先需要进行相关的申请。看百度给出的文档链接: 百度翻译API文档 需要先注册一个百度账号,然后申请APPID。脚本中会用到appid和key这两个值。按照文档给出的提示可以获得。如下是脚本: #…

使用VBA创建Excel条件格式

实例需求:数据总行数不确定,现需要将Category区域(即C列到J列)中第3行开始的区域设置条件格式,规则如下: 只对部分指定单元格应用色阶条件格式(3色)指定单元格应满足条件&#xff1…

移动距离

//偶数行需要反转,判断行数时,最后一个需要特判,可以用向上取整 //也可以把传入的值减一,下标从0开始 import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader;public class Main{static int w,m,n;static BufferedReader i…

大数据技术1:大数据发展简史

前言:学习大数据技术,知道会用已经够了,但是要想走得更远,应该了解它发展的来龙去脉,为何会有新的技术/工具的出现,相比老的技术有什么样的进步。 1、传统数据处理系统存在的问题 随着信息时代互联网技术爆…

JDBC简介及快速入门-黑马(P1)

黑马视频b站链接: 01-JDBC简介&快速入门_哔哩哔哩_bilibili 🐶一、JDBC 简介 JDBC 概念: JDBC 就是使用 Java 语言操作关系型数据库的一套 API。 全称(Java DataBase Connectivity) Java 数据库连接 JDBC 本质…

React 笔记 jsx

严格约定:React 组件必须以大写字母开头,而 HTML 标签则必须是小写字母。 React JSX JSX 是由 React 推广的 JavaScript 语法扩展。 用于表达组件的 特殊语法的 js 函数 要求标签必须闭合;返回的组件必须包裹在一个父标签内; …

鸿蒙4.0开发笔记之ArkTS语法基础之数据传递与共享详细讲解(十八)

文章目录 一、路由数据传递(router)1、路由数据传递定义2、路由数据传递使用方法3、数据传递两个页面的效果 二、页面间数据共享(EntryAbility)1、定义2、实现案例3、避坑点 三、数据传递练习 一、路由数据传递(router…

分布式和微服务区别

1.分布式 微服务和分布式的区别 1.将一个大的系统划分为多个业务模块,业务模块分别部署到不同的机器上,各个业务模块之间通过接口进行数据交互。区别分布式的方式是根据不同机器不同业务。 2.分布式是否属于微服务? 答案是肯定的。微服务的意…

动手制作个人电脑对话机器人transformers+DialoGPT

简介:DialoGPT是一个对话模型,由微软基于GPT-2训练。由于DialoGPT在对话数据上进行了预训练,所以它比原始的GPT-2更擅长生成类似对话的文本。DialoGPT的主要目标是生成自然且连贯的对话,而不是在所有情况下都提供事实上的正确答案…

Numpy数组的运算(第7讲)

Numpy数组的运算(第7讲)         🍹博主 侯小啾 感谢您的支持与信赖。☀️ 🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ…

进制 + 原码,反码,补码

进制转换 整数部分 小数部分 原码 反码 补码 原码转补码: 左边和右边第一个1不变,中间取反。-0 除外。 计算机系统中数值一律用补码来存储的原因 其他 术语 进制表 进制数的表示 详细教程可转 爱编程的大丙

数学建模-数据新动能驱动中国经济增长的统计研究-基于数字产业化和产业数字化的经济贡献测度

数据新动能驱动中国经济增长的统计研究-基于数字产业化和产业数字化的经济贡献测度 整体求解过程概述(摘要) 伴随着数据要素化进程的不断加深,对于数据如何作用于经济发展,数据与其他要素结合产生的动能应该如何测度的研究愈发重要。本文将数据新动能分…

机器人刚性碰撞任务的阻抗控制性能

问题描述 对于机器人刚性碰撞任务,阻抗控制可以有效地提高机器人的适应性和稳定性。 在刚性碰撞任务中,机器人在接触外部物体时需要快速适应并调整自身的运动轨迹和速度,以实现精确的操控和稳定的交互。阻抗控制可以通过调整机器人的阻抗参…

【Flink系列五】Checkpoint及Barrier原理

本章内容 一致性检查点从检查点恢复状态检查点实现算法-barrier保存点Savepoint状态后端(state backend) 本文先设置一个前提,流处理的数据都是可回放的(可以理解成消费的kafka的数据) 一致性检查点(che…

深度学习之注意力机制

注意力机制与外部记忆 注意力机制与记忆增强网络是相辅相成的,神经网络去从内存中或者外部记忆中选出与当前输入相关的内容时需要注意力机制,而在注意力机制的很多应用场景中,我们的外部信息也可以看作是一个外部的记忆 这是一个阅读理解任务…

Nodejs安装使用,nvm对Nodejs和npm版本控制

Nodejs 安装 使用: npm 是Nodejs的内置 包管理工具 下载长期支持版本Node.js 中文网Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境。Node.js 使用了一个事件驱动、非阻塞式 I/O 的模型,使其轻量又高效。Node.js 的包管理器 npm,是全…

在pytorch中自定义dataset读取数据

这篇是我对哔哩哔哩up主 霹雳吧啦Wz 的视频的文字版学习笔记 感谢他对知识的分享 有关我们数据读取预训练 以及如何将它打包成一个一个batch输入我们的网络的 首先我们来看一下之前我们在讲resnet网络时所使用的源码 我们去使用了官方实现的image folder去读取我们的图像数据 然…

xilinx的XVC协议

文章目录 概述JTAG工作方式XVC协议 其他Debug Bridge IP 概述 JTAG工作方式 XVC协议 其他 Debug Bridge IP

设计模式基础——概述(1/2)

目录 一、设计模式的定义 二、设计模式的三大类别 三、设计模式的原则 四、主要设计模式目录 4.1 创建型模式(Creational Patterns) 4.2 结构型模式(Structural Patterns) 4.3 行为型模式(Behavioral Patterns&…