正则表达式基础

文章目录

  • 发现宝藏
  • 前言
  • 1. 正则表达式的定义
  • 2. 常见的正则表达式字符
  • 3. 经典示例
    • 3.1 匹配电子邮件地址
    • 3.2 匹配URL
    • 3.3 匹配日期
    • 3.4 匹配IP地址
    • 3.5 匹配HTML标签
    • 3.6 匹配电话号码
    • 3.7 匹配用户名

发现宝藏

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【宝藏入口】。

前言

为了巩固所学的知识,作者尝试着开始发布一些学习笔记类的博客,方便日后回顾。当然,如果能帮到一些萌新进行新技术的学习那也是极好的。作者菜菜一枚,文章中如果有记录错误,欢迎读者朋友们批评指正。
(博客的参考源码可以在我主页的资源里找到,如果在学习的过程中有什么疑问欢迎大家在评论区向我提出)

1. 正则表达式的定义

正则表达式(Regular Expression,简称Regex或RegExp)是一种用于描述字符串匹配规则的表达式。它是由普通字符(例如字母、数字)和特殊字符(称为元字符)组成的文本模式。正则表达式在文本处理、搜索和替换等操作中被广泛使用,提供了一种灵活、强大的方式来描述和匹配字符串的模式。

正则表达式的应用涵盖了多个领域,包括文本搜索、替换、数据验证、语法分析等。在编程中,常常使用正则表达式来进行字符串的模式匹配和处理。各种编程语言,如Java、Python、JavaScript等,都提供了对正则表达式的支持,使开发者能够更方便地利用这一强大的工具。

2. 常见的正则表达式字符

正则表达式的基本元素包括普通字符和元字符。普通字符表示它们自身,而元字符具有特殊含义,用于表示一类字符或字符的数量。

常见的正则表达式元字符包括:

元字符描述示例正则表达式示例匹配字符串
.匹配任意单个字符(除了换行)‘a.b’“aab”, “a1b”
^匹配字符串的开头‘^abc’“abcdef”, “abc123”
$匹配字符串的结尾‘xyz$’“123xyz”, “abcxyz”
*匹配前一个字符零次或多次’ a*b ’“b”, “aaab”
+匹配前一个字符一次或多次’ c+d ’“cd”, “cccd”
?匹配前一个字符零次或一次'e?f ’“ef”, “f”
[]字符类,匹配其中任意一个字符‘[aeiou]’“a”, “e”, “o”
[^]排除字符类,匹配非其中字符‘[^0-9]’“abc”, “$%”
\ |选择,匹配两者之一‘cat \ |dog’“cat”, “dog”
()分组,将多个模式组合为一个整体‘(ab)+’“ab”, “abab”
\转义字符,取消元字符的特殊含义‘\ .’“abc.def”, “123.45”
\d匹配任意数字‘\d{3}’“123”, “456”
\D匹配任意非数字字符‘\D{2}’“ab”, “$%”
\w匹配任意字母、数字或下划线‘\w+’“abc123”, “word_word”
\W匹配任意非字母、数字或下划线‘\W{3}’“$%#”, “123!”
\s匹配任意空白字符(空格、制表符等)’ \s ’" ", “\t”
\S匹配任意非空白字符‘\S+’“word”, “123!”

3. 经典示例

3.1 匹配电子邮件地址

1. 正则表达式示例:

\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b

2. 解析:

  • \b : 匹配单词边界
  • [A-Za-z0-9._%+-]+ : 匹配用户名部分,可以包含字母、数字、点、下划线、百分比、加号和减号
  • @ : 匹配 “@” 符号
  • [A-Za-z0-9.-]+ : 匹配域名部分,可以包含字母、数字、点和减号
  • \. : 匹配域名和顶级域之间的点
  • [A-Za-z]{2,} : 匹配顶级域,至少包含两个字母
  • \b : 匹配单词边界

3.2 匹配URL

1. 正则表达式示例:

^(https?|ftp):\/\/[^\s\/$.?#].[^\s]*$

2. 解析:

  • ^ : 匹配字符串的开头
  • (https?|ftp) : 匹配 “http”、“https” 或 “ftp”
  • :\ / \ / : 匹配 " : / /" 部分
  • [^\s\/$.?#]* : 匹配域名,不包含空格、斜杠、点、问号和井号
  • (\/[^\s]*)? : 匹配可选的路径部分,以斜杠开头,后面可以包含字母、数字和其他字符,但不能包含空格
  • $ : 匹配字符串的结尾

3.3 匹配日期

1. 正则表达式示例:

\b\d{4}[-/]\d{1,2}[-/]\d{1,2}\b

2. 解析:

  • \b : 匹配单词边界
  • \d{4} : 匹配四个数字,表示年份
  • [-/] : 匹配日期部分的分隔符,可以是短横线或斜杠
  • \d{1,2} : 匹配一到两个数字,表示月份和日期
  • \b : 匹配单词边界

3.4 匹配IP地址

1. 正则表达式示例:

\b(?:\d{1,3}\.){3}\d{1,3}\b

2. 解析:

  • \b : 匹配单词边界
  • (?:\d{1,3}\.){3} : 非捕获分组,匹配三次数字和点的组合,用于匹配前三个IP地址部分
  • \d{1,3} : 匹配IP地址的最后一部分,可以是一个到三个数字
  • \b : 匹配单词边界

3.5 匹配HTML标签

1. 正则表达式示例:

<("[^"]*"|'[^']*'|[^'">])*> 

2. 解析:

  • < : 匹配HTML标签的开始
  • ("[^"]*"|'[^']*'|[^'">])* : 匹配HTML标签内的内容,可以是双引号中的任意字符、单引号中的任意字符,或者除了单引号、双引号和大于号之外的任意字符
  • > : 匹配HTML标签的结束

3.6 匹配电话号码

1. 正则表达式示例:

\b\d{3}[-.]?\d{3}[-.]?\d{4}\b

2. 解析:

  • \b : 匹配单词边界
  • \d{3}[-.]? : 匹配三个数字,后面可以跟一个可选的短横线或点
  • \d{3}[-.]? : 再次匹配三个数字,后面可以跟一个可选的短横线或点
  • \d{4} : 最后匹配四个数字
  • \b : 匹配单词边界

3.7 匹配用户名

1. 正则表达式示例:

^[a-zA-Z0-9_-]{3,16}$

2. 解析:

  • ^ : 匹配字符串的开头
  • [a-zA-Z0-9_-]{3,16} : 匹配用户名,可以包含字母、数字、下划线和短横线,长度为3到16个字符
  • $ : 匹配字符串的结尾

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/591781.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

三、C语言中的分支与循环—while循环 (5)

本章分支结构的学习内容如下: 三、C语言中的分支与循环—if语句 (1) 三、C语言中的分支与循环—关系操作符 (2) 三、C语言中的分支与循环—条件操作符 与逻辑操作符(3) 三、C语言中的分支与循环—switch语句(4)分支结构 完 本章循环结…

虚拟机类加载机制

类的生命周期 类的生命周期指的是在Java程序中,一个类从编写到被加载、连接、初始化、使用、卸载的整个过程。类的生命周期可以分为以下几个阶段: 加载,验证,准备,解析,初始化,使用&#xff0…

2023年郑州轻工业大学软件学院数据结构实验五-查找与排序(详解+源码C语言版+运行结果)

实验要求 一、实验目的 1.掌握常用的查找和排序算法思想; 2.能够用所学过的查找和排序算法解决生活中的实际应用问题。 二、课程目标 支撑课程目标(4):能够在软件开发过程中,针对特定需求综…

Nginx 代理静态资源,解决跨域问题

😂 背景:移动端 H5 项目,依赖了一个外部的 JS 文件。访问时,出现跨域,导致请求被 block。 当前域名:https://tmcopss.test.com要访问的 JS 文件:https://tm.test.com/public/scripts/y-jssdk.j…

漏洞复现-海康威视网络对讲广播系统远程命令执行漏洞(附漏洞检测脚本)

免责声明 文章中涉及的漏洞均已修复,敏感信息均已做打码处理,文章仅做经验分享用途,切勿当真,未授权的攻击属于非法行为!文章中敏感信息均已做多层打马处理。传播、利用本文章所提供的信息而造成的任何直接或者间接的…

基于Java (spring-boot)的在线培训考试系统

一、项目介绍 在线培训系统是一款基于SpringBootVue开发的考试系统。一款多角色在线培训考试系统,系统集成了用户管理、角色管理、部门管理、题库管理、试题管理、试题导入导出、考试管理、在线考试、错题训练等功能,考试流程完善。 多角色:多…

SQL基础知识(一)

SQL 是一种非常常见的用于管理关系型数据库的语言。下面是一些最常见的 SQL 语句: SELECT: 用于从数据库中选择数据。 例子: SELECT column1, column2 FROM table_name;这将选择 table_name 中的 column1 和 column2。 如果你想选择所有列,可以使用 …

基于蝴蝶算法优化的Elman神经网络数据预测 - 附代码

基于蝴蝶算法优化的Elman神经网络数据预测 - 附代码 文章目录 基于蝴蝶算法优化的Elman神经网络数据预测 - 附代码1.Elman 神经网络结构2.Elman 神经用络学习过程3.电力负荷预测概述3.1 模型建立 4.基于蝴蝶优化的Elman网络5.测试结果6.参考文献7.Matlab代码 摘要:针…

【DOCKER】详细介绍以及如何创建管理DOCKER

介绍 Docker 什么是 Docker?简要介绍 Docker 的定义和基本概念。Docker 的优势和应用场景。为什么 Docker 在软件开发和部署中如此受欢迎? Docker 的核心概念 Docker 镜像:什么是 Docker 镜像?如何创建和管理 Docker 镜像&#xf…

100天精通Python(实用脚本篇)——第111天:批量将PDF转Word文档(附上脚本代码)

文章目录 专栏导读1. 将PDF转Word文档需求2. 模块安装3. 模块介绍4. 注意事项5. 完整代码实现6. 运行结果书籍推荐 专栏导读 🔥🔥本文已收录于《100天精通Python从入门到就业》:本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教…

前端Vue日常工作中--Vue路由相关

前端Vue日常工作中–Vue路由相关 文章目录 前端Vue日常工作中--Vue路由相关1.路由模式2.router和$route3.路由跳转4.路由守卫5.路由传参6.问题:Vue路由解决页面刷新参数丢失的问题 1.路由模式 Vue 路由模式主要有两种:哈希模式(Hash Mode&am…

GRU算法

前置知识:RNN,LSTM LSTM需要训练的参数很多,极消耗计算资源。GRU是一种LSTM的改进算法,参数更少,更容易训练。 它将忘记门和输入门合并成为一个单一的更新门,同时合并了数据单元状态和隐藏状态&#xff0…

CSS 缩减顶部动画

<template><!-- mouseenter"startAnimation" 表示在鼠标进入元素时触发 startAnimation 方法。mouseleave"stopAnimation" 表示在鼠标离开元素时触发 stopAnimation 方法。 --><!-- 容器元素 --><div class"container" mou…

c++ 变量详细解释

C 变量&#xff1a;详细解释 1. 变量声明和初始化 声明&#xff1a;告诉编译器变量的类型和名称。int number;初始化&#xff1a;为变量指定一个初始值。int number 10; // 声明并初始化2. 变量类型 基本类型&#xff1a;包括整数&#xff08;int, short, long&#xff09…

MATLAB指令

01--根据数学公式进行绘制 1.绘制连续函数 ①一元函数 t0:0.1:10; y3*t2; plot(t,y) ②一元二次函数 t0:0.1:10; yt.*t; plot(t,y) 注意此处应为点乘 ③一元3次 t0:0.1:10; yt.*t.*t; plot(t,y) ④y1/t t0:0.1:10; y1./t; plot(t,y) ⑤yexp(t) t0:0.1:10; yexp(2*t); p…

计算机基础面试题 |03.精选计算机基础面试题

&#x1f90d; 前端开发工程师&#xff08;主业&#xff09;、技术博主&#xff08;副业&#xff09;、已过CET6 &#x1f368; 阿珊和她的猫_CSDN个人主页 &#x1f560; 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 &#x1f35a; 蓝桥云课签约作者、已在蓝桥云…

Python爬虫---selenium基本使用

为什么使用selenium&#xff1f; 使用urllib.request.urlopen()模拟浏览器有时候获取不到数据,所以使用selenium (1) selenium是一个用于web应用程序测试的工具 (2) selenium 测试直接运行在浏览器中&#xff0c;就像真正的用户在操作一样 (3) 支持通过各种driver (FirfoxDri…

封装、继承、多态、重载:C++中的强大特性与代码设计

这里写目录标题 封装C语言封装风格C封装 继承多态多态的实现虚函数概念&#xff1a;虚表指针overloadoverwriteoverride抽象类 重载 封装 C中的封装是一种面向对象编程的概念&#xff0c;它将数据&#xff08;成员变量&#xff09;和操作&#xff08;成员函数&#xff09;封装…

23种设计模式Python版

目录 创建型模式简单工厂模式工厂方法模式抽象工厂模式单例模式原型模式建造者模式 结构型模式适配器模式桥接模式组合模式装饰器模式外观模式享元模式代理模式 行为型模式职责链模式命令模式解释器模式迭代器模式中介者模式备忘录模式观察者模式状态模式策略模式模板方法模式访…

改进YOLO系列 | YOLOv5/v7 更换主干网络之 ResNet50/ResNet101

论文地址:https://arxiv.org/abs/1512.03385v1 更深层的神经网络更难以训练。我们提出了一个残差学习框架,以便于训练比以往使用的网络更深层的网络。我们明确地将层重构为学习相对于层输入的残差函数,而不是学习无参考的函数。我们提供了全面的实证证据,表明这些残差网络…