Python正则表达式(re模块)的正确匹配详解

基本匹配及一些符号的特定含义

正则表达式是用于处理文本的强大工具,在Python中通过 re 模块来使用。 
基本匹配
- 首先要导入 re 模块。例如,要在字符串中查找简单的单词 apple ,可以这样写:

import re
text = "I have an apple."
match_result = re.search("apple", text)
if match_result:print(match_result.group())

这里 re.search() 函数会在 text 字符串中查找 apple ,如果找到就返回一个匹配对象,通过 group() 方法获取匹配的内容。
 
元字符
 
- 点(.)元字符:它可以匹配除换行符 \n 之外的任何单个字符。例如, re.search("a.e", "ape") 会匹配成功,因为 ape 中的 p 被 . 匹配。
- 星号(*)元字符:表示前面的字符可以出现0次或多次。如 re.search("ab*", "a") 会匹配,因为 b 出现了0次; re.search("ab*", "abbb") 也会匹配,因为 b 出现了多次。
- 加号(+)元字符:前面的字符至少出现1次。例如 re.search("ab+", "ab") 匹配,而 re.search("ab+", "a") 不匹配。
 
字符集
 
- 用方括号 [] 来表示字符集。例如 [aeiou] 可以匹配任何一个元音字母。 re.search("[aeiou]", "apple") 会匹配 a 。也可以使用范围,如 [a - z] 匹配所有小写字母。
 
重复次数
 
- 可以使用 {n} 来指定前面的字符恰好出现 n 次。如 re.search("a{2}", "aa") 匹配, re.search("a{2}", "a") 不匹配。 {n, m} 表示前面的字符出现次数在 n 到 m 之间。
 
分组
 
- 用括号 () 来分组。例如 re.search("(ab)+", "abab") ,会将 ab 作为一个组,整个 abab 匹配成功是因为 ab 出现了两次。

匹配特定数字(含匹配内容中日期案例,输出第一个符合格式日期第一个数字的位置)

在正则表达式中匹配特定数字有多种方式。
 
1.如果要匹配一个具体的数字,比如数字 5 ,可以直接写 5 。例如在Python的 re 模块中, re.search("5", "abc5def") 就可以匹配到字符串中的 5 。
 
2.如果要匹配一定范围内的数字,可以使用字符集。例如,要匹配 0 - 9 的数字,可以使用 [0-9] 。如 re.search("[0-9]", "a7b") 会匹配到 7 。
 
3.要是匹配多位数字,可以结合重复次数的限定符。比如 \d{3} 可以匹配连续的3位数字, \d 表示数字字符(等同于 [0 - 9] ), {3} 表示前面的字符出现3次。例如 re.search("\d{3}", "abc123def") 会匹配 123 。
 
4.如果要匹配至少一位数字,可以用 \d+ 。例如 re.search("\d+", "a1b") 会匹配 1 。

案例

完整代码:

import re
def find_date(input_string):pattern = r'((19[7-9]\d|20[01]\d)-(0[1-9]|1[0-2]))'match=re.search(pattern,input_string)if match:return match.start()+1else:return -1
str=input()
print(find_date(str))

结果演示

输入:现在的日期是2005-05
输出:7

匹配浮点数

在Python中使用正则表达式匹配浮点数,有以下几种常见方法。
 
可以用 re 模块来匹配简单的浮点数。浮点数的基本形式是整数部分、小数点和小数部分。例如,匹配包含一位或多位数字、一个小数点和一位或多位数字的浮点数,可以使用 \d+\.\d+ 这个正则表达式模式。

import re
text = "3.14 is a pi value"
match_result = re.search("\d+\.\d+", text)
if match_result:print(match_result.group())

如果浮点数前面可能有正负号,可以将模式修改为 [+-]?\d+\.\d+ 。其中 [+-]? 表示正负号可能出现0次或1次。


text = "-2.5 is a number"
match_result = re.search("[+-]?\d+\.\d+", text)
if match_result:print(match_result.group())

此外,还可以匹配科学计数法表示的浮点数。科学计数法如 1.23e-4 ,模式可以是 [+-]?\d+\.\d+[eE][+-]?\d+ 。 [eE] 用于匹配指数符号 e 或 E ,后面 [+-]?\d+ 用于匹配指数部分。

text = "1.23e-4 is a scientific number"
match_result = re.search("[+-]?\d+\.\d+[eE][+-]?\d+", text)
if match_result:print(match_result.group())

转义特殊字符

在正则表达式中,有些字符有特殊含义,如 * 、 + 、 ? 、 ^ 、 $ 、 . 、 ( 、 ) 、 [ 、 ] 、 { 、 } 、 | 、 \ 。如果想匹配这些字符本身,就需要转义。
 
转义的方法是在特殊字符前面加反斜杠 \ 。例如,要匹配字符 * ,正则表达式应写成 \* 。
 
以Python的 re 模块为例,如果要在字符串中查找 $ 符号,可以这样写:

import re
text = "The price is $10."
match_result = re.search("\$", text)
if match_result:print(match_result.group())

另外,在某些编程语言的字符串字面量中,反斜杠 \ 本身也可能是转义字符。所以在编写代码时,可能需要双重转义。例如在Python中, \\ 在字符串中表示 \ ,如果要匹配 \d ( d 不是转义后的特殊字符),在正则表达式字符串中要写成 \\d 。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/57570.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

flutter集成极光推送

一、简述 极光推送,英文简称 JPush,免费的第三方消息推送服务,官方也推出众多平台的SDK以及插件。 参考链接 名称地址客户端集成插件客户端集成插件 - 极光文档 二、操作步骤 2.1 添加插件 flutter项目中集成官方提供的 极光推送flutte…

能源管理系统

一、介绍 基于SpringCloud的能管管理系统-能源管理平台源码-能源在线监测平台-双碳平台源码-SpringCloud全家桶-能管管理系统源码 二、软件架构 二、功能介绍 三、数字大屏展示 四、数据采集原理 五、软件截图

小渡Al论文写作:50个GPT学术指令——1天搞定1篇论文

选题与研究方向 假设你是某高校某专业的教授,请根据我感兴趣的研究方向,为我提供10个新颖且有研究意义的论文选题。我对某个选题感兴趣,请列举几个该领域当前的研究热点和争议点供我选择。假设我是某专业本科生/研究生,请为我提供…

springboot集成pdfbox解析pdf文件

springboot集成pdfbox解析pdf文件 1、引入依赖2、获取PDF文件3、获取需要的字段信息4、获取多字段时&#xff0c;步骤3需要优化&#xff0c;以下为优化后代码 1、引入依赖 <dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</a…

iconfont图标放置在某个元素的最右边

在网页设计中&#xff0c;如果你想要将iconfont图标放置在某个元素的最右边&#xff0c;你可以通过CSS来实现这个布局。以下是一些基本的CSS代码示例&#xff0c;它们可以帮助你根据不同的布局需求将图标放置在最右边&#xff1a; 内联元素&#xff08;如<span>&#xff…

perl读取目录,写入文件

perl读取目录&#xff0c;写入文件 此脚本有两个输入参数&#xff0c;第一个参数为需要打印的文件目录&#xff0c;第二个参数为打印后的文件名&#xff1b; 该脚本名称为out_file_full_path #!/bin/perluse 5.010; my $dir $ARGV[0]; # 此为第一个参数&#xff1b; opendi…

Unreal Engine5安装Niagara UI Renderer插件

系列文章目录 文章目录 系列文章目录前言一、如何下载安装Niagara UI Renderer插件 前言 在2024.10.24号的今天发现unreal engine官网已经没有虚幻商城了&#xff0c;取而代之的是FAB ‌虚幻商城已经停止运营&#xff0c;Epic Games推出了新的数字资产商店FAB。‌ Epic Games…

Python URL编码

在 Python 中&#xff0c;可以使用 urllib.parse模块对 URL 进行编码。 一、依赖安装 pip install urllib 二、URL编码 from urllib.parse import quoteurl rhttps://myshop.com/shop/shopList?query query {"id":14,"pageSize":10,"pageNum&quo…

【论文+源码】基于SSM+VUE的大学生兼职管理系统

创建一个大学生兼职管理系统&#xff0c;结合 SSM&#xff08;Spring Spring MVC MyBatis&#xff09;框架和 Vue.js 前端框架&#xff0c;可以分为几个主要步骤来实现。 第一部分&#xff1a;环境准备 1. 开发环境准备 Java JDK&#xff1a;确保已安装 Java 8 或更高版本。…

2024软考网络工程师笔记 - 第8章.网络安全

文章目录 网络安全基础1️⃣网络安全威胁类型2️⃣网络攻击类型3️⃣安全目标与技术 &#x1f551;现代加密技术1️⃣私钥密码/对称密码体制2️⃣对称加密算法总结3️⃣公钥密码/非对称密码4️⃣混合密码5️⃣国产加密算法 - SM 系列6️⃣认证7️⃣基于公钥的认证 &#x1f552…

从0开始深度学习(19)——参数管理

在选择了模型架构&#xff0c;并设置了超参数之后&#xff0c;就进入了训练阶段&#xff0c;此时&#xff0c;我们的目标是找到使损失函数最小化的模型参数值。 经过训练后&#xff0c;我们将需要使用这些参数来做出未来的预测。 此外&#xff0c;有时我们希望提取参数&#xf…

电子商务类型

常见电子商务类型及其代表性的例子&#xff1a; B2B&#xff08;Business to Business&#xff09; 定义&#xff1a;B2B 模式是指企业与企业之间的商业交易。在这种模式下&#xff0c;企业通过电子商务平台相互提供产品或服务。 特点&#xff1a; 大宗交易&#xff1a;通常…

数据结构 ——— 顺序表和链表的区别以及各自的优缺点

目录 顺序表和链表的区别 一、存储空间上 二、下标的随机访问 三、任意位置插入或者删除元素 四、添加数据 五、应用场景 六、缓存利用率 顺序表和链表的优缺点 顺序表的缺点 链表的优点&#xff08;和顺序表的缺点对应&#xff09; 顺序表的优点 链表的缺点&#…

背包九讲——完全背包问题

目录 完全背包问题 问题定义 动态规划解法 状态转移方程 初始化 遍历顺序 三种解法&#xff1a; 朴素版——枚举k 进阶版——dp正推&#xff08;一维滚动数组&#xff09; 背包问题第三讲——完全背包问题 背包问题是一类经典的组合优化问题&#xff0c;通常涉及在限定…

简介openwrt系统下/etc/config/network文件生成过程

openwrt的network文件&#xff0c;或者说在/etc/config下的文件&#xff0c;都是动态生成的。 脚本的函数定义在package/base-files/files/lib/functions中&#xff0c;有以下几个文件&#xff1a; libraSVN:~/Wang_SP4/openwrt-d03dc49/package/base-files/files/lib/functi…

【Linux笔记】Linux命令与使用

博文将不断学习补充 学习参考博文&#xff1a; Linux命令大全&#xff1a;掌握常用命令&#xff0c;轻松使用Linux操作系统-CSDN博客 文件或目录操作命令 zip # zip是使用最多的文档压缩格式 # 方便跨平台使用&#xff0c;但是压缩率不是很高 zip指令未安装 安装zip yum ins…

python实战项目47:Selenium采集百度股市通数据

python实战项目47:Selenium采集百度股市通数据 一、思路分析二、完整代码一、思路分析 这里以获取百度股市通股评下的投票数据为例,页面中的其他数据同理。由于此页面数据是js动态加载的,所以采用Selenium获取数据。思路很简单,通过Selenium打开页面,然后定位到“股评”选…

Python闭包和修饰器

Python闭包和装饰器详解 1. 闭包&#xff08;Closure&#xff09; 闭包是Python中一个重要的概念&#xff0c;涉及嵌套函数和变量的作用域。 概念&#xff1a; 内外函数嵌套&#xff1a;闭包的形成通常涉及到一个外部函数和一个内部函数。内函数引用外函数作用域下的非全局变…

没有B柱?极氪MIX太大胆了!

文 | AUTO芯球 作者 | 雷慢 极氪又给国产车长脸了&#xff0c; 极氪MIX上市&#xff0c;创造了多个行业先例&#xff0c; 估计把合资看得一愣一愣的&#xff0c; 哪见过这样的每月都有新技术、黑科技冒出来&#xff0c; 我看完整个发布会就一个感想&#xff0c; 家里有小…

数据结构——哈夫曼树及其应用(哈夫曼编码)

判断树&#xff1a;用来描述分类过程的二叉树 哈夫曼树&#xff08;最优二叉树&#xff09;的基本概念 路径&#xff1a;从树中一个结点到另一个结点之间的分支构成这两个结点间的路径。 结点的路径长度&#xff1a;两结点间路径上的分支数。 结点的路径长度计算&#xff1…