Python基础课堂最后一课23——正则对象

文章目录

  • 前言
  • 一、正则对象是什么?
  • 二、正则表达式基本分类
    • 1.普通字符
    • 2.元字符
  • 总结


前言

很开心能和你们一些学习进步,在这一个多月的时间中,是你们让我坚持了下来,完成了python基础课堂编写,不管如何,我们或多或少都会有所收获,到此,基础课堂也就告一段落了。在不久的将来我将会进行爬虫栏目的编写,感兴趣的uu可以提前关注我,让我们继续学习进步!!!


一、正则对象是什么?

正则对象是在使用正则表达式时创建的对象。它可以用来进行字符串匹配、替换、提取等操作。正则对象包含了正则表达式的模式以及一些可选的标志,可以根据这些模式和标志来进行匹配操作。

接下来让我们详细了解一下正则表达式吧

介绍:在实际开发过程中经常会有查找符合某些复杂规则的字符串的需要,比如:邮箱、图片地址,手机号码等,这时候想匹配或者查找符合某些规则的字符串就可以使用正则表达式了。

概念:正则表达式就是记录文本规则的代码

表达式: 0\d{2}-\d{8}这个就是一个正则表达式,表达的意思是匹 配的是座机号码。

优缺点
1. 正则表达式的语法很令人头疼﹐可读性差
2. 正则表达式通用性很强﹐能够适用于很多编程语言

二、正则表达式基本分类

1.普通字符

见名知意,就是想要找到那个字符就直接输入该字符即可,比较简单常见,这里就不再过多介绍了。

2.元字符

  1. 匹配单个字符

分类:(在这里需要用到re模块,使用的时候下载导入即可)
元字符的分类
代码如下(示例):

print(re.findall('.', 'hello Abner world 123'))  # ['h', 'e', 'l', 'l', 'o', ' ', 'A', 'b', 'n', 'e', 'r', ' ', 'w', 'o', 'r', 'l', 'd', ' ', '1', '2', '3']
print(re.findall('\w', 'hello Abner world 123__'))  # ['h', 'e', 'l', 'l', 'o', 'A', 'b', 'n', 'e', 'r', 'w', 'o', 'r', 'l', 'd', '1', '2', '3', '_', '_']
print(re.findall('\s', 'hello Abner world 123'))  # [' ', ' ', ' ']
print(re.findall('\d', 'hello Abner world 123'))  # ['1', '2', '3']
print(re.findall('\n', 'hello Abner \n world 123'))  # ['\n']
print(re.findall('\t', 'hello Abner world 123'))  #[]
print(re.findall('\d{11}', '我的电话号码是:12345678901'))  # ['12345678901']
print(re.findall('[^0-9]', '我的电话号码是:12345678901'))  # ['我', '的', '电', '话', '号', '码', '是', ':']
print(re.findall('[0-9]', '我的电话号码是:12345678901'))  # ['1', '2', '3', '4', '5', '6', '7', '8', '9', '1', '0']
  1. 匹配多个字符(需要用到量词)

量词:控制元字符出现的次数
量词
代码如下(示例):

# 注意:量词都只作用于前一个字符
# 1 *:前一个字符重复0次或更多次
res = re.findall('b*','abbbbbbabbbbabbab')
print(res)# 2 +:前一个字符最少出现一次,最多任意次
res = re.findall('b+','abbbbbbabbbbabbab')
print(res)# 3 ?:前一个字符最少出现0次,最多只重复一次
res = re.findall('b?','abbbbbbabbbbabbab')
print(res)# 4 {n}:前一个字符匹配n次
# {n,}:前一个字符匹配n次或更多次,最少匹配n次,大于n次会匹配到
# {n,m}:前一个字符最少出现n次,最多出现m次。 只在范围内res = re.findall('1\d{10}','16451556455')
print(res)
  1. 匹配开头和结尾
# 1  ^ 匹配固定字符的开始
res = re.findall('^1\d{10}','16451556455')
print(res)
# 2  $ 匹配固定字符串的结尾
tel_li = ['15875845987','19945857694','17586945698','17584593658']
for tel in tel_li:res = re.findall('^1\d{9}8$',tel)if res:print(res[0])# 3 a|b  匹配字符a或b
# 注意:|是分开的两个表达式
res = re.findall('\d{6,10}@qq|sina.com','1258458@qq.com  594554@sina.com')
print(res)# 4 () 在符合整个正则表达式的情况下,只把括号里的正则表达式数据提取出来
str1 = """
<h1>一级标题</h1>
<div>盒子</div>
<span>span标签</span>
<a>超链接</a>
"""
res = re.findall('>(.+)<',str1)
print(res)
  1. 贪婪和非贪婪
    贪婪:在获取数据的时候有多少就要多少
    非贪婪:相反 越少越好 没有都可以

.* .+ 满足匹配的情况下,匹配尽可能长的字符串

.*? 在满足匹配的时候 尽可能的匹配最少的字符
1.re.findall()
作用:从头到尾开始匹配,找到所有符合正则表达式的数据,返回一个列表;如果没有找到,返回的是一个空列表

str1 = "今天下课后我们一起玩游戏,去玩英雄联盟游戏,玩到天亮,玩一个晚上的游戏"
# 提取 玩的是什么游戏?
res = re.findall('玩.*游戏',str1)  # ['玩游戏,去玩英雄联盟游戏,玩到天亮,玩一个晚上的游戏']
res = re.findall('(玩.*?游戏)',str1)  # ['玩游戏', '玩英雄联盟游戏', '玩到天亮,玩一个晚上的游戏']
res = re.findall('去玩(.*?)游戏,',str1)  # ['英雄联盟']
print(res)

2.re.search()
作用:检测到一次结果直接把数据返回 ,返回的是一个match ,.group()提取数据

res = re.findall('\d+', '我的电话号码:10086,它的电话:10010')
print(res)  # ['10086', '10010']res = re.search('\d+', '我的电话号码:10086,它的电话:10010')
print(res)  # <re.Match object; span=(7, 12), match='10086'>
print(res.group())

3.re.match()
特点:只能从头部开始匹配,数据结果在中间匹配不到,返回的是None如果提取数据会报错(空没有group报错)

res = re.match('\d+', '我的电话号码:10086,他的电话:10010')
print(res)  # None  头部不符合正则表达式的规则就是Noneres = re.match('\d+', '10086,它的电话:10010')
print(res)
print(res.group())   # 跟^

总结

最后,祝愿我们的未来越来越来,每个人都能活出属于自己的人生!

当你想要放弃的时候想想当初为什么坚持到这里。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/743420.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux系统——Nginx脚本拦截拓展

可能会有些无聊的人对服务器的Nginx服务进行恶意访问网站、API接口&#xff0c;会影响到用户的体验&#xff0c;我们可以做一个简单的脚本对恶意访问的IP做一个有效的拦截&#xff0c;揪出这些IP地址&#xff0c;然后将其进行禁用。 在Nginx的conf目录下新建一个blockip.conf文…

certificate has expired or is not yet valid:npm和node证书过期问题

在 1 月 22 日&#xff0c;淘宝原镜像域名&#xff08;registry.npm.taobao.org&#xff09;的 HTTPS 证书正式到期。如果想要继续使用&#xff0c;需要将 npm 源切换到新的源&#xff08;registry.npmmirror.com&#xff09;&#xff0c;否则会报错。 解决方案切换到新的源&a…

HTML表单

本文章属于学习笔记&#xff0c;在https://www.freecodecamp.org/chinese/learn/2022/responsive-web-design/中练习 四、HTML表单 CSS 1、vh单位表示视口高度&#xff0c;等于视口高度的1%。这使得它相对于视口高度。height:100vh; 2、设置 body 的默认 margin 为 0 来重置…

【掌握版本控制:Git 入门与实践指南】远程操作|标签管理

&#x1f3ac;慕斯主页&#xff1a;修仙—别有洞天 ♈️今日夜电波&#xff1a;泥中に咲く—ウォルピスカーター 0:34━━━━━━️&#x1f49f;──────── 4:46 &#x1f504; ◀️ ⏸ ▶…

汽车IVI中控开发入门及进阶(十三):语音识别

前言: IVI中控上的语音识别,在目前市场上也是非常显眼的一个创新,大幅改变了传统IVI的操作习惯。 语音识别Speech recognition,也称为自动语音识别(ASR)、计算机语音识别或语音到文本,是一种使程序能够将人类语音处理成书面格式的能力。 语音识别Speech recognition是计…

数码管的静态显示(二)

1.原理 要按照上图的顺序传递位选和段选的数据。 因为q0是最高位&#xff0c;共阳极数码管结构是dp....a&#xff0c;所以应该先传入低位a&#xff0c;而a在上图中的8段2进制编码中是seg[7]&#xff0c;所以段选信号的顺序是seg[0],...seg[7]。 因为输出信号是两个时钟&#x…

Docker入门笔记(1)

Docker入门笔记&#xff08;1&#xff09; 容器技术入门 之前我的WIT问卷管理系统在阿里云上部署需要好多配置&#xff0c;各个环境耦合的比较紧密&#xff0c;花了不少时间去做部署和调配。 现在有了Docker以后&#xff0c;我们可以把各种组件配置好&#xff0c;然后打包成…

使用ScottPlot库在.NET WinForms中快速实现大型数据集的交互式显示

前言 在.NET应用开发中数据集的交互式显示是一个非常常见的功能&#xff0c;如需要创建折线图、柱状图、饼图、散点图等不同类型的图表将数据呈现出来&#xff0c;帮助人们更好地理解数据、发现规律&#xff0c;并支持决策和沟通。本文我们将一起来学习一下如何使用ScottPlot库…

websocket逆向案例

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、案例地址二、分析流程三、逆向参数四、webSocket 交互位置总结 前言 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;不提供…

OPPO后端二面,凉了!

这篇文章的问题来源于一个读者之前分享的 OPPO 后端凉经&#xff0c;我对比较典型的一些问题进行了分类并给出了详细的参考答案。希望能对正在参加面试的朋友们能够有点帮助&#xff01; Java String 为什么是不可变的? public final class String implements java.io.Seri…

‘UnityEngine.Application‘ does not contain a definition for isBatchMode

unity 2017.4.37f1. 解决办法: Try to replace Application.isBatchMode with UnityEditorInternal.InternalEditorUtility.inBatchMode

Ps:拾色器

在 Adobe 拾色器中&#xff0c;可以使用四种颜色模型来设置颜色&#xff1a;HSB、RGB、Lab 和 CMYK。 使用“拾色器”对话框可以设置前景色、背景色、填充颜色、文本颜色及专色等的颜色值。 ◆ ◆ ◆ 常用操作方法与技巧 1、注意观察“拾色器”对话框标题栏中括号里的内容&am…

Kafka MQ 生产者

Kafka MQ 生产者 生产者概览 尽管生产者 API 使用起来很简单&#xff0c;但消息的发送过程还是有点复杂的。图 3-1 展示了向 Kafka 发送消息的主要步骤。 我们从创建一个 ProducerRecord 对象开始&#xff0c;ProducerRecord 对象需要包含目标主题和要发送的内容。我们还可以…

windows ffmpeg 编译环境搭建

编译ffmpeg https://www.msys2.org/ https://www.ffmpeg.org/platform.html#Microsoft-Visual-C_002b_002b-or-Intel-C_002b_002b-Compiler-for-Windows 1.安装msys2 2.安装yasm或者nasm 打开VC 本地环境命令行 唤醒msys2界面 配置编译环境变量参数 export PATH"/d/vs…

Dynamo处理Excel——调用Microsoft.Office.Interop.Excel教程

你好&#xff0c;这里是BIM的乐趣&#xff0c;我是九哥~ 今天我们来聊聊如何通过Dynamo处理Excel数据以及格式&#xff0c;Dynamo自带的节点肯定是不行&#xff0c;所以我们需要来用Python解决&#xff08;当然有个节点包 Bumblebee&#xff0c;我在案例百解教程里有过介绍&a…

如何实现sam(Segment Anything Model)|fastsam模型

sam是2023年提出的一个在图像分割领域的大模型&#xff0c;其具备了对任意现实数据的分割能力&#xff0c;其论文的介绍可以参考 https://hpg123.blog.csdn.net/article/details/131137939&#xff0c;sam的亮点在于提出一种工作模式&#xff0c;同时将多形式的prompt集成到了语…

短剧在线搜索源码(全网首发)

一个非常哇塞的在线短剧搜索页面&#xff0c;接口已经对接好了&#xff0c;上传源码到服务器解压就能直接用&#xff0c;有能力的可以自己改接口自己写自己的接口 接口文档地址&#xff1a;doc.djcat.sbs 源码下载地址&#xff1a;https://pan.xunlei.com/s/VNstN8C6N3VK1a1k…

使用Docker在windows上安装IBM MQ

第一步、安装wsl 详见我另一篇安装wsl文章。 第二步、安装centos 这里推荐两种方式&#xff0c;一种是从微软商城安装&#xff0c;一种是使用提前准备好的镜像安装&#xff0c;详见我另一篇windos下安装centos教程。 第三步、安装windows下的Docker desktop 详见我另一篇wind…

【牛客】HJ62 查找输入整数二进制中1的个数

题目链接&#xff1a;查找输入整数二进制中1的个数_牛客题霸_牛客网 (nowcoder.com) 解题思路&#xff1a; 解法一: 可以举一个八位的二进制例子来进行分析&#xff0c;对于二进制操作&#xff0c;我们直到&#xff0c;除以一个2&#xff0c;原来的数字会减少一个0.如果除的过程…

Window API 使用的一些注意事项

文章目录 1、LPCWSTR类型2、LPCTSTR类型3、LPCSTR类型4、LPCTSTR和LPCWSTR区别5、LPCTSTR和LPCSTR、LPCWSTR三者区别6、_T(" ")7、DWORD类型转换为std::wstring类型8、char类型转换为LPCSTR类型9、获取当前时间戳(毫秒)10、std::wstring和LPCSTR区别11、std::wstring…