python3 正则表达式模块re相关

# -*- coding:utf-8 -*-
# Author: Evan Mi
import re
"""
'.'     默认匹配除\n之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行
'^'     匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)
'$'     匹配字符结尾,或e.search("foo$","bfoo\nsdfsf",flags=re.MULTILINE).group()也可以
'*'     匹配*号前的字符0次或多次,re.findall("ab*","cabb3abcbbac")  结果为['abb', 'ab', 'a']
'+'     匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
'?'     匹配前一个字符1次或0次
'{m}'   匹配前一个字符m次
'{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果['abb', 'ab', 'abb']
'|'     匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'
'(...)' 分组匹配,re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c'\A'    只从字符开头匹配,re.search("\Aabc","alexabc") 是匹配不到的
'\Z'    匹配字符结尾,同$
'\d'    匹配数字0-9
'\D'    匹配非数字
'\w'    匹配[A-Za-z0-9]
'\W'    匹配非[A-Za-z0-9]
's'     匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t'
'(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})",
"371481199306143242").groupdict("city")结果{'province': '3714', 'city': '81', 'birthday': '1993'}最常用的匹配语法
re.match 从头开始匹配
re.search 匹配包含
re.findall 把所有匹配到的字符放到以列表中的元素返回string="abcdefg  acbdgef  abcdgfe  cadbgfe"regex=re.compile("((\w+)\s+\w+)")
print(regex.findall(string))
#输出:[('abcdefg  acbdgef', 'abcdefg'), ('abcdgfe  cadbgfe', 'abcdgfe')]
解释一下为什么这样的结果?很简单,当我们忽略括号,对整个字符串进行匹配的时候,要求是一到多个字母空格一到多个字母;
所以有两个结果'abcdefg  acbdgef'和'abcdgfe  cadbgfe',但是我们是有括号的,所以给结果也加上括号,结果就变成了
'((abcdefg)  acbdgef)'和'((abcdgfe)  cadbgfe)',然而findall要返回括号里面的内容,而我们这里匹配了两次,每次有两个括号,
所以只好把每次的两个括号放在一个tuple中来区别哪此匹配的,tuple中的内容就是两个括号中的值;所以结果为:
[('abcdefg  acbdgef', 'abcdefg'), ('abcdgfe  cadbgfe', 'abcdgfe')]regex1=re.compile("(\w+)\s+\w+")
print(regex1.findall(string))
#输出:['abcdefg', 'abcdgfe']
解释一下为什么这样的结果?很简单,当我们忽略括号,对整个字符串进行匹配的时候,要求是一到多个字母空格一到多个字母;
所以有两个结果'abcdefg  acbdgef'和'abcdgfe  cadbgfe',但是我们是有括号的,所以给结果也加上括号,结果就变成了
'(abcdefg)  acbdgef'和'(abcdgfe)  cadbgfe',然而findall只返回括号里面的内容,所以结果是
['abcdefg','abcdgfe']regex2=re.compile("\w+\s+\w+")
print(regex2.findall(string))
#输出:['abcdefg  acbdgef', 'abcdgfe  cadbgfe']
解释一下,这个没有括号了,两次匹配到的结果就是'abcdefg  acbdgef'和'abcdgfe  cadbgfe';没有括号,就在最外层默认加个括号,
变成了'(abcdefg  acbdgef)'和'(abcdgfe  cadbgfe)';所以结果是
['abcdefg  acbdgef', 'abcdgfe  cadbgfe'];findall()返回的是括号所匹配到的结果(如regex1),多个括号就会返回多个括号分别匹配到的结果(如regex),
如果没有括号就返回就返回整条语句所匹配到的结果(如regex2)。所以在提取数据的时候就需要注意这个坑print(re.sub('(.)\\1*', "2", test)) \1是代表第一个括号中的值
print(re.findall('(.)\\1*', test))
re.split 以匹配到的字符当做列表分隔符
re.sub      匹配字符并替换
"""

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/569188.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pageContext对象

这个对象代表页面上下文&#xff0c;该对象主要用于访问JSP之间的共享数据。使用pageContext可以访问page、request、session、application范围的变量。 pageContext是PageContext类的实例&#xff0c;它提供了如下两个方法来访问page、request、session、application范围的变量…

python3 Xml操作

读取xml内容&#xff1a;-*- coding:utf-8 -*- # Author: Evan Mi import xml.etree.ElementTree as ET tree ET.parse(test.xml) root tree.getroot() print(root.tag) # 一个节点有tag、attrib、text三个值 # tag是标签的名字 # text是标签的内容 # attrib是标签属性的字典…

【OpenCV学习笔记】2.1OpenCV基本数据类型

OpenCV提供了多种基本数据类型。虽然这些数据类型在C语言中不是基本类型&#xff0c;但结构都很简单&#xff0c;可将它们作为原子类型。可以在“…/OpenCV/cxcore/include”目录下的cxtypes.h文件中查看其详细定义。 数据类型中最简单的就是CvPoint。CvPoint是一个包含intege…

noi.ac #543 商店

我们考虑可并堆维护&#xff0c;从深到浅贪心选取。 用priority_queue启发式合并的话&#xff0c;是60pts: #include<iostream> #include<cstdio> #include<cstring> #include<algorithm> #include<cmath> #include<queue> #include<ct…

python3 os模块相关方法

# -*- coding:utf-8 -*- # Author: Evan Mi import os # 获取当前工作目录&#xff0c;即当前python脚本工作的目录路径 print(os.getcwd()) # 切换当前路径 os.chdir(c:/users) os.chdir(rc:\users) print(os.getcwd()) # 验证当前路径是否切换成功 # 返回当前目录的字符串名…

软件设计师--文件索引

问题&#xff08;题目&#xff09;如下图所示&#xff1a;这道题最中要的是理解什么是直接索引、一级间接索引、二级间接索引&#xff1a; 直接索引&#xff1a;地址项直接指向文件块 一级间接索引&#xff1a;地址项&#xff08;一层&#xff09;指向存放地址项&#xff08;二…

什么是格局、境界、眼界、眼光

格局&#xff1a;指人对认知范围内事物认知的程度到何种地步。 &#xff08;思想的深度、眼界的宽度、境界的高度、胸怀的广度决定格局。&#xff09; 境界&#xff1a;指人的思想觉悟和精神修养。 眼界&#xff1a;见识的广度。 眼光&#xff1a;观察鉴别能力。 转载于:https:…

python3 time datetime相关操作

time模块中的相关操作&#xff1a; # -*- coding:utf-8 -*- # Author: Evan Mi import time # 获得时间戳,当前时区的 print(time.time()) # 不传参数获得格林威治时间tuple&#xff0c;传入秒数的话就是把秒数转为tuple print(time.gmtime()) # 不传参数将获得当前时区的时间t…

python3 random模块操作

# -*- coding:utf-8 -*- # Author: Evan Mi import random # 产生一个 >0 并且 <1 的随机浮点数 print(random.random()) """ Get a random number in the range [a, b) or [a, b] depending on rounding. 获得一个[1,3)或者[1,3]范围内的随机浮点数&…

Floyd算法及其应用

Part I-Introduction Floyd算法是一种求图上多源最短路径的算法&#xff0c;适用于中小规模的图&#xff0c;思维简单易懂。 Floyd算法的实质是&#xff08;区间&#xff09;动态规划&#xff0c;在这里做一个简单的概述。 对于一个有\(n\)个结点的图&#xff0c; 令\(dis[i][j…

软件设计师--最早开始时间和最晚开始时间

题目如图所示&#xff0c;解法如下&#xff1a; 方法&#xff1a; 先求最早开始时间&#xff1a;A是开始节点&#xff0c;所以A的最早开始时间是0&#xff0c;并且最早开始时间等于最晚开始时间。等得到图中红色的部分。 其他节点的最早开始时间为以该节点作为弧头的所有有向…

声笔双拼单字效率分析

-----------------------声笔双拼单字效率分析-------------------------- 2 keys: 21 items, 99131909.00 times, covering 17.48 % 2 keys: 21 items, 99131909.00 times, covering 17.48 % 3 keys: 1774 items, 371822394.00 times, c…

软件设计师 --哈夫曼树的一个经典问题

题目如下&#xff1a;有很多人反应&#xff0c;他们怎么做都做不出正确的答案&#xff0c;结果发过他们画的哈夫曼树的图以后&#xff0c;发现图完全是错误的&#xff1b; 如下图所示&#xff1a;为什么错误的&#xff0c;因为在遇到有两个权重为17的树的时候&#xff0c;没有遵…

谈谈枚举和 那啥 那啥来着 哦 对对对 泛型!

枚举类型 是 用于声明一组命名的常数 的 基本数据类型&#xff08;值类型&#xff09;。enum <enum_name> { enumeration list }; 这个就是枚举一般用法。其中&#xff0c;enum_name 指定枚举的类型名称。enumeration list 是一个用逗号分隔的标识符列表。枚举列表中…

python3 shutil模块

# -*- coding:utf-8 -*- # Author: Evan Mi import shutil """ 主要作用是拷贝文件、拷贝文件的权限、状态信息以及压缩文件、移动文件、删除文件 """# 将一个文件对象的内容拷贝到另一个文件对象中,可以部分内容 """ f1 open(r…

mini2440烧写nor flash

1. 安装Setup_JLinkARM_V440.exe 2. 打开JLINK ARM 3. File->Open Project&#xff0c;打开 s3c2440a_embedclub.jflash4. Options->Project settings... 选择 Flash&#xff0c;点击 Select flash device&#xff0c;选中开发板对应的 Nor Flash 芯片型号。比 如 S29AL0…

软件设计师--判定覆盖,判定条件覆盖,条件组合覆盖--一个栗子

针对上图的一个判断条件&#xff0c;在这里将分别讨论判定覆盖、判定条件覆盖、条件组合覆盖的情况&#xff1a; 设T1A>3,T2B>3;为该判定节点的两个子条件。 (一&#xff09;判定覆盖&#xff1a; 所谓的判定覆盖就是让判定的真分支和假分支各执行一次&#xff0c;只要…

sqliteman install parameter

1、安装前准备系统要求&#xff1a;linuxQt库版本&#xff1a;一般都有2、安装文件 官网自行下载3、安装1&#xff09;这里用的pscp pscp .\sqliteman-1.2.2.tar.gz root192.168.30.140:/root/from_pscp2&#xff09;tar xf sqliteman-1.2.2.tar.gz3&#xff09;执行 cmake -D…

python3 多继承搜索__init__方法的两种策略

继承情形一&#xff1a;测试代码如下&#xff1a; class A(object):def __init__(self):print(A)class B(object):def __init__(self):print(B)class C(A):def __init__(self):print(C)class D(B): def __init__(self):print(D)class E(C, D):pass执行当前代码 xE()&#xff0c…

Unity Shader 屏幕后效果——Bloom外发光

Bloom的原理很简单&#xff0c;主要是提取渲染图像中的亮部区域&#xff0c;并对亮部区域进行模糊处理&#xff0c;再与原始图像混合而成。 一般对亮部进行模糊处理的部分采用高斯模糊&#xff0c;关于高斯模糊&#xff0c;详见之前的另一篇博客&#xff1a; https://www.cnblo…