python正则判断_Python 正则表达式

一、基础语法

1.1 语法速查

1.2 最简单的正则匹配

学习正则一般是从 match 和 search 函数开始,推荐教程。

match

match(pattern, string) 函数会从字符串的头部开始搜索,如果匹配到了 pattern 则将其结果存入 group 中,匹配到了几次就存入几次,如果没有匹配到则返回空。

import re

a = "Jack love Rose"

res = re.match(r"Jack", a)

if res:

print(res.group(0))

输出结果

Jack

search

如果想在句子中匹配某个单词应该使用 search() 函数,使用match() 函数是搜索不到的

import re

a = "Jack love coding!"

res1 = re.match(r"love", a)

res2 = re.search(r"love", a)

if res1:

print(res1.group(0))

if res2:

print(res2.group(0))

输出结果

love

如果匹配了多个结果,那么同样的,输出 group(2)、group(3)……

import re

a = "Jack love Rose and love coding!"

res = re.search(r"Jack (.*) and (.*) coding!", a)

if res:

print(res.group(1))

print(res.group(2))

输出结果

love Rose

love

match 和 search 函数适合于本身已经知道了有几个需要匹配项的情况,如果需要找出所有的匹配项,应该使用 findall,后面会讲到。

compile

函数声明

re.compile(pattern[, flags])

flags 是一个可选参数,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:

我们来尝试一下

import re

a = "Jack love Rose and love coding!"

# 忽略大小写

pattern = re.compile(r"JACK (.*) AND (.*) coding!", re.I)

res = pattern.match(a)

if res:

print(res.group(1))

print(res.group(2))

输出结果

love Rose

love

findall

在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

注意: match 和 search 是匹配一次, findall 匹配所有。

import re

pattern = re.compile(r'\d+') # 查找数字

result1 = pattern.findall('www.hao123baidu456.com')

result2 = pattern.findall('www.hao123baidu456.com', 0, 10) # 指定匹配范围

print(result1)

print(result2)

输出结果

['123', '456']

['123']

1.3 转义字符匹配

转义字符的匹配需要 "\" 做转义。匹配括号

import re

# 匹配括号里的内容

a = "www.hao123(baidu)456.com"

# 忽略大小写

pattern = re.compile(r"\((.*)\)")

res = pattern.findall(a)

print(res[0])

输出内容

baidu匹配$

$是一个特殊的字符,在正则中表示以某字符结尾,假设我们要匹配 $$ 中间的内容(经常在公式转换中使用),应该怎么写呢?

import re

a = "$y=x^2$"

# 匹配$$中间的内容

pattern = re.compile(r"\$(.*)\$")

res = pattern.findall(a)

print(res[0])

输出结果

y=x^2

其他的转义字符使用方式类似。

1.4 正则替换

Python 的re模块提供了re.sub用于替换字符串中的匹配项。函数声明如下

re.sub(pattern, repl, string, count=0, flags=0)【例 1】将字符串中的 s 替换为 A

import re

a = "this is hust"

pattern = re.compile(r"s")

res = re.sub(pattern, "A", a)

print(res)

输出结果

thiA iA huAt【例 2】将字符串中的 $A$ 替换为 `$A$`

import re

# replace $A$ to `$A$`

a = "设集合$a={1,2,3}$,求集合$a$的子集个数。"

b = re.sub(r'\$(.+?)\$', r'`$\1$`', a)

print(a)

print(b)

输出结果

设集合$a={1,2,3}$,求集合$a$的子集个数。

设集合`$a={1,2,3}$`,求集合`$a$`的子集个数。

这里有个注意的点, \1 表示匹配到的内容。【例 2】将字符串中的无效,测试替换为空字符

import re

a = "华中科技大学机械学院(无效)"

b = "华中科技大学紫菘公寓(测试)"

c = "华中科技大学无效紫菘测试公寓(西区)"

pattern = re.compile(u"(无效|测试)")

res1 = re.sub(pattern, "", a)

res2 = re.sub(pattern, "", b)

res3 = re.sub(pattern, "", c)

print(res1)

print(res2)

print(res3)

输出结果

华中科技大学机械学院()

华中科技大学紫菘公寓()

华中科技大学紫菘公寓(西区)

二、进阶用法

2.1 判断字符串是否为数字

import re

a = "-1234"

b = "-12.34"

c = ".34"

print(re.match(r'^[+-]?\d+$', a)) # 匹配int 1

print(re.match(r'^[+-]?[0-9].*$', a)) # 匹配int 2

print(re.match(r'^[+-]?\d*(\.)\d+$', b)) # 匹配float

print(re.match(r'^[+-]?\d*(\.)\d+$', c)) # 匹配float

print(re.match(r'^[+-]?\d*(\.)?\d+$', a)) # 匹配int 或 float

输出结果

2.2 去除括号中的内容

去除括号里的内容其实就是利用 re.sub 的替换功能

import re

a = "华中科技大学附属同济医院(西区)"

pattern = re.compile(u"\$(.*)\$")

res = re.sub(pattern, "", a)

print(res)

输出结果

华中科技大学附属同济医院

2.3 去除脏符号【例 1】因为平时工作中接触数据很多,经常需要对数据进行清洗,其中一个很重要的流程就是去除字符串中除了中文、英文、括号之外的所有字符,这个实现如下

import re

a = "华中科技大学机械学院 B240 (研究生工作室;电话联系)。"

pattern = re.compile(u"[^\u4e00-\u9fa50-9a-zA-Z()()]")

res = re.sub(pattern, "", a)

print(res)

输出结果

华中科技大学机械学院B240(研究生工作室电话联系)【例 2】括号内不是期或者区则删掉括号内容

import re

a = "华中科技大学紫菘公寓(一期)。"

b = "华中科技大学紫菘公寓(西)。"

pattern = re.compile(u"\((?!.*[区期]).*\)|\((?!.*[区期]).*\)")

res1 = re.sub(pattern, "", a)

res2 = re.sub(pattern, "", b)

print(res1)

print(res2)

输出结果

华中科技大学紫菘公寓(一期)。

华中科技大学紫菘公寓。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/435064.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

arcgis中字段计算器利用python比较大小

# -*- coding: utf-8 -*- z0 def numbersize(a,b):global zif(a>b):zaelif(a<b):zbelif(ab):zaelse:z99return z

程序员到底怎么了?

程序员到底怎么了&#xff0c;我们当然不否认有很多出色的程序员&#xff0c;他们生活的好&#xff0c;赚的也多&#xff0c;可是毕竟大多数都还是一般水平&#xff0c;很多还是挣扎在基本满足吃住的水平。特别深的问题&#xff0c;比如国家社会问题&#xff08;总有人会说我们…

python读取单波段影像dem

from osgeo import gdal import matplotlib.pyplot as plt ds gdal.Open(r"。。。\DEM1.tif") im_width ds.RasterXSize im_height ds.RasterYSize im_data ds.ReadAsArray(0, 0, im_width, im_height) plt.figure(figsize(20,18)) plt.imshow(im_data) plt.show…

qt int转换成qstring_「QT界面编程实例」创建颜色下拉框并改变窗体颜色(调色板)...

【实例】Qt创建窗体下拉框并改变窗体颜色&#xff1a;QPalette、QColor、QPixmap、QSize、QIcon、QStringList、QString本例是想创建一个颜色下拉框(颜色是自动从QColor中添加的)&#xff0c;当选择某个颜色时&#xff0c;改变对应窗体(控件)的颜色(背景色、字体颜色等)。主要函…

持久化雪花视图实例学习

【实例学习】在实践Pdf版书中P52的例子中&#xff0c;继续学习&#xff1a;NSMutableArray类The NSMutableArray class declares the programmatic interface to objects that manage a modifiable array of objects. This class adds insertion and deletion operations to th…

ubuntu12.04samba服务器配置

系统平台&#xff1a;VMware Workstation9.0 ubuntu12.04 首先要解决windows和linux网络连接问题&#xff1a; 在VMware Workstation9.0 “设置” 选项中&#xff0c;设置"网络" 网络连接1 选中“启用网络连接” 方式&#xff1a;NAT 网络连接2 选中“启用网络连…

arcgis字段计算器利用python按不同两列数据进行编号

示例 代码 # -*- coding: utf-8 -*- A=1 B=1 C=1 A1=1 B1=1 C1=1 A2=1 B2=1 C2=1 A3=1 B3=1 C3=1 A4=1 B4=1 C4=1 def a(name,bianhao):name=name.encode(utf-8);global A,B,C,A1,B1,C1,A2,B2,C2,A3,B3,C3,A4,B4,C4if(name==老虎洞村):if(bianhao==4):end="A"+str(A…

python抽卡游戏_【python爬虫】原神公测预抽卡活动自动化抽卡脚本(一小时免登陆)...

[Python] 纯文本查看 复制代码import requestsimport jsonimport time#pyinstaller -D -i favicon.ico crawl.pyclass Crawl():#初始化cookiesdef __init__(self):self.login_ticket "";self.account_id"";self.login_uid"";self.cookie_token&…

vs2010 sp1 安装 Silverlight4_Tools 提示 错误 解决办法

vs2010 sp1 在安装 Silverlight4_Tools 时提示我未安装相应版本的 vs 解决办法&#xff1a; HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\VisualStudio\10.0\Setup\VS\BuildNumber 将 "2052" 的值修改为 "10.0.30319"&#xff0c;然后安装Silverlight4Tools程序…

VMware Workstation网络连接的三种模式

经常要使用VMWare Workstation来在本地测试不同的操作系统&#xff0c;以前也搞不清楚网络连接三种模式&#xff0c;最近看了几篇文章才算明白。现总结如下&#xff1a; 1. VMware Workstation的虚拟网络组件 虚拟<网卡/网络适配器>&#xff1a;见下图。安装一个虚拟PC…

arcgis字段计算器利用python按两列要求编号

示例 代码 # -*- coding: utf-8 -*- A1 B1 C1 A11 B11 C11 A21 B21 C21 A31 B31 C31 A41 B41 C41 def a(name,bianhao):namename.encode(utf-8);global A,B,C,A1,B1,C1,A2,B2,C2,A3,B3,C3,A4,B4,C4if(namea):if(bianhao4):end"A"str(A)AA1elif(bianhao3):end"B…

python获取文件读写权限_Python 查看文件的读写权限方法

实例如下&#xff1a;# -*- coding: utf-8 -*-# author flynetcnimport sys, os, pwd, stat, datetime;LOG_FILE /var/log/checkDirPermission.log;nginxWritableDirs [/var/log/nginx,/usr/local/www/var,];otherReadableDirs [/var/log/nginx,/usr/local/www/var/log,];di…

dd , /dev/zero和/dev/null

dd 命令 功能&#xff1a;把指定的输入文件拷贝到指定的输出文件中&#xff0c;并且在拷贝过程中可以进行格式转换。可以用该命令实现 DOS 下的 diskcopy 命令的作用。先用 dd 命令把软盘上的数据写成硬盘的一个寄存文件&#xff0c;再把这个寄存文件写入第二张软盘上&#xf…

netpbm

netpbm是一款图形转换的工具。netpbm工具库格式转换命令.Netpbm是一个很好用的&#xff0c;很强大的命令方式图像处理程序&#xff0c;支持WINDOWS、LINUX及部分UNIX系统。将一幅png图像转成bmp格式。命令序列为&#xff1a;pngtopnm test.png > a.pnmppmtobmp -bpp24 a.pnm…

利用anaconda prompt打开jupyter notebook

切换盘符 到指定文件夹下 查看改文件夹下的文件夹 再其文件夹下打开jupyter notebook 或者 结果&#xff1a; 创建python3文件 编写代码&#xff08;运行代码快捷键ctrl enter​​​​​​​&#xff09;

rest接口_深度干货 | 测试REST服务接口

openEA开源社区开源&#xff0c;我们是认真的&#xff01;这里每天给大家呈现有价值的开源资讯&#xff0c;欢迎您的来稿与推荐&#xff0c;点击上方蓝色字&#xff0c;加入我们吧&#xff01;摘要&#xff1a;较新的BPM版本中&#xff0c;提供了SOAP和REST两种接口&#xff0c…

asp。net中常用的文件操作类

**文件操作类 **/ #region 引用命名空间 using System; using System.Collections.Generic; using System.Text; using System.IO; #endregionnamespace CommonUtilities { /// <summary> /// 文件操作类 /// </summary> public class FileHelper { #region 检测指…

修改linux开机画面

制作开机Logo方法一:Drivers/video/logo/logo_linux_clut224.ppm是默认的启动Logo图片&#xff0c;把自己的Logo图片&#xff08;png格式&#xff09;转换成ppm格式&#xff0c;替换这个文件&#xff0c; 同时删除logo_linux_clut224.c logo_linux_clut224.o文件 &#xff0c;重…

列表反向组成数字相加,并输出数组反向组成列表

# Definition for singly-linked list. #在节点ListNode定义中&#xff0c;定义为节点为结构变量。 #节点存储了两个变量&#xff1a;value 和 next。value 是这个节点的值&#xff0c;next 是指向下一节点的指针&#xff0c;当 next 为空指针时&#xff0c;这个节点是链表的最…

公众号jdk 获取手机号_如何获取公众号推文封面图

曾经有一张好看的图片摆在我的眼前&#xff0c;我却没能保存&#xff0c;等到失去的时候我才后悔莫及。如果上天能够给我一个再来一次的机会&#xff0c;我会对那张图片说三个字&#xff1a;我&#xff0c;要&#xff0c;你……现在大部分使用智能手机的小伙伴们&#xff0c;一…