Python 正则表达式2 语法基础

内容概述

正则表达式是由普通字符(例如"a",“b”,“c"等)以及特殊字符(例如”+“,”-“,”^"等)组成的文字模式。举个例子,[a-z]这个正则表达式就代表了匹配所有的小写字母(“a”,“b”,“c”,…,“y”,“z”),相关示例代码如下:

import re# 定义正则表达式模式
pattern = r'[a-z]'
# 待匹配的字符串
text = "AaBbCcDdEeFfG"
# 使用 split() 函数进行分割
split_text = re.split(pattern, text)
print(split_text)

输出

['A', 'B', 'C', 'D', 'E', 'F', 'G']

一般大写字母,小写字母,数字均为普通字符,其他字符中一部分是有特别含义的特殊字符(如"-"),其余部分为普通字符。特殊字符需要在后面的语法规则里面慢慢了解,记忆和掌握。

基本规则

正则表达式如果全面详细描述,其实语法内容也不少,但从实际应用来看,掌握小部分精华的规则就足够了。说实话,学习太多的规则,一来是记不住,二来是大概率用不上,所以从实用主义看没必要学习太多规则。

掌握三条核心规则就行:输入限定规则数量限定规则符号限定规则

输入限定规则

匹配输入[],匹配 […] 中的所有字符;匹配不输入[^],匹配除了 […] 中字符的所有字符。

举个例子,[abc][^abc],代码如下:

import re# 定义正则表达式模式
pattern = r'[abc]'
# 待匹配的字符串
text = "a1b2c3"
# 使用 split() 函数进行分割
split_text = re.split(pattern, text)
print(split_text)pattern = r'[^abc]'
split_text = re.split(pattern, text)
print(split_text)

输出

['', '1', '2', '3']
['a', 'b', 'c', '']

数量限定规则

如何控制匹配的字符数量呢?可以给符号后面加上有关数量的限定规则,比如n个a就表示为[a]{n},一个以上数量的a就表示为[a]+,也就是输入限定+数量限定的形式。看下面例子(注意,+对数量的匹配默认是贪婪的,来多少就吃多少,比如aaa只匹配1个结果,而不是3个分别匹配的a,要想反过来非贪婪,后面再加?即可):

import re# 待匹配的字符串
text = "I have three aaa."pattern = r'[a]{1}'
# 使用 split() 函数进行分割
split_text = re.split(pattern, text)
print(split_text)pattern = r'[a]{2}'
split_text = re.split(pattern, text)
print(split_text)pattern = r'[a]+'
split_text = re.split(pattern, text)
print(split_text)pattern = r'[a]+?'
split_text = re.split(pattern, text)
print(split_text)

输出

['I h', 've three ', '', '', '.']
['I have three ', 'a.']
['I h', 've three ', '.']
['I h', 've three ', '', '', '.']

更多参考:

* 零次或多次,贪婪模式
+ 一次或多次,贪婪模式
? 零次或一次
*? 零次或多次,非贪婪模式
+? 一次或多次,非贪婪模式
{n} n 次
{n,} 至少n次
{n,m} n到m次
{0,n} 最多n次

符号限定规则

首先得说明,正则表达式里面的括号()和四则运算一样能说明和改变运算的优先级,比如[a][b]{10}([a][b]){10}是不一样的,为了保证运算正确,需要用括号把[a][b]括起来才能保证我们要得到的是10个ab,不然没有括号就是a加10个b,因为数量限定会优先与前面一个输入限定进行运算。其次,有时候输入限定的括号[]也不是必须的,比如可以’(ab){10}’

除了普通字符,有些字符也有特殊含义,如下:

A-Z 大写字母
a-z 小写字母
0-9 一位数字
. 除换行符(\n、\r)之外的任何单个字符
\s 所有空白符,包括换行
\S 非空白符,不包括换行
\w 字母、数字、下划线
\d 任意一个阿拉伯数字(0 到 9)
\n 换行符
\r 回车符
\t 制表符
| 或,比如a|b表示a或b中的一个
\ 转义特殊符,如需要输入+就转义\+

符号限定里面的字符优先级地位差不多和普通字符一样,就类似文本里面的换行符用\n去表示一样

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/6049.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

这是一个简单网站,后续还会更新

1、首页效果图 代码 <!DOCTYPE html> <html> <head> <meta charset"utf-8" /> <title>爱德照明网站首页</title> <style> /*外部样式*/ charset "utf-8"…

什么是Vue的单文件组件(SFC)

Vue的单文件组件&#xff08;Single File Components&#xff0c;简称SFC&#xff09;是Vue.js框架中用来组织和编写组件的一种文件格式。简单来说&#xff0c;一个.vue文件就是一个单独的组件&#xff0c;它封装了组件的HTML模板、CSS样式和JavaScript逻辑。这种开发方式有助于…

Luminar开始为沃尔沃生产下一代激光雷达传感器

在自动驾驶技术的浪潮中&#xff0c;激光雷达&#xff08;LiDAR&#xff09;传感器以其高精度和强大的环境感知能力&#xff0c;逐渐成为了该领域的技术之星。Luminar&#xff08;路安达&#xff09;公司作为自动驾驶技术的领军企业&#xff0c;近日宣布已开始为沃尔沃汽车生产…

MySQL-笔记-08.数据库编程

目录 8.1 编程基础 8.1.1 基本语法 8.1.2 运算符与表达式 1. 标识符 2. 常量 &#xff08;1&#xff09; 字符串常量 &#xff08;2&#xff09;日期时间常量 &#xff08;3&#xff09;数值常量 &#xff08;4&#xff09;布尔值常量 &#xff08;5&#xff09;NULL…

牛客储物点的距离

链接&#xff1a;登录—专业IT笔试面试备考平台_牛客网 来源&#xff1a;牛客网 题目描述 一个数轴&#xff0c;每一个储物点会有一些东西&#xff0c;同时它们之间存在距离。 每次给个区间[l,r],查询把这个区间内所有储物点的东西运到另外一个储物点的代价是多少&#xff1…

如何使用免费软件从Mac恢复音频文件?

要从Mac中删除任何文件&#xff0c;背后是有原因的。大多数Mac用户都希望增加Mac中的空间&#xff0c;这就是为什么他们更喜欢从驱动器中删除文件以便出现一些空间的原因。一些Mac用户错误地删除了该文件&#xff0c;无法识别这是一个重要文件。例如&#xff0c;他们错误地从Ma…

小区服务|基于SprinBoot+vue的小区服务管理系统(源码+数据库+文档)

目录 基于SprinBootvue的小区服务管理系统 一、前言 二、系统设计 三、系统功能设计 1管理员登录 2 客服聊天管理、反馈管理管理 3 公告信息管理 4公告类型管理 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取&#xff1a; 博…

说一说具身人工智能

罗德尼布鲁克斯&#xff08;Rodney Brooks&#xff0c;现代机器人之父&#xff09;在 1991 年发表的研究论文《没有表征的智能》[1]提出了一种对智能的根本性重新思考。布鲁克斯反对传统的认为智能必须基于复杂算法或内部数据模型&#xff08;即“表征”&#xff09;的观点。他…

计算机网络复习-网络层

章节主要内容 虚拟互连网络 实际的计算机网络是错综复杂的物理设备通过使用ip协议&#xff0c;屏蔽了物理网络之间的差异当网络中的主机使用ip协议连接时&#xff0c;则无需关注网络细节 IP协议 ip协议使得复杂的实际网络变为一个虚拟互连的网络ip协议使得网络层可以屏蔽细…

综合案例(账号密码登录和SQL注入)

综合案例&#xff1a;账号密码登录与SQL注入 一、背景 假设我们有一个简单的用户登录页面&#xff0c;用户需要输入用户名和密码来登录系统。在后台&#xff0c;我们使用SQL查询语句来验证用户输入的用户名和密码是否与数据库中存储的相匹配。然而&#xff0c;如果我们在编写…

Debian 12 tomcat 9 catalina 日志信息 中文显示乱码

目录 问题现象 解决办法&#xff1a; 1、设定Debian locale 2、设定catalina.sh utf8字符集 问题现象 Debian 12 linux操作系统中&#xff0c;tomcat 9 catalina 启动日志输出 中文乱码 解决办法&#xff1a; 1、设定Debian locale 先确保系统本身就支持中文的 Debian …

Docker 虚拟机 WSL

WSL&#xff08;Windows Subsystem for Linux&#xff09;是Windows操作系统中的一个功能&#xff0c;它允许用户在Windows系统上运行Linux环境。它是一个兼容层&#xff0c;通过在Windows上运行一个Linux内核接口的实现来提供对Linux二进制文件的支持。 WSL提供了一个命令行界…

[CUDA 学习笔记] GEMM 优化: 双缓冲 (Prefetch) 和 Bank Conflict 解决

GEMM 优化: 双缓冲 (Prefetch) 和 Bank Conflict 解决 前言 本文主要是对 深入浅出GPU优化系列&#xff1a;GEMM优化&#xff08;一&#xff09; - 知乎, 深入浅出GPU优化系列&#xff1a;GEMM优化&#xff08;二&#xff09; - 知乎 以及 深入浅出GPU优化系列&#xff1a;GE…

操作系统:线程互斥|线程同步|锁的概念

目录 前言 1.线程互斥 1.1.互斥量|锁的使用 1.2.锁的本质 1.3.死锁 1.3.1.什么是死锁 1.3.2.死锁产生的4个必要条件 1.3.3.如何避免死锁 2.线程同步 2.1.知识引入 2.2.条件变量 2.2.1.为什么需要条件变量 2.2.2.条件变量接口 前言 进行这一章节的学习之前&#xf…

javaEE项目开发总结(前后端交互)

一、所需知识 1.javaSE&#xff1a;是Java语言最基础的部分&#xff1a;面向对象、常用类库 2.MySQL数据库&#xff1a;DDL、DML、DQL 3.web前端网页操作界面&#xff1a;htmlcssjs&#xff08;原生&#xff09;、vue&#xff08;js框架&#xff09;、elementUI&#xff08;…

25计算机考研院校数据分析 | 哈尔滨工业大学

哈尔滨工业大学&#xff08;Harbin Institute of Technology&#xff09;&#xff0c;简称哈工大&#xff0c; 校本部位于黑龙江省哈尔滨市&#xff0c;是由工业和信息化部直属的全国重点大学&#xff0c;位列国家“双一流”、“985工程”、“211工程”&#xff0c;九校联盟 、…

Word文件导出为PDF

Word文件导出为PDF 方法一、使用Word自带另存为PDF功能 打开需要转换为PDF格式的Word文件&#xff0c;依次点击【文件】➡【另存为】➡选择文件保存类型为.PDF 使用这种方法导出的PDF可能存在Word中书签丢失的情况&#xff0c;在导出界面点击&#xff0c;选项进入详细设置 勾…

Python中的`return`语句详解

Python中的return语句详解 对于初学Python或任何编程语言的人来说&#xff0c;理解函数如何返回值是非常重要的。在Python中&#xff0c;return语句用于从函数中返回结果。本篇博客将详细介绍return语句的基本用法&#xff0c;以及如何在不同情境中有效使用它。 什么是return…

PHP 类型比较常见方法

在 PHP 中&#xff0c;类型比较可以通过多种方式进行&#xff0c;具体取决于你希望达到的精确度和上下文。以下是一些关于 PHP 类型比较的重要概念和示例&#xff1a; 松散比较&#xff08;Loose Comparison&#xff09;&#xff1a;使用 或 ! 进行比较时&#xff0c;PHP 会尝…

U盘未初始化?别慌,数据还有救!

当我们将U盘插入电脑&#xff0c;期待地打开“我的电脑”或文件管理器&#xff0c;却发现U盘显示为未初始化&#xff0c;这种心情无异于一盆冷水浇头。但先别急着慌张&#xff0c;这篇文章将带你了解U盘未初始化的原因&#xff0c;并提供有效的数据恢复方案&#xff0c;让你在遭…