目录
- Python快速上手(十九)
- Python3 正则表达式
- 1. 导入re模块
- 2. 基本匹配
- 3. 搜索
- 4. 替换
- 5. 匹配组
- 6. 修饰符
- 7. 特殊字符
- 8. 贪婪与非贪婪匹配
- 9. 自定义字符集
- 10. 转义字符
- 11.正则表达式实例
Python快速上手(十九)
Python3 正则表达式
Python 3中的正则表达式是一种强大的工具,用于在字符串中搜索和匹配模式。正则表达式是一种由晦涩符号组成的特殊文本模式,可以用来描述、识别和匹配字符串。在Python中,我们可以使用内置的re模块来操作正则表达式。
1. 导入re模块
首先,我们需要导入Python中的re模块,这个模块包含了正则表达式的所有功能。
import re
2. 基本匹配
通过re模块,我们可以使用re.match()函数来尝试从字符串的起始位置匹配一个模式。如果匹配成功,返回一个匹配对象;如果匹配失败,返回None。
pattern = r"hello"
string = "hello world"
match = re.match(pattern, string)
if match:print("Match found: ", match.group())
else:print("No match")
3. 搜索
re.search()函数用于在字符串中搜索匹配模式的第一个位置。如果匹配成功,返回一个匹配对象;如果匹配失败,返回None。
pattern = r"world"
string = "hello world"
search = re.search(pattern, string)
if search:print("Match found: ", search.group())
else:print("No match")
4. 替换
re.sub()函数可以用来替换字符串中的模式。
pattern = r"world"
string = "hello world"
replace = re.sub(pattern, "Python", string)
print(replace) # Output: hello Python
5. 匹配组
正则表达式中的括号可以用来创建匹配组,可以通过group()方法获取匹配组的值。
pattern = r"(\w+) (\w+)"
string = "John Doe"
match = re.match(pattern, string)
if match:print("First Name:", match.group(1))print("Last Name:", match.group(2))
6. 修饰符
在正则表达式中,可以使用修饰符来修改匹配的行为,比如忽略大小写、多行匹配等。
pattern = r"python"
string = "Python is awesome"
match = re.search(pattern, string, re.IGNORECASE)
if match:print("Match found: ", match.group())
7. 特殊字符
正则表达式中有一些特殊字符具有特殊含义,比如.匹配任意字符,\d匹配数字,\w匹配字母数字字符等。
pattern = r"\d+"
string = "There are 123 apples"
match = re.search(pattern, string)
if match:print("Number found: ", match.group())
8. 贪婪与非贪婪匹配
正则表达式默认是贪婪匹配,会尽可能多地匹配字符。在量词后加上?可以实现非贪婪匹配。
pattern = r"<.*>"
string = "<html><head><title>Title</title>"
match = re.match(pattern, string)
if match:print("Greedy match: ", match.group())pattern = r"<.*?>"
match = re.match(pattern, string)
if match:print("Non-greedy match: ", match.group())
9. 自定义字符集
可以使用[]来定义一个字符集,匹配字符集中的任意一个字符。
pattern = r"[aeiou]"
string = "Hello"
match = re.search(pattern, string)
if match:print("Vowel found: ", match.group())
10. 转义字符
如果想匹配特殊字符本身,需要使用转义字符\。
pattern = r"\$"
string = "Price: $100"
match = re.search(pattern, string)
if match:print("Match found: ", match.group())
11.正则表达式实例
实例 | 描述 |
---|---|
[Pp]ython | 匹配 “Python” 或 “python” |
rub[ye] | 匹配 “ruby” 或 “rube” |
[aeiou] | 匹配中括号内的任意一个字母 |
[0-9] | 匹配任何数字。类似于 [0123456789] |
[a-z] | 匹配任何小写字母 |
[A-Z] | 匹配任何大写字母 |
[a-zA-Z0-9] | 匹配任何字母及数字 |
[^aeiou] | 除了aeiou字母以外的所有字符 |
[^0-9] | 匹配除了数字外的字符 |
. | 匹配除 “\n” 之外的任何单个字符。要匹配包括 ‘\n’ 在内的任何字符,请使用象 ‘[.\n]’ 的模式。 |
\d | 匹配一个数字字符。等价于 [0-9]。 |
\D | 匹配一个非数字字符。等价于 [^0-9]。 |
\s | 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。 |
\S | 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。 |
\w | 匹配包括下划线的任何单词字符。等价于’[A-Za-z0-9_]'。 |
\W | 匹配任何非单词字符。等价于 ‘[^A-Za-z0-9_]’。 |