以下是 Python 正则表达式常用特殊字符及其含义 的全面整理,涵盖了常见和重要的正则符号,以及它们的示例,适合用来写博客或学习使用:
Python 正则表达式常用特殊字符及其含义
1. .
(点号)
- 含义:匹配除换行符
\n
以外的任意单个字符。 - 示例:
import re pattern = r"a.b" print(re.match(pattern, "acb")) # 匹配成功,"a.b" 中间任意字符 print(re.match(pattern, "a\nb")) # 不匹配,中间是换行符
2. ^
(脱字符)
- 含义:匹配字符串的开头。
- 示例:
pattern = r"^Hello" print(re.match(pattern, "Hello world")) # 匹配成功 print(re.match(pattern, "world Hello")) # 不匹配
3. $
(美元符)
- 含义:匹配字符串的结尾。
- 示例:
pattern = r"world$" print(re.search(pattern, "Hello world")) # 匹配成功 print(re.search(pattern, "Hello world!")) # 不匹配
4. *
(星号)
- 含义:匹配前面的字符零次或多次。
- 示例:
pattern = r"ab*" print(re.match(pattern, "a")) # 匹配成功,b 出现零次 print(re.match(pattern, "abbb")) # 匹配成功,b 出现多次
5. +
(加号)
- 含义:匹配前面的字符一次或多次。
- 示例:
pattern = r"ab+" print(re.match(pattern, "ab")) # 匹配成功,b 出现一次 print(re.match(pattern, "a")) # 不匹配,至少需要一个 b
6. ?
(问号)
- 含义:匹配前面的字符零次或一次。
- 示例:
pattern = r"ab?" print(re.match(pattern, "a")) # 匹配成功,b 出现零次 print(re.match(pattern, "ab")) # 匹配成功,b 出现一次 print(re.match(pattern, "abb")) # 不匹配,b 出现两次
7. {n}
, {n,}
, {n,m}
(量词限定符)
- 含义:
{n}
:匹配前一个字符恰好 n 次。{n,}
:匹配至少 n 次。{n,m}
:匹配至少 n 次,至多 m 次。
- 示例:
pattern = r"ab{2,4}" print(re.match(pattern, "abb")) # 匹配成功,b 出现 2 次 print(re.match(pattern, "abbbb")) # 不匹配,b 超过 4 次
8. [...]
(字符类)
- 含义:匹配方括号内的任意字符。
[a-z]
:表示范围,匹配从a
到z
的任意字符。[^...]
:取反,匹配不在方括号内的任意字符。
- 示例:
pattern = r"[aeiou]" print(re.match(pattern, "apple")) # 匹配成功,匹配元音字母 'a'pattern2 = r"[^aeiou]" print(re.match(pattern2, "hello")) # 匹配 'h',不是元音字母
9. -
(连字符/减号)
- 含义:在字符类中,表示范围。
[a-z]
:从a
到z
。[A-Z]
:从A
到Z
。[-]
:如果-
出现在开头或结尾,匹配减号本身。
- 示例:
pattern = r"[a-z0-9]" print(re.match(pattern, "5")) # 匹配成功,数字在范围内 print(re.match(pattern, "g")) # 匹配成功,字母在范围内
10. |
(管道符)
- 含义:表示逻辑 "或",匹配左边或右边的规则。
- 示例:
pattern = r"cat|dog" print(re.match(pattern, "cat")) # 匹配成功 print(re.match(pattern, "dog")) # 匹配成功
11. ()
(分组和捕获)
- 含义:将多个字符作为一个整体进行匹配,并捕获组内容。
- 示例:
pattern = r"(ab)+" print(re.match(pattern, "abab")) # 匹配成功
12. \
(反斜杠)
- 含义:用于转义特殊字符,或表示特殊的匹配序列。
\d
:匹配数字[0-9]
。\s
:匹配空白字符(如空格、制表符)。\w
:匹配字母、数字和下划线[a-zA-Z0-9_]
。\D
、\S
、\W
:与上述序列的反义。
- 示例:
pattern = r"\d+" print(re.match(pattern, "12345")) # 匹配成功 print(re.match(pattern, "abc")) # 不匹配
13. \b
和 \B
(单词边界)
\b
:匹配单词边界。\B
:匹配非单词边界。- 示例:
pattern = r"\bcat\b" print(re.search(pattern, "a cat sat")) # 匹配成功,完整的单词 'cat'pattern2 = r"cat\B" print(re.search(pattern2, "concatenate")) # 匹配成功,'cat' 后非边界
14. 零宽断言 (Lookaround)
(?=...)
:正向肯定预查。(?!...)
:正向否定预查。(?<=...)
:后向肯定预查。(?<!...)
:后向否定预查。- 示例:
pattern = r"(?<=\$)\d+" print(re.search(pattern, "价格是$100")) # 匹配 '100',不包括 '$'
15. 命名组和引用
(?P<name>...)
:定义命名分组。(?P=name)
:引用命名分组。- 示例:
pattern = r"(?P<number>\d+)\s+(?P=number)" print(re.match(pattern, "123 123")) # 匹配两个相同的数字
以上内容全面涵盖了 Python 正则表达式中的常用特殊字符及其含义,并结合示例展示了每个符号的实际用法,适合用于博客或深入学习。