pattern = re.compile("\d") 将正则表达式编译成一个Pattern规则对象
pattern.match() 从开始位置开始往后查找,返回第一个符合规则的对象
pattern.search() 从任何位置开始往后查找,返回第一个符合规则的对象
pattern.findall() 所有的全部匹配,返回列表
pattern.finditer() 所有的全部匹配,返回的是一个迭代器
pattern.split() 分割字符串,返回列表
pattern.sub() 替换
语法: pattern.match(str, start, end)
import re #导入re模块
pattern = re.compile(r'\d+') #此处加r表示不转义字符串
m = pattern.match('aaaa123bbb456')
m2 = pattern.match('aaaa123bbb456', 4,10)
print(m) # None
print(m2.group()) # 123
match在没有匹配到数据的时候返回的是 None
match匹配到数据后返回的是一个对象
re.I 表示忽略大小写
re.S 表示全部匹配
match分组匹配
import re
pattern = re.compile(r'([a-z]+) ([a-z]+)', re.I)
m = pattern.match('hello world Hello Python')
print(m.group()) # hello world
print(m.group(0)) # hello world
print(m.group(1)) # hello
print(m.group(2)) # world