import re
查找时的注意事项,要查找的内容左右两边打出来,用真正的字符,不要用.*?,离查找内容远一点,再用.*?
a = '/aksj<a>哈哈哈<a><p>拉阿鲁<p>\.askjp'
b = re.findall('<a>(.*?)<a><p>(.*?)<p>',a)
print(b)
结果为:
[('哈哈哈', '拉阿鲁')]
匹配的结果为括号中的内容,其他的不会呈现(.*?)表示所有的内容
c = '"as"/\aksjlaacontent="我是你爸爸",assdad/'
d = re.findall('.*?content=(.*?),assdad',c)
print(d)
结果为:
['"我是你爸爸"']
不想打字符,可以用.*?替代
g = re.sub('[/<>]','我好快乐',c)
print(g)
结果为:
"as"我好快乐 ksjlaacontent="我是你爸爸",assdad我好快乐
把c中/尖括号替换为我好快乐,这里的中括号不能省
不然结果为:
"as"/ ksjlaacontent="我是你爸爸",assdad/
它识别不出来
h = re.sub('[a-z]','啦',c)
print(h)
结果为:
"啦啦"/ 啦啦啦啦啦啦啦啦啦啦啦啦啦="我是你爸爸",啦啦啦啦啦啦/
这里也必须要中括号,把所有的字母替换为啦
以后写还是加上中括号,还在前面加个r
m = 'h\njkshj'
k = re.sub('[\n]','',m)
print(k)
结果为:
hjkshj
这里要不要中括号都可以