2019独角兽企业重金招聘Python工程师标准>>>
原文发表在: http://luy.li/2010/05/12/python-re/
延伸阅读:python的 内建函数 和 subprocess 。此文是本系列的第三篇文章了,和之前一样,内容出自官方文档,但是会有自己的理解,并非单纯的翻译。所以,如果我理解有误,欢迎指正,谢谢。
本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以是Unicode字符,这点不用担心,python会处理地和Ascii字符一样漂亮。
正则表达式使用反斜杆(\
)来转义特殊字符,使其可以匹配字符本身,而不是指定其他特殊的含义。这可能会和python字面意义上的字符串转义相冲突,这也许有些令人费解。比如,要匹配一个反斜杆本身,你也许要用'\\\\'
来做为正则表达式的字符串,因为正则表达式要是\\
,而字符串里,每个反斜杆都要写成\\
。
你也可以在字符串前加上 r 这个前缀来避免部分疑惑,因为 r 开头的python字符串是 raw 字符串,所以里面的所有字符都不会被转义,比如r'\n'
这个字符串就是一个反斜杆加上一字母n,而'\n'
我们知道这是个换行符。因此,上面的'\\\\'
你也可以写成r'\\'
,这样,应该就好理解很多了。可以看下面这段: