目录
正则表达式RE
正则表达式基本元字符
正则表达式拓展元字符
正则表达式RE
正则表达式基本元字符
正则表达式拓展元字符
用来处理文本
正则表达式(Regular Expression, RE)是一种字符模式, 用于在查找过程中匹配指定的字符. 在大多数程序里, 正则表达式都被置于两个正斜杠之间;
例如/l[oO]ve/就是由正斜杠界定的正则表达式, 它将匹配被查找的行中任何位置出现的相同模式. 在正则表达式中,元 字符是最重要的概念
元字符使正则表达式具有处理能力。所谓元字符就是指ß那些在正则表达式中具有特殊意义的专用字符,可以用来规定 其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。
正则表达式基本元字符
基本正则表达式元字符 元字符示例 功能^ 行首定位符^love $ 行尾定位符love$ . 匹配单个字符l..e * 匹配前导符0到多次 全部匹配 grep "o*" /etc/passwdab*love .* 匹配任意多个字符 (贪婪匹配[] 匹配方括号中任意一个字符[lL]ove[ - ] 匹配指定范围内的一个字符[a-z0-9]ove [^] 匹配不在指定组里的字符[^a-z0-9]ove \ 用来转义元字符love\. \< 词首定位符 #由数字或字母组成的\<love\> 词尾定位符love\>
正则表达式拓展元字符
= 等于 != 不等于 =~ 匹配扩展正则表达式元字符+ 匹配一个或多个前导字符[a-z]+ove? 匹配零个或一个前导字符 lo?ve"r.*t" 贪婪匹配-P "r.*?" 非贪婪匹配a|b 匹配a或blove|hate() 组字符loveable|rslove(able|rs) ov+ ov+ (ov)+ (oo)+ 两个oo出现一次或者多个(..)(..)\1\2 标签匹配字符 #(love)able\1erx{m} 字符x重复m次o{5}o{,3} 字符最多出现3次x{m,} 字符x重复至少m次o{5,} 字符最少出现5次x{m,n} 字符x重复m到n次o{5,10}grep -E "o{3}" /etc/passwdgrep -P "\s" /etc/passwdgrep -P "\d" /etc/passwd