正则表达式是一种用于匹配字符串模式的文本工具,它由一系列普通字符和特殊字符组成,可以非常灵活地描述和处理字符串。以下是正则表达式的一些基本组成部分及其功能:
- 普通字符:大多数字母和数字在正则表达式中表示它们自己。例如,'abc'将匹配字符串中的'abc'。
- 字符集合:使用方括号[]可以定义一个字符集合,用于匹配方括号内的任意一个字符。例如,'[abc]'将匹配任何一个a、b或c。
- 字符范围:在方括号中使用连字符(-)可以指定一个字符范围。例如,'[a-z]'将匹配任何小写字母。
- 特殊字符:某些字符在正则表达式中有特殊的意义,例如点号(.)通常匹配除换行符外的任意单个字符,而星号(*)表示前面的字符可以出现零次或多次。
- 限定符:限定符用来指定前面的字符或组合的出现次数,如加号(+)、星号(*)、问号(?)等。
- 转义字符:反斜杠()用来取消特殊字符的特殊意义,使其变为普通字符。
- 反向引用:通过编号捕获组的内容,并在正则表达式的后面部分引用它们。
- 零宽断言:这是一种不消耗字符位置的匹配方法,可以用来进行更复杂的匹配操作。
- 子表达式:圆括号()用来创建子表达式,这些子表达式可以在整个正则表达式中被引用或重复使用。
## 这里去掉*后.号后面少跟了一个符号,所以只算四个逗号的【,. , . ,. ,.】如左边所示
# .代表任意符号【内容】
*可以代表0次或多次,所以上面色字没有的也包括
如果用+号的话上面色字可以有一个或者多个,但0个的就不显示了
如果你要,后面至少有一个字符,那就用,.+ 而不是,.*
即+了问号为尽可能少,不加?号为尽可能多
【】里面.不用转义字符
^表示非的意思