对于正则表达式,开发者如何跳出云里雾里的谜团?
作者 | Chris Achard
译者 | 弯月,责编 | 郭芮
出品 | CSDN(ID:CSDNnews)
以下为译文:
正则表达式能在字符串中查找匹配特定模式的子字符串。
在JavaScript中,可以通过斜线 / / 来创建,也可以通过new RegExp来创建,然后就能使用match、test、replace等方法。你可以事先定义正则表达式,也可以在调用方法时随时定义。
每次匹配一个字符,将多个字符放到方括号 中可以匹配多个匹配的字符。
用横线 - 匹配字符范围。
在正则表达式末尾添加额外的标记来修改匹配器的行为。
JavaScript支持如下标记:
i = 不区分大小写
m = 多行匹配
g = 全局匹配(查找所有匹配,而不是仅查找一个)
在模式开头使用箭头 ^ 表示“字符串开头”。
在模式末尾使用美元符号 $ 表示“字符串结尾”。
将多个模式放在一起以匹配更长的字符串。
使用通配符和特殊的转义字符来匹配字符类。
. = 除了换行之外的任何字符。
d = 数字
D = 非数字
s = 空白
S = 非空白
= 新行
用数量修饰符来匹配特定数量的字符。
* = 零个或多个
+ = 一个或多个
?= 零个或一个
{3} = 正好3个
{2,4} = 2, 3, 或4个
{2,} = 2或多个
使用括号 来分组。
match会返回完整的匹配,外加每个分组,除非你使用了g标记。
在括号 内使用管道符号 | 来表示分组的匹配内容。
| = 或者
要匹配特殊字符,需要用反斜杠 将其转义。
JS正则表达式中的特殊字符包括:^ $ . * + ? { } |
所以,要想匹配星号,需要使用:
*
而不能仅使用 *
要想匹配除了特定字符之外的任意字符,可以在方括号内使用^。
这意味着 ^ 有两种含义,可能会造成混淆。
当它出现在正则表达式开头时,它表示“字符串开头";出现在方括号内时,表示“不是这些字符串”。
正则表示可以用来查找并匹配各种东西,比如URL和文件名。
但是!对于非常复杂的任务,使用正则表达式时一定要小心,比如分析电子邮件(你很容易就会弄得一团糟),或者分析HTML(HTML不是正规的语言,所以没办法完全使用正则表达式来解析)。
但是,对于绝大多数Web开发者来说,掌握这些最基本的组成部分就够了。
原文:https://dev.to/chrisachard/intro-to-regex-for-web-developers-2fj4
作者:Chris Achard,程序员,日常使用JS, React, Rails和Node,在egghead.io上讲课。
本文为 CSDN 翻译,转载请注明来源出处。
【END】