正则表达式(Regular Expression,简称正则或RegExp)是用于匹配字符串中字符组合的表达式。它是一种强大的工具,可以用于搜索、替换和提取字符串中的文本。
正则表达式由字符和操作符构成,用于描述字符串模式。以下是一些基本的正则表达式元素:
字符类 | [abc] | 匹配字符串中的任意一个字符是 "a"、"b" 或 "c"。 |
示例:正则表达式 /[abc]/ 匹配字符串 "hello" 中的字符 "e" ,因为它是字符类中的一个字符。 | ||
[^abc] | 匹配字符串中的任意一个字符不是 "a"、"b" 或 "c"。 | |
示例:正则表达式 /[^abc]/ 匹配字符串 "hello" 中的字符 "h" ,因为它不在字符类中。 | ||
元字符 | . | 匹配除换行符之外的任意一个字符。 |
示例:正则表达式 /he./ 匹配字符串 "hello" 中的字符 "hel" 。 | ||
^ | 匹配字符串的开始。 | |
示例:正则表达式 /^he/ 匹配字符串 "hello" ,因为它在字符串的开头。 | ||
$ | 匹配字符串的结束。 | |
示例:正则表达式 /lo$/ 匹配字符串 "hello" ,因为它在字符串的末尾。 | ||
量词 | * | 匹配前面的元素零次或多次。 |
示例:正则表达式 /ba*/ 匹配字符串 "ba" , "baa" , "baaa" 等。 | ||
+ | 匹配前面的元素一次或多次。 | |
示例:正则表达式 /ba+/ 匹配字符串 "ba" , "baa" , 但不匹配 "b" 。 | ||
? | 匹配前面的元素零次或一次。 | |
示例:正则表达式 /ba?/ 匹配字符串 "b" 和 "ba" 。 | ||
{n} | 匹配前面的元素恰好 n 次。 | |
示例:正则表达式 /ba{2}/ 匹配字符串 "baa" 。 | ||
{n,} | 匹配前面的元素至少 n 次。 | |
示例:正则表达式 /ba{2,}/ 匹配字符串 "baa" , "baaa" 等。 | ||
{n,m} | 匹配前面的元素至少 n 次但不超过 m 次。 | |
示例:正则表达式 /ba{2,4}/ 匹配字符串 "baa" , "baaa" , "baaaa" 。 | ||
特殊字符 | \ | 转义字符,用于匹配特殊字符。 |
示例:正则表达式 /\d/ 匹配字符串 "123" , 不匹配 "abc" 。 | ||
| | 或操作符,匹配两者之一。 | |
示例:正则表达式 /cat|dog/ 匹配字符串 "cat" 或 "dog" 。 |
常用正则表达式涵盖了一系列常见的文本匹配需求。以下是一些常用的正则表达式示例:
匹配数字:
- 匹配整数:
/^\d+$/
- 匹配浮点数:
/^\d+(\.\d+)?$/
- 匹配正整数:
/^[1-9]\d*$/
- 匹配非负整数:
/^\d+$/
匹配字母和数字:
- 匹配由数字和字母组成的字符串:
/^[a-zA-Z0-9]+$/
匹配邮箱地址:
/^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/
匹配手机号码:
/^1[3456789]\d{9}$/
匹配日期:
- 匹配 yyyy-mm-dd 格式的日期:
/^\d{4}-\d{2}-\d{2}$/
- 匹配 yyyy/mm/dd 格式的日期:
/^\d{4}\/\d{2}\/\d{2}$/
匹配 URL:
/^(http|https):\/\/\w+(\.\w+)+([\w\-.,@?^=%&:/~+#]*[\w\-@?^=%&/~+#])?$/
匹配 IP 地址:
/^((25[0-5]|2[0-4]\d|1\d{2}|[1-9]\d|\d)\.){3}(25[0-5]|2[0-4]\d|1\d{2}|[1-9]\d|\d)$/
匹配中文字符:
/[\u4e00-\u9fa5]/
匹配 HTML 标签:
/<\/?[^>]+(>|$)/
匹配用户名:
/^[a-zA-Z0-9_-]{3,16}$/
参考资料:
正则表达式 – 语法 | 菜鸟教程
正则表达式手册