目录
- 1 引言
- 2 常用匹配规则
- 2.1 字符类
- 2.2 预定义的字符类
- 2.3 贪婪的量词
- 3 正则表达式匹配的 API
- 4 正则表达式应用
- 4.1 正则表达式常见应用案例
- 4.2 正则表达式在字符串方法中的使用
- 4.3 正则表达式爬取信息
1 引言
😍 正则表达式可以用一些规定的字符来制定规则,并用来校验数据格式的合法性。
2 常用匹配规则
2.1 字符类
默认匹配一个字符
[abc]
:只能是a 、b、或者 c
[^abc]
: 除了a 、b、 c 之外的任意字符
[a-zA-Z]
: a 到 z A 到 Z(范围)
[a-d[m-p]]
:a 到 d 或者 m 到 p(并集)
[a-z&&[def]]
: d、e 或 f (交集)
[a-z&&[^bc]]
: a 到 z,除了 b、c
[a-z&&[^m-p]]
: a 到 z,除了 m 到 p
2.2 预定义的字符类
默认匹配一个字符
.
:任意字符
\d
:一个数字:[0-9]
\D
:非数字:[^0-9]
\s
:一个空白字符:[\t\n\x0B\f\r]
\S
:非空白字符:[^\s]
\w
:英文、数字、下划线: [a-zA-Z_0-9]
\W
:非英文、数字、下划线: [^\w]
2.3 贪婪的量词
配合匹配多个字符
?
:前面的字符出现 0 次或 1 次
*
:前面的字符出现 0 次或 多 次
+
:前面的字符出现 1 次或 多 次
{n}
:前面的字符出现 n 次
{n,}
:前面的字符至少出现 n 次
{n,m}
:前面的字符至少出现 n 次,但不超过 m 次
3 正则表达式匹配的 API
字符串对象提供了匹配正则表达式规则的 API
public boolean matches(String regex)
判断指定字符串是否匹配正则表达式,匹配返回true
、不匹配返回false
🙋举个栗子:
public class Demo {public static void main(String[] args) {// 只能出现a、b、cSystem.out.println("a".matches("[abc]")); // true// 默认只匹配一个字符System.out.println("ab".matches("[abc]")); // falseSystem.out.println("ab".matches("[abc]+")); // true// 不能出现a、b、cSystem.out.println("a".matches("[^abc]")); // falseSystem.out.println("z".matches("[^abc]")); // true// 匹配数字System.out.println("3".matches("\\d")); // trueSystem.out.println("a".matches("\\d")); // false// 匹配数字、字母、_System.out.println("_".matches("\\w")); // trueSystem.out.println("24".matches("\\w")); // falseSystem.out.println("我".matches("\\w")); // falseSystem.out.println("我".matches("\\W")); // trueSystem.out.println("-------------------------");// 校验密码:必须是数字、字母、下划线,至少6位System.out.println("2ugyftyf2".matches("\\w{6,}")); // true// 验证码,必须是数字、字符,必须是4位System.out.println("34jh".matches("[a-zA-Z0-9]{4}")); // trueSystem.out.println("34jh".matches("[\\w&&[^_]]{4}")); // true}
}
4 正则表达式应用
4.1 正则表达式常见应用案例
😎 需求
- 请编写程序模拟用户输入手机号码、验证格式正确,并给出提示,直到格式输入正确为止。
- 请编写程序模拟用户输入邮箱号码、验证格式正确,并给出提示,直到格式输入正确为止。
- 请编写程序模拟用户输入电话号码、验证格式正确,并给出提示,直到格式输入正确为止。
😵 分析
- 定义方法,接收用户输入的数据,使用正则表达式完成检验,并给出提示。
😇 示例代码:
import java.util.Scanner;public class Demo {public static void main(String[] args) {checkPhone();checkEmail();checkTel();}public static void checkPhone(){Scanner sc =new Scanner(System.in);while (true) {System.out.println("请您输入你的注册手机号码:");String phone = sc.next();if (phone.matches("1[3-9]\\d{9}")){System.out.println("手机号码格式正确,注册成功!");break;}else{System.out.println("手机号码格式有误!");}}}public static void checkEmail(){Scanner sc =new Scanner(System.in);while (true) {System.out.println("请您输入你的邮箱:");String phone = sc.next();// 123@qq.com// 23ggyfgy@163.com// 331122weiwei@pci.com.cn// 这里注意.的正则表达式if (phone.matches("\\w{1,30}@[a-zA-Z0-9]{2,20}(\\.[a-zA-Z0-9]){1,2}")){System.out.println("邮箱格式正确,注册成功!");break;}else{System.out.println("邮箱格式有误!");}}}public static void checkTel(){Scanner sc =new Scanner(System.in);while (true) {System.out.println("请您输入你的电话号码:");String phone = sc.next();if (phone.matches("0\\d{2,6}-?\\d{5,20}")){System.out.println("电话号码格式正确,注册成功!");break;}else{System.out.println("电话号码格式有误!");}}}
}
4.2 正则表达式在字符串方法中的使用
🙋举个栗子:
public class Demo {public static void main(String[] args) {String names = "张三huuigh7566756李四vtftr65675王五tftyftyfty999赵六";String[] arrs = names.split("\\w+");for (int i = 0; i < arrs.length; i++) {System.out.println(arrs[i]);}/*/张三李四王五赵六*/String s = names.replaceAll("\\w+", "\\\\");System.out.println(s); // 张三\李四\王五\赵六String s1 = names.replaceAll("\\w+", "\t");System.out.println(s1); // 张三 李四 王五 赵六String s2 = names.replaceAll("\\w+", "\\t"); // 同直接替换成tSystem.out.println(s2); // 张三t李四t王五t赵六}
}
4.3 正则表达式爬取信息
正则表达式支持爬取指定的信息
import java.util.regex.Matcher;
import java.util.regex.Pattern;public class Demo {public static void main(String[] args) {String rs = "来学习Java,电话020-43422424,或者联系邮箱" +"ibeit@ibeit.cn,电话18762832533,0203232323" +"邮箱bozai@itcast.cn,400-150-3233 ,4001073232";// 需求:从上面的内容中爬取出 电话号码和邮箱// 1.定义爬取规则String regex = "(\\w{1,}@\\w{2,10}(\\.\\w{2,10}){1,2})|" +"(1[3-9]\\d{9})|(0\\d{2,5}-?\\d{5,15})|400-?\\d{3,8}-?\\d{3,8}";// 2.编译正则表达式成为一个匹配规则对象Pattern pattern = Pattern.compile(regex);// 3.通过匹配规则对象得到一个匹配数据内容的匹配器对象Matcher matcher = pattern.matcher(rs);// 4.通过匹配器去内容中爬取出信息while (matcher.find()) {System.out.println(matcher.group());}/*020-43422424ibeit@ibeit.cn187628325330203232323bozai@itcast.cn400-150-32334001073232* */}
}