Pattern的多种匹配模式

参考: 好文→ Pattern的多种匹配模式 – 《JAVA编程思想》42

目录标题

  • 单行匹配
  • 多行匹配
  • 正则匹配忽略大小写
  • Unicode 字符集中的大小写敏感
  • 字符都将表示字面含义
  • 考虑字符的等价性
  • 会忽略正则表达式中的空格及#开始后面的部分
  • 只会将 `\n` 认作换行符
  • `\w` 可以匹配任何语言的任何字符

单行匹配

Pattern.DOTALL(?s):默认匹配模式下 “.” 不会匹配换行符(\n),此模式下 "."会匹配换行符(\n),这意味着正则表达式可以在多行文本中进行匹配。

System.out.println(Pattern.compile("[A-Z].*").matcher("ABC\nDEF").matches()); // false
思路引导1. 先看方法是matches,查看是整个字符串都匹配上正则表达式。
思路引导2. [A-Z]开头后面不包含\n就行System.out.println(Pattern.compile("[A-Z].*", Pattern.DOTALL).matcher("ABC\nDEF").matches()); // true
思路引导1. 先看方法是matches,查看是整个字符串都匹配上正则表达式。
思路引导2. [A-Z]开头后面任意Matcher matcher = Pattern.compile("[A-Z].*").matcher("ABC\nDEF");
while (matcher.find()) {System.out.print("," + matcher.group() + "");
}
,ABC,DEF
思路引导1. 先看方法是find,字符串某个部分匹配上正则表达式即可。
思路引导2. [A-Z]开头后面不包含\n就行

多行匹配

Pattern.MULTILINE(?m):多行模式并不改变.的行为,而是影响 ^$ 的行为。在默认情况下,^$ 分别匹配字符串的开始和结束。但在多行模式下,^$ 还可以分别匹配每行的开始和结束。如果需要仅匹配字符串开始和结束位置,可以使用 \A\Z

System.out.println(Pattern.compile(".*BC").matcher("AB\nBC").find()); // trueSystem.out.println(Pattern.compile("^.*BC$").matcher("AB\nBC").find()); // false
思路引导1.^$+find等价于matchs,查看是整个字符串都匹配上正则表达式。
思路引导2.前面谁都行就是不能为\n
System.out.println(Pattern.compile("^.*BC$").matcher("AB\nBC").matches()); // falseMatcher m2 = Pattern.compile("^.*BC$", Pattern.MULTILINE).matcher("AB\nBC");
if (m2.find()) {System.out.println(m2.group()); // BC
}Matcher m3 = Pattern.compile("\\A.*BC\\Z", Pattern.MULTILINE).matcher("AB\nBC");
if (m3.find()) {System.out.println(m3.group()); // 没匹配到
}

正则匹配忽略大小写

Pattern.CASE_INSENSITIVE(?i):此模式下进行匹配会忽略 US-ASCII字符集中的大小写敏感,若需要忽略 Unicode 中的大小写敏感,需要结合 Pattern.UNICODE_CASE 使用。

// 忽略 Unicode 中的大小写敏感
System.out.println(Pattern.compile("[A-Z]+", Pattern.UNICODE_CASE | Pattern.CASE_INSENSITIVE).matcher("abc").matches()); // true
System.out.println(Pattern.compile("(?i)|(?u)[A-Z]+").matcher("abc").matches());  // true// 忽略 US-ASCII字符集中的大小写敏感
System.out.println(Pattern.compile("[A-Z]+", Pattern.CASE_INSENSITIVE).matcher("abc").matches()); // true
System.out.println(Pattern.compile("(?i)[A-Z]+").matcher("abc").matches()); // true

Unicode 字符集中的大小写敏感

Pattern.CASE_INSENSITIVE (?u)

字符都将表示字面含义

Pattern.LITERAL:此模式下所有的转义字符或元字符都将表示字面含义,不代表任何特殊意义

System.out.println(Pattern.compile("\\s").matcher("\\s").matches()); // false
System.out.println(Pattern.compile("\\s", Pattern.LITERAL).matcher("\\s").matches()); // true

考虑字符的等价性

Pattern.CANON_EQ:此模式下进行匹配会考虑字符的等价性。
例如:正则表达式 \u003f 会匹配字符 , 因为 的 unicode 编码就是 \u003f

System.out.println(Pattern.compile("\\u003f", Pattern.CANON_EQ).matcher("?").matches()); // true

会忽略正则表达式中的空格及#开始后面的部分

Pattern.COMMENTS(?x)

Pattern p1 = Pattern.compile("#[A-Z]+");
System.out.println(p1.matcher("#ABC").matches());
Pattern p2 = Pattern.compile("#[A-Z]+", Pattern.COMMENTS);
System.out.println(p2.matcher("#ABC").matches());
Pattern p3 = Pattern.compile("[0-9]+#[A-Z]+", Pattern.COMMENTS);
System.out.println(p3.matcher("123").matches());
Pattern p4 = Pattern.compile("[A-Z]+ [0-9]+");
System.out.println(p4.matcher("ABC123").matches());
Pattern p5 = Pattern.compile("[A-Z]+ [0-9]+", Pattern.COMMENTS);
System.out.println(p5.matcher("ABC123").matches());

只会将 \n 认作换行符

Pattern.UNIX_LINES(?d):在此模式下进行匹配,在 .^$ 三种行为中,只会将 \n 认作换行符,默认模式下会将 \r 也认作换行符。

String data = "A\r\nB\rC\nD";
System.out.println(data);
System.out.println("-------------------------------------");Matcher m = Pattern.compile(".+").matcher(data);
while (m.find()) {System.out.println("[" + m.group() + "]");  // [A][B][C][D]
}
System.out.println("-------------------------------------");m = Pattern.compile(".+", Pattern.UNIX_LINES).matcher(data);
while (m.find()) {System.out.println("[" + m.group() + "]");  // (A\r)、(B\rC)、(D)
}

\w 可以匹配任何语言的任何字符

Pattern.UNICODE_CHARACTER_CLASS (?U) :\w 默认只匹配[a-zA-Z_0-9] 开启此模式后,\w 可以匹配任何语言的任何字符。

Pattern p1 = Pattern.compile("\\w+");
System.out.println(p1.matcher("中国").matches());Pattern p2 = Pattern.compile("\\w+", Pattern.UNICODE_CHARACTER_CLASS);
System.out.println(p2.matcher("中国").matches());

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/874936.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

BGP选路之Preferred value

原理概述 当一台BGP路由器中存在多条去往同一目标网络的BGP路由时,BGP协议会对这些BGP路由的属性进行比较,以确定去往该目标网络的最优BGP路由,然后将该最优BGP路由与去往同一目标网络的其他协议路由进行比较,从而决定是否将该最优…

fastadmin 批量上传图片

1.自定义按钮 <button type"button" id"faupload-local" class"btn btn-primary btn-danger faupload" data-input-id"c-local" data-multiple"true" data-preview-id"p-local" data-url"{:url(ajax/upl…

OAuth2.0 or Spring Session or 单点登录流程

1.社交登录 2.微博社交登录 第三方登录 1.登录微博 2.点击网站接入 3.填写完信息&#xff0c;到这里&#xff0c;写入成功回调 和 失败回调 是重定向&#xff0c;所以可以写本地的地址 3.认证 分布式Session spring-session 域名不一样 发的 jSessionId 就不同&#xff0c…

自定义element主题

说明&#xff1a;这里使用的是vue3做的demo&#xff0c;所以使用的是element-plus&#xff0c;不同版本大同小异 一、安装element-plus npm install element-plus --save二、在main.ts中引入 import ElementPlus from "element-plus"; import "element-plus/d…

如何使用Python的http.server模块(或Flask/Django的简化版本)实现一个简单的HTTP服务器,能够处理GET和POST请求

使用Python的http.server模块实现HTTP服务器 http.server模块是Python标准库中的一部分&#xff0c;它提供了一个非常基础的HTTP服务器实现。虽然这个服务器主要用于测试和开发目的&#xff0c;但它确实能够处理GET和POST请求。不过&#xff0c;请注意&#xff0c;http.server…

MySQL-视 图

视 图 创建视图 视图是从一个或者几个基本表&#xff08;或视图&#xff09;导出的表。它与基 本表不同&#xff0c;是一个虚表。 语法&#xff1a; create view 视图名 【view_xxx/v_xxx】 说明&#xff1a; • view_name 自己定义的视图名&#xff1b; • as 后面是这…

【web]-反序列化-easy ? not easy

打开后看到源码 <?php error_reporting(0); highlight_file(__FILE__);class A{public $class;public $para;public $check;public function __construct(){$this->class "B";$this->para "ctfer";echo new $this->class ($this->para…

Kubernetes学习指南:保姆级实操手册03——规划部署

Kubernetes学习指南&#xff1a;保姆级实操手册03——规划部署 一、部署节点规划 Hostnameiprolesk8s-master0110.255.210.1masterk8s-master0210.255.210.2masterk8s-master0310.255.210.3masterk8s-node0110.255.210.4worker nodek8s-node0210.255.210.5worker nodek8s-nod…

【深度学习】LDA线性判别分析

date:2024/07/23 author:sion tag:Deeping Learn LDA(线性判别分析) 文章目录 LDA(线性判别分析)1.LDA是什么LDA是一种解决二分类问题的线性方法。它描述&#xff0c;对于给定样例集&#xff0c;将样例点投影到一条直线上&#xff0c;这条直线能使异样的样例相距远&#xff0c;…

为Jetson Xavier NX安装合适版本的pytorch(解决torch not compiled with cuda enabled)

Jetson Xavier NX 上我的环境是torch2.3.1 cuda 11.4 cuDNN8.4.1 sudo jtop和 nvcc -V都正常显示 有cuda11.4 环境变量路径也配置了 但是我print(“CUDA available:”, torch.cuda.is_available())输出为False 运行torch.cuda.current_device() 报错是torch not compiled wi…

【日常介绍】—pycharm2024.1变化

目录 一、性能提升 二、代码编辑与导航 三、重构与版本控制 四、调试与测试 五、集成工具与云服务 六、用户界面与体验 七、其他新特性 一、性能提升 项目加载时间优化&#xff1a;改进了项目索引机制&#xff0c;使得初次加载时间更快。代码分析引擎优化&#xff1a;提…

Linus: vim编辑器的使用,快捷键及配置等周边知识详解

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 vim的安装创建新用户 adduser 用户名Linus是个多用户的操作系统是否有创建用户的权限查看当前用户身份:whoami** 怎么创建设置密码passwdsudo提权(sudo输入的是用户…

Golang | Leetcode Golang题解之第275题H指数II

题目&#xff1a; 题解&#xff1a; func hIndex(citations []int) int {n : len(citations)return n - sort.Search(n, func(x int) bool { return citations[x] > n-x }) }

数驭未来,景联文科技构建高质大模型数据库

国内应用层面的需求推动AI产业的加速发展。根据IDC数据预测&#xff0c;预计2026年中国人工智能软件及应用市场规模会达到211亿美元。 数据、算法、算力是AI发展的驱动力&#xff0c;其中数据是AI发展的基石&#xff0c;中国的数据规模增长速度预期将领跑全球。 2024年《政府工…

go语言day15 goroutine

Golang-100-Days/Day16-20(Go语言基础进阶)/day17_Go语言并发Goroutine.md at master rubyhan1314/Golang-100-Days GitHub 第2讲-调度器的由来和分析_哔哩哔哩_bilibili 一个进程最多可以创建多少个线程&#xff1f;-CSDN博客 引入协程 go语言中内置了协程goroutine&#…

Python实现图片相似度比较之SSIM

Python实现图片相似度比较之SSIM 解读 SSIM 数值 结构相似性指数 (SSIM) 是用来衡量两张图像相似度的指标&#xff0c;范围从 -1 到 1&#xff1a; 1 表示完全相同。0 表示没有任何相似性。负值 表示图像之间的差异超出了正常范围&#xff08;通常是因为两张图像的内容差异非…

【qiankun微前端】已有工程改造微前端

最初接触微前端有种高大上的感觉&#xff0c;细细研究了一下&#xff0c;其实也不难&#xff0c;本文就不介绍iframe&#xff0c;single-spa之类的东西了&#xff0c;直奔主题。 当前系统有横向一级顶部路由和竖向二级侧面路由&#xff0c;点击一级路由会触发二级路由的切换&a…

积木报表-自定义报表

文章目录 一、springboot初始项目集成积木报表二、springboot正式项目集成积木报表注意点注意点1&#xff1a;依赖下载失败原因&#xff1a;Maven私服设置注意点2&#xff1a;dependency在【springboot初始项目集成积木报表】情况下不要放在根目录的pom里&#xff0c;放子模块的…

前端实现自定义表单组件开发

1、组件介绍 自定义表单,表单上的字段、输入控件、验证规则、数据结构等可动态设置。 2、接口数据介绍 [{"condition_type":13,"condition_name":"发送者匹配模式","setting":{"base_filed":{"fields":[{&quo…

代码随想录训练营第四十七天 647回文子串

第一题&#xff1a; 原题链接&#xff1a;647. 回文子串 - 力扣&#xff08;LeetCode&#xff09; 思路&#xff1a; dp[i][j]的含义&#xff1a;表示从i到j之间的子串是否是回文子串。 那么考虑三种情况: 在s[i] s[j]的前提下&#xff1a; 如果i j说明当前是一个元素&a…