java中regex_Java 9中的新Regex功能

java中regex

最近,我收到了Packt出版的Anubhava Srivastava提供的免费书籍“ Java 9 Regular Expressions” 。 这本书是一个很好的教程,它向想要学习正则表达式并从头开始的任何人介绍。 那些知道如何使用正则表达式的人可能仍然很有趣,以重申其知识并加深诸如零长度断言,反向引用之类的复杂特征。

在本文中,我将重点介绍特定于Java 9且在早期版本的JDK中不可用的正则表达式功能。 但是,数量并不多。

Java 9正则表达式模块

Java 9中的JDK分为多个模块。 可以理所当然地期望为正则表达式处理包和类提供一个新模块。 其实没有。 模块java.base是默认模块,默认情况下所有其他模块都依赖该模块,因此,导出的包的类在Java应用程序中始终可用。 此模块导出正则表达式包java.util.regex 。 这使开发过程更加简单:如果我们想在代码中使用正则表达式,则无需显式地“要求”模块。 似乎正则表达式对于Java是如此重要,以至于它包含在基本模块中。

正则表达式类

java.util.regex包含这些类

  • MatchResult
  • Matcher
  • Pattern
  • PatternSyntaxException

更改API的唯一类是Matcher

类匹配器的变化

Matcher类添加了五个新方法。 其中四个是现有方法的重载版本。 这些是:

  • appendReplacement
  • appendTail​
  • replaceAll​
  • replaceFirst​
  • results​

前四个存在于较早的版本中,并且参数的类型仅发生变化(毕竟这就是重载的意思)。

appendReplacement / Tail

对于appendReplacementappendTail ,唯一的区别是该参数还可以是StringBuilder ,而不仅是StringBuffer 。 考虑到StringBuilder是Java 1.5中引入的,就像13年前一样,没有人可以说这是一个不明智的行为。

有趣的是,API JDK的当前在线版本如何记录StringBuilder参数的appendReplacement行为。 较旧的StringBuffer变量方法显式记录了替换字符串可能包含将由相应组替换的命名引用。 StringBuilder争论的版本错过了这一点。 该文档似乎像复制/粘贴然后进行编辑。 文本将“ buffer”替换为“ builder”等,并删除记录命名参考功能的文本。

我使用Java 9 build160尝试了该功能,对于这两个方法版本,结果是相同的。 这并不奇怪,因为这两种方法的源代码是相同的,除了参数类型之外,在JDK中都是简单的复制/粘贴。

似乎可以使用

@Testpublic void testAppendReplacement() {Pattern p = Pattern.compile("cat(?<plural>z?s?)");//Pattern p = Pattern.compile("cat(z?s?)");Matcher m = p.matcher("one catz two cats in the yard");StringBuilder sb = new StringBuilder();while (m.find()) {m.appendReplacement(sb, "dog${plural}");//m.appendReplacement(sb, "dog$001");}m.appendTail(sb);String result = sb.toString();assertEquals("one dogz two dogs in the yard", result);}

注释行或每行上方的行。 但是,文档仅涉及编号的参考。

replaceAll / First

这也是一种“旧的”方法,用一些新的字符串替换匹配的组。 旧版本和新版本之间的唯一区别是替换字符串的提供方式。 在老版本的字符串被赋予作为String调用方法之前计算。 在新版本中,字符串作为Function<MatchResult,String> 。 每个匹配结果都会调用此函数,并且可以动态计算替换字符串。

知道Function类是3年前才在Java 8中引入的,因此在正则表达式中对它的新使用可能有点破绽。 或者,也许……也许我们应该将其视为一个提示,即从现在开始十年,当Fuction类已经13岁时,我们仍然会有Java 9?

让我们更深入地研究这两种方法。 (实际上只用于replaceAll因为replaceFirst相同,只不过它只替换第一个匹配的组。)当这样的使用有价值时,我尝试创建一些并非绝对复杂的示例。

第一个示例来自JDK文档:

@Testpublic void demoReplaceAllFunction() {Pattern pattern = Pattern.compile("dog");Matcher matcher = pattern.matcher("zzzdogzzzdogzzz");String result = matcher.replaceAll(mr -> mr.group().toUpperCase());assertEquals("zzzDOGzzzDOGzzz", result);}

它不太复杂,并显示了功能。 使用lambda表达式绝对足够。 我无法想象一种简单的方法将常量字符串文字“ dog”大写。 也许只写“ DOG”。 好吧,我只是在开玩笑。 但是实际上这个例子太简单了。 对于文档来说是可以的,更复杂的事情会使读者分心于所记录方法的功能。 确实:不要期望JavaDoc中的复杂示例更少。 它描述了如何使用API​​,而不是描述了为什么以这种方式创建API。

但是现在我们现在将看一些更复杂的例子。 我们要在字符串中用数字1、2、3等替换#字符。 该字符串包含编号的项目,如果我们在该字符串中插入了一个新项目,我们不想手动重新编号。 有时我们将两个项目组合在一起,在这种情况下,我们编写## ,然后只想跳过下一个#的序列号。 由于我们已经进行了单元测试,因此代码比我可以用语言更好地描述了功能:

@Testpublic void countSampleReplaceAllFunction() {AtomicInteger counter = new AtomicInteger(0);Pattern pattern = Pattern.compile("#+");Matcher matcher = pattern.matcher("# first item\n" +"# second item\n" +"## third and fourth\n" +"## item 5 and 6\n" +"# item 7");String result = matcher.replaceAll(mr -> "" + counter.addAndGet(mr.group().length()));assertEquals("1 first item\n" +"2 second item\n" +"4 third and fourth\n" +"6 item 5 and 6\n" +"7 item 7", result);}

传递给replaceAll的lambda表达式获取计数器并计算下一个值。 如果我们使用一个#那么如果我们使用两个,它将增加1,然后将其添加到计数器,依此类推。 因为lambda表达式不能在周围环境中更改变量的值(变量必须有效地为final),所以计数器不能为intInteger变量。 我们需要一个具有int值并且可以更改的对象。 AtomicInteger就是即使我们不使用它的原子功能也是如此。

下一个示例更进一步,并进行了一些数学计算。 它将字符串中的任何浮点格式的数字替换为其正弦值。 这样,由于sin(pi)甚至不接近pi,因此它可以纠正我们的句子,此处无法精确表示。 它几乎接近零:

@Testpublic void calculateSampleReplaceAllFunction() {Pattern pattern = Pattern.compile("\\d+(?:\\.\\d+)?(?:[Ee][+-]?\\d{1,2})?");Matcher matcher = pattern.matcher("The sin(pi) is 3.1415926");String result = matcher.replaceAll(mr -> "" + (Math.sin(Double.parseDouble(mr.group()))));assertEquals("The sin(pi) is 5.3589793170057245E-8", result);}

我们还将对此计算进行一些操作,以演示列表中的最后一个方法,它是Matcher类中的一个全新方法。

流结果()

新方法results()返回匹配结果流。 更精确地说,它返回MatchResult对象的Stream 。 在下面的示例中,我们使用它从字符串中收集任何浮点格式的数字,并以逗号分隔打印其正弦值:

@Testpublic void resultsTest() {Pattern pattern = Pattern.compile("\\d+(?:\\.\\d+)?(?:[Ee][+-]?\\d{1,2})?");Matcher matcher = pattern.matcher("Pi is around 3.1415926 and not 3.2 even in Indiana");String result = String.join(",",matcher.results().map(mr -> "" + (Math.sin(Double.parseDouble(mr.group())))).collect(Collectors.toList()));assertEquals("5.3589793170057245E-8,-0.058374143427580086", result);}

摘要

Java 9 JDK中引入的新正则表达式方法与现有的方法没有本质上的区别。 它们整洁方便,在某些情况下可以简化编程。 没有早期版本中不会引入的任何内容。 这只是Java缓慢而深思熟虑地对JDK进行此类更改的方式。 毕竟,这就是为什么我们喜欢Java,不是吗?

您可以从以下要点找到并下载IDE中的整个代码副本粘贴

翻译自: https://www.javacodegeeks.com/2017/08/new-regex-features-java-9.html

java中regex

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/334690.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mvc @html.editorfor,在MVC中,@Html.EditorFor(m = ( )_CSharp_开发99编程知识库

1 。Html.EditorFor(m > m)顯示整個模型編輯器。Html.EditorFor(m > m.propertyName)顯示模型的特定屬性編輯器。2 。Html.EditorFor(m > m)等於 Html.EditorFor(t > t)或 Html.EditorFor(randomName > randomName). 名稱並不重要&#xff0c;只是參數的名稱。 …

如何将本地 Windows 电脑中的文件复制(上传)到远程的 Windows 服务器主机上

文章目录第一步&#xff1a;点击「远程桌面连接」第二步&#xff1a;输入远程主机 IP 和 port第三步&#xff1a;设置本地目录共享第四步&#xff1a;点击「连接」按钮&#xff0c;输入登录用户名和密码第五步&#xff1a;复制本地文件到远程主机上第一步&#xff1a;点击「远程…

jax-rs jax-ws_什么是JAX-RS注释? (第3部分)

jax-rs jax-wsJAX-RS注释概述&#xff08;第3部分&#xff09; 这是一个由三部分组成的系列&#xff0c;介绍了用于实现REST端点的注释。 在JAX-RS批注的第二部分中&#xff0c;您了解了&#xff1a; Path注释和PathParam QueryParamter批注 Produces批注 Consumes批注 在…

股票实例_注意了!手中的股票涨停,但是却封不住反复打开,说明了什么?看懂持股不慌...

手中的股票涨停&#xff0c;却封不住反复打开&#xff0c;说明了什么?如果一只股票收到涨停板但封不牢&#xff0c;说明在涨停位反复打开&#xff0c;而且成交比较大&#xff0c;因为一只股票出现涨停的时候&#xff0c;一般会有大量的买单排除在买位的位置封住涨停&#xff0…

FTP 两种传输模式 Binary 和 ASCII 的区别

文章目录区别原理分析建议常规作法习惯作法区别 ASCII 模式和 Binary 模式的区别是换行符的处理&#xff0c;Binary 模式不对数据进行任何处理&#xff0c;ASCII 模式将换行符转换为目标主机操作系统的换行符&#xff0c;换行符号在Unix下是\n(0A)&#xff0c;Windows下是\r\n…

东北电力大学计算机专业几本,东北电力大学是几本?东北电力大学怎么样?

东北电力大学的特色专业主要是动力工程及工程热物理、电气工程、土木工程等&#xff0c;每年报考此类专业人数较多&#xff0c;每年的分数线都在一本线以上&#xff0c;下面是学习啦小编给大家带来的东北电力大学是几本&#xff0c;供大家参考!东北电力大学是几本东北电力大学是…

jax-rs jax-ws_什么是JAX-RS注释? (第2部分)

jax-rs jax-wsJAX-RS注释概述&#xff08;第2部分&#xff09; 这是一个由三部分组成的系列&#xff0c;介绍了用于实现REST端点的注释。 在JAX-RS注释的第一部分中&#xff0c;您了解了&#xff1a; ApplicationPath批注 Path注释 GET HTTP方法注释 POST HTTP方法注释 …

vue设置标签自定义属性_Vue组件化开发之插槽

插槽为组件提供了强大的扩展能力。我们可以把电脑的主板理解为一个已经封装好的组件&#xff0c;主板上都会预留各种插槽&#xff0c;我们可以往插槽中插入内存条、显卡、声卡等设备。基于同样的思想&#xff0c;Vue在封装组件时&#xff0c;也可以预留插槽&#xff0c;在组件被…

用html和css布局如下图像,[看书][CSS精粹(第2版)]第三章 CSS和图像 HTML网页布局...

**“本作品是用html和css如何实现制作一个网页呢”**那么大家打开此文档可能是为了看看&#xff0c;或者是这次的考试怎么可以学习一下放心大家可以在此处得到一个好的答案...1.介绍如何修改老旧风格的导航&#xff0c;使用CSS&#xff0c;以页面样式替代图片。(加快页面加载速…

国家标准标点符号用法

文章目录1. 范围2. 定义3. 基本规则4. 用法说明4.1 句号4.2 问号4.3 叹号4.4 逗号4.5 顿号4.6 分号4.7 冒号4.8 引号4.9 括号4.10 破折号4.11 省略号4.12 着重号4.13 连接号4.14 间隔号4.15 书名号5. 标点符号的位置6. 直行文稿与横行文稿使用标点符号的不同(1995年12月13日发布…

2019 java值得学吗_Java认证值得吗?

2019 java值得学吗在任何行业中获得证书总是有其利弊&#xff0c;但似乎在技术世界中&#xff0c;情况更加混乱。 由于对熟练的技术人员的需求很大&#xff0c;进入该行业的途径很多&#xff0c;包括学术认证方法和更自学的基于投资组合的方法。 但是&#xff0c;为了促进您的职…

sku设计mysql_基于spring boot拥有完整sku和下单流程的完全商城

一个基于spring boot、spring oauth2.0、mybatis、redis的轻量级、前后端分离、防范xss攻击、拥有分布式锁&#xff0c;为生产环境多实例完全准备&#xff0c;数据库为b2b2c设计&#xff0c;拥有完整sku和下单流程的完全开源商城前言Mall4j项目致力于为中小企业打造一个完整、易…

淮阴工学院计算机期末考选择题题库,淮阴工学院PLC试题库.doc

《淮阴工学院PLC试题库.doc》由会员分享&#xff0c;提供在线免费全文阅读可下载&#xff0c;此文档格式为doc&#xff0c;更多相关《淮阴工学院PLC试题库.doc》文档请在天天文库搜索。1、&#xfeff;一 、判断题(每题1分&#xff0c;共10分)1&#xff0e; S7-300 PLC中标识符…

文章结构层次序数(序号)的规范要求

文章目录一、层次序数规范二、参考文档一、层次序数规范 第一层为汉字数字加顿号&#xff0c;例如&#xff1a;一、 二、 三、 第二层为小括号中包含汉字数字&#xff0c;例如&#xff1a;&#xff08;一&#xff09; &#xff08;二&#xff09; &#xff08;三&#xff09;…

需求澄清_澄清字符串的格式!

需求澄清用户友好的介绍 如果您不熟悉String格式或只想快速解决问题&#xff0c;那么String格式的Java文档不是最容易阅读和理解的。 尽管它很完整&#xff0c;但是它不是非常用户友好的&#xff0c;所以我想我会尝试编写一个更清晰的版本。 这篇文章不仅对您有帮助&#xff0c…

数据结构铁轨问题_每天5分钟用C#学习数据结构(20)图 Part 1

【基础知识】| 作者 / Edison Zhou这是恰童鞋骚年的第216篇原创文章前面已经介绍了线性表和树两类数据结构&#xff0c;线性表中的元素是“一对一”的关系&#xff0c;树中的元素是“一对多”的关系&#xff0c;本章所述的图结构中的元素则是“多对多”的关系。图(Graph)是一种…

Mac上最好的Markdown文本编辑器_编辑工具

Bear Typora iPic 支持预览&#xff0c;图片不在本地&#xff0c;很多人推荐 Typed Ulysses 对 Code 片段支持不好 Mou 支持预览 MWeb 支持本地图片和图床 Byword 无法预览&#xff0c;对 Code 片段支持不好 Sublime Text 不支持预览 插件 OmniMarkupPreviewer Markdo…

中国大学生计算机设计大赛云南,第14届中国大学生计算机设计大赛云南赛区决赛举行...

掌上春城讯6月19日&#xff0c;2021 年“浪潮杯”云南省大学生计算机设计大赛暨第 14 届中国大学生计算机设计大赛云南赛区决赛在云南工商学院举行。中国大学生计算机设计大赛属于全国高等学校一类竞赛&#xff0c;是一个国家级的以实现高等学校计算机教育培养目标为核心的创新…

jvm gc,gc算法_GC解释:算法

jvm gc,gc算法如前一篇文章中所述&#xff0c;HotSpot JVM中有四个可用的垃圾收集器。 它们之间有一些显着差异&#xff0c;但是用于完成实际工作的算法背后的实际概念非常相似。 在这篇简短的文章中&#xff0c;我将尝试解释三种基本算法&#xff1a; 打标 打标紧凑 标记复…

python 链表倒数第k个节点_链表-删除单链表中倒数第k个节点

题目实现一个函数&#xff0c;一个可以删除单链表中倒数第k个节点难度简单分析本题比较简单&#xff0c;实现方法多种多样&#xff0c;这里提供一种方法首先明确一点&#xff0c;在单链表中删除倒数第k个节点&#xff0c;需要找到他的前一个节点&#xff0c;让前一个节点指向后…