使用正则把数字前面的符号替换_正则表达式(一) 基本表达式

定义

正则表达式(Regular Expression)
用某种模式去匹配一类字符串的公式,主要用来描述字符串匹配的工具。

匹配
文本或字符存在不止一个部分满足给定的正则表达式,这是每一个这样的部分都被称为一个匹配。 匹配分为以下三种类型:

  1. 形容词性的匹配
    即一个字符串匹配一个正则表达式
  2. 名词性的匹配
    即在文本或字符串里匹配正则表达式
  3. 名词性的匹配
    即字符串中满足给定的正则表达式的一部分

元字符

元字符(Metacharacter)是一类非常特殊的字符,它能够匹配一个位置或字符集合中的一个字符,元字符可以分为两种类型

  • 匹配位置的元字符
  • 匹配字符的元字符

元字符只能匹配一个字符位置,也就是一个匹配的单位是一个字符,而不是一个字符串

匹配位置的元字符

测试

  • ^a
    匹配第一个字母为a的一行

    199b68d22e1ffa9d475535432ee64f33.png
  • a$
    匹配最后一个字母为a的一行

    acdc6fe8e6e4b8bfaa4b29cafdec4f48.png
  • ^a$
    匹配只有一个字母a的一行

    d74f2361dcf26e3ddb4b8e1f3e20a72f.png
  • bStr
    匹配以Str为开头的单词

    5f87917a75420c96cfccae3bbfb9c27b.png
  • ingb
    匹配以ing为结尾的单词

    b065c1e003e9d0b71713ef1d260656ee.png
  • bStringb
    仅匹配String这个单词

    aa9de8df40ac5b7af648c537736275d7.png

b字符如何识别哪个是单词呢?
以标点符号或空格分隔的字符串将被识别为单词,而且 b只能用于英文,不能用于中文

匹配字符的元字符

元字符都是按照单个字符进行匹配

测试

  • .
    全部字符匹配

    109a39c7e11ec305d728a2009b44620a.png
  • w
    匹配了全部的单词字符,除了下划线之外的标点符号和汉字都被排除在外

    9a2c4d11522905d28fe514dd1be8fc2b.png
  • W
    匹配结果和w刚好相反,注意那个下划线是属于单词字符的

    f05f42e48f29612ca3e76a49316dc0d1.png
  • s
    有2个空格被匹配,注意!这里总共有6个符号被匹配了,除了两个空格还有1~4行末的换行符

    83ef451863471b507e0b24f27c10e667.png
  • S
    除了2个空格和4个换行符,其余字符全部匹配

    b793f6744a51168dc7beb49a380aeb06.png
  • d
    匹配所有的数字

    d43b91819dd7d631bd2b005cd1905f6d.png
  • D
    匹配所有数字之外的字符

    0bd32fc90a2b957be9fb350e69f105c8.png

元字符组合

仅仅是元字符就可以自由组合来实现不同的匹配效果

  • ww
    匹配连续的两个单词字符

    undefined_b.jpg

    ef839314cfa7f4d9419d2d2992ff00df.png
  • ws
    注意第三行最后匹配的m是和行末的换行符一起匹配成功的

    12b54d2b6d5a3a14cacaebbb83f29c52.png

    d8f32d75ff6fc4423f9e0753f545d102.png

文字匹配

字符类

字符类是一个字符集合,如果该字符集合中的任何一个字符被匹配,则它会找到该匹配项。

  • []
    字符类使用中括号作为标志,字符集合写在中括号里面,意为匹配中括号中的任意一个字符
  • -
  • -符号不是第一个字符的时候表示定义字符的范围*,例如[1-3]表示[123][a-z]表示匹配任意小写字母,如果-放在第一位,那就仅表示自己,这个范围的顺序和两个字符间的内容是按照ASCII表的顺序决定的,例如[9-1]是违反ASCII表顺序的一个表达式,这会报错
  • ^
    如果放在字符类第一个,表示该字符类的否定,[^123]表示匹配1、2、3之外的所有数字
  • 元字符在字符类中不做任何特殊处理,仅仅表示他们自身

测试

  • [aeiou]
    匹配元音字母
  • [a-z]
    匹配从小写字母az之间的所有字母
  • [^aeiou]
    匹配元音字母之外的所有字符(包括任意符号)
  • [^a-z]
    匹配小写字母az之间的所有字母之外的所有字符
  • [0-9]
    匹配从09之间的任意一个数字
  • [ao-u]
    匹配aou之间的所有字母,可以看到只要在连个字符之间使用连接符-就会判断为一个区间
  • [!-?]
    匹配从!?之间的任意一个符号,可以看到因为是按照ASCII表顺序来判断-连接的字符集合,所以这样写也是没有问题的
  • [a^-]
    匹配字符a^-三个字符,只要^符号不在第一位,-符号不在两个字符中间,那么它们就只表示自身
  • a[no]
    匹配字符串anao,这是字符类和元字符的组合

字符转义

之前介绍的元字符非常好用,但是这又引出了一个问题,如果我们想在正常的表达式里面使用元字符本身这个符号怎么办呢?难道每次都要写在字符类里面吗?
当然不,这里就引出了我们的字符转义

正则表达式定义了一些特殊的元字符,如^$.等。由于这些字符在正则表达式中被解释成其他指定的含义,如果需要匹配这些字符,则需要使用字符转义来解决这个问题。转义字符使用符号(反斜杠),它可以取消这些字符(如^$.等)在表达式中具有的特殊意义。

  • .
    匹配字符.
  • *
    匹配字符*

  • 匹配字符
  • www.lanyuanxiaoyao.com
    匹配字符串www.lanyuanxiaoyao.com,网址中的dot符号也是需要转义的

常用转义字符

限定符

这是一个重要的知识点限定符用于指定允许特定字符或字符集自身重复出现的次数。

测试

  • a{3}

    b0f1512dd3c118484ec40554a2fb03ca.png
  • a{2,}

    fa3de22d99ad231758191ee03eafc19e.png
  • a{2,3}

    a1dbb1590daf39d2b68f784a14c2b142.png
  • ab+

    a541ae4d63a6a00443e318e8998cb9bc.png
  • ab?

    a3a4ead1002e4f80f467994e2d6d3151.png
  • ab*

    86af937ec276e3684544dcccd0cb4971.png
  • ab+?

    68fe00ead301e6a1419505ad15762bcc.png
  • ab??

    f74e61ea1a83e0de0f723f77e8922ad6.png
  • ab*?

    dd53a8593eaf8d5bb224d2f54d585b7a.png

贪婪模式与懒惰模式

如果在限定符*+?{n}{n,}{n,m}之后再添加一个字符 ? ,则表示 尽可能少地重复字符?之前的限定符号的重复次数,这种匹配方式称为懒惰匹配,与之相对的,如果没有字符 ? ,仅仅使用单个限定符*+?{n}{n,}{n,m}的匹配,就称为贪婪匹配。 看起来好像很复杂,但是理解历来并不难,即懒惰匹配模式只匹配最短符合表达式的字符串,贪婪匹配模式只匹配最长符合表达式的字符串。这里的贪婪模式和懒惰模式在不同的教程或者说明里面都有不同的叫法,所以可以理解意思就行了,大同小异

测试

  • 贪婪模式 a.*b
    可以看到这里只有一个匹配,就是整个字符串,因为这是最长的匹配

    a8b80ef82664eeca277e8464bfac2986.png
  • 懒惰模式 a.?b
    这里一旦发现一个匹配立刻就完成当前的匹配,然后从下一个字符开始新的匹配,所以这里会有4个匹配

    c2cfc988c22458740c8c43afb0c8860a.png

字符的运算

替换

替换使用字符|来表示,表示如果某一个字符串匹配了表达式中字符|左边或者右边的规则,那么这个字符串就匹配了这个表达式|表示“或”的意思,这个符号和代码中的“逻辑或”相同,比较好理解匹配是根据左边优先的原则,即从左往右,当左边的表达式不满足的时候,才会去尝试右边的表达式

测试

  • a|b
    可以看到不管是字符a还是b都可以匹配这个表达式,它等同于[ab]

038abec7125cfde8759643524669bdb8.png

2a729668beb4e8e15ed3b818e1a2de08.png

分组

分组又被称为子表达式,即把一个正则表达式的全部或部分分成一个或多个组,分组使用()来表示,括号中的表达式就是一个组,一个组就是一个整体
要注意和字符类[]区分开来,[123]是表示匹配字符123,而(123)就是匹配123这个字符串

反向引用

组号
当一个正则表达式被分组之后,默认从左到右每一个分组都会自动被赋予一个组号,以左括号(为分界从1开始自增,第一个组的组号是1,第二个组的组号是2,以此类推,在后面的表达式,使用组号的方式来引用前面的组,例如b(w)1b这个表达式中,后面的1就是对前面(w)组的引用 自定义组号
分组不止会自动使用数字作为组号,还可以手动命名,形式为(?<name>)(?<word>w)(?'word'w)都是把w+匹配到的字母保存到名为word的分组,自定义命名的分组使用k<name>的方式使用 ,如b(?<word>w)k<word>b是匹配连续的相同的两个字母的单词 反向引用
提供了查找重复字符组的简便方法,可以认为是再次匹配同一个字符组的快捷指令反向引用引用的是前面的表达式匹配到的字符串,而不是前面的表达式
例如,b(w)1b 这个表达式中的1表示的是前面w匹配到的字符,前面匹配到字母a那么1处也必须替换为字母a,而不是任意一个字母 所以这个表达式匹配的是两个完全相同的字母 而如果是b(w)wb 则是表示两个允许不相同的字母

测试

  • (ab)ab就是一个整体看待,和单独的字符串ab没有区别

    dbcba9873f6a0750a292b160dab53ad0.png
  • (?<word>ab)k<word>
    ab这个组命名为word,然后在后面调用前面命名的这个组匹配的字符,即这个表达式相当于(ab)ab

    a2cd4e767ee47d41d5cd5e2d463184ee.png
  • (?:a)(b)1
    前面的组被取消命名,所以自动命名从(b)开始,所以后面的1匹配的是(b)

    a9297d68dc6ad491bf0060cde9312c78.png
  • b(?=a)
    这个表达式的意思是,匹配字符b,这个字符b的后面紧跟着一个a

00d732ea7958e6d5fd5f75f417c75734.png
  • b(?!a)
    这个表达式的意思是,匹配字符b,这个字符b的后面不是a

    c1578093e4a01e50a04fcdf3f7164d4c.png
  • (?<=a)b
    这个表达式的意思是,匹配字符b,这个字符b的前面是a

558ebd4f71584290dd611a5e38de3e66.png
  • (?<!a)b
    这个表达式的意思是,匹配字符b,这个字符b的前面不是a

    5553133634d1f5013b55155c7ce3dbce.png
  • (?>a)b

    3196fa0b440bc6a9b649ba3e53dfaa8d.png

参考

  1. 王蕾. 神奇的匹配 正则表达式求精之旅[M]. 北京:电子工业出版社, 2014.
  2. 文中使用的正则表达式测试工具:正则表达式测试工具在线调试与分享-Zjmainstay
  3. 文中使用的正则表达式可视化生成工具:Regulex JavaScript Regular Expression Visualizer.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/433494.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解构给默认值_ES6学习 --函数参数默认值与解构赋值默认值

1. ES6的解构ES6中引入了解构赋值的操作&#xff0c;其作用是&#xff1a;将值从数组Array或属性从对象Object提取到不同的变量中即分为两种情况&#xff1a;从数组Array中解构&#xff0c;以及从对象Object中解构①.从数组中解构const [a, b] [1, 2]//a 1, b 2当然这些是基…

jsp思维导图_2019年经济法基础思维导图

参加2019年初级考试的考生们明天可以打印准考证啦时间&#xff1a;2019.4.26-5.5日(传送门&#xff1a;http://kjbm8.mof.gov.cn/ksbm/usercxzkz.jsp)为了帮助大家快速梳理教材考点&#xff0c;下面蓝星职业教育为大家整理了初级会计职称考试各章节思维导图&#xff0c;希望给大…

海量数据持久层解决方案_爱数AnyBackup重磅发布海量非结构化数据超可用解决方案...

海量非结构化数据有三大备份恢复问题一直没有得到有效解决&#xff1a;备份慢、恢复慢、备份数据不可查询。这三大问题已经对行业数字化转型造成了重大阻碍。今天&#xff0c;AnyBackup Family 7线上发布会——重磅发布海量非结构化数据超可用解决方案。AnyBackup以创新超可用技…

【PHP】伪静态 - 1. 使用正则表达式实现

在我们实际开发中&#xff0c;有需要&#xff0c;不希望使用真静态&#xff0c;但是希望利于SEO, 可以考虑使用伪静态。 http://localhost/news.php?typemusic&id100 我们希望这个地址可以用下面的访问url来替换 http://localhost/new-music-id100.html 上面的问题可以使用…

wpf 使子ui元素可视区域不超过父元素_对游戏UI设计的一点思考

UI决定了一个游戏的初体验&#xff0c;甚至决定了玩家的初始留存&#xff0c;甚至可以说决定了一个游戏的品质&#xff0c;虽然看起来是表象的&#xff0c;却是直指游戏核心的。简单讲&#xff0c;玩家认可一款游戏永远都是造型场景好&#xff0c;剧情好&#xff0c;画质棒&…

linux新的API signalfd、timerfd、eventfd使用说明

三种新的fd加入linux内核的的版本&#xff1a; signalfd&#xff1a;2.6.22 timerfd&#xff1a;2.6.25 eventfd&#xff1a;2.6.22 三种fd的意义&#xff1a; signalfd&#xff1a;传统的处理信号的方式是注册信号处理函数&#xff1b;由于信号是异步发生的&#xff0c;要…

grpc入门到精通_Spring Cloud 从入门到精通(一)Nacos 服务中心初探

点击上方蓝色“Java精选”&#xff0c;选择“设为星标”技术文章第一时间送达&#xff01;什么是Nacos&#xff1f;Nacos是阿里巴巴开源的项目&#xff0c;是一个更易于帮助构建云原生应用的动态服务发现、配置管理和服务管理平台。Nacos英文全称是Dynamic Naming and Configur…

百度新年贪吃蛇效果

闲来无事&#xff0c;在网上闲逛的时候开到有人说百度蛇年的贪吃蛇logo小游戏不错&#xff0c;于是乎就自己仿照写了一个。&#xff08;注&#xff1a;所有素材都来自百度&#xff09; 效果图 用到的图片 1 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional…

贝叶斯公式设b_数据分析经典模型——朴素贝叶斯

编辑导语&#xff1a;做过数据分析的人&#xff0c;想必对贝叶斯模型都不会陌生。贝叶斯预测模型是运用贝叶斯统计进行的一种预测&#xff0c;不同于一般的统计方法&#xff0c;其不仅利用模型信息和数据信息&#xff0c;而且充分利用先验信息。通过实证分析的方法&#xff0c;…

QGraphicsProxyWidget paintEvent(from 1+1 =2)

标题不好取&#xff0c;起源于CSDN中看到有网友提问&#xff1a;如果将一个QWidget同时显示在 QGraphicsView 和其他和view同级的普通的Widget中。 QGraphicsProxyWidget QGraphicsProxyWidget 是为将 QWidget 嵌入到 QGraphicsScene 中而引入的代理。 将 event 在二者之间进行…

Asterisk使用数据库配置方法

安装&#xff1a; 1、安装 unixODBC unixODBC-devel libtool-ltdl libtool-ltdl-devel &#xff0c;为了使asterisk支持数据库存储&#xff08;必须先安装&#xff09; 2、安装 mysql 并设置好 C_INCLUDE_PATH 和 LD_LIBRARY_PATH 3、从 http://www.asterisk.org/downloads 下载…

linux文件系统_Linux的文件系统简介

inux操作系统的本质可以说就是文件系统的集合&#xff0c;文件系统既包含文件的数据也包含文件系统的结构。在Linux文件系统中&#xff0c;EXT2文件系统、虚拟文件系统、/proc文件系统是三个具有代表性的文件系统。/proc文件系统是一个伪文件系统&#xff0c;它只存在内存当中&…

matlab如何测两点的角度_根据2点经纬度,计算方位角,以及计算2条线的夹角

以真北为0度起点&#xff0c;由东向南向西顺时针旋转360度&#xff0c;主要是用于控制象限。根据2点经纬度&#xff0c;计算方位角[csharp]////// 给定2点&#xff0c;获得经纬度/// /// 起点经纬度&#xff0c;都是以度为单位/// 终点经纬度&#xff0c;都是以度为单位/// pri…

VMWare 环境下devstack创建虚拟机报错及修改nova-api返回数据得条目

1、在生产环境中&#xff0c; 由于某个tenant下创建了有1300条得security-group通过查询nova得数据库可以看出确实有1300条得存在&#xff0c;但是通过curl调用的时候发现返回得数目只有1000条 可以通过修改nova.conf文件得osapi_max_limit 项修改返回得条目限制&#xff0c;默…

使用数据库保存Asterisk sip账号信息(odbc方式)

在默认情况下&#xff0c;Asterisk的配置文件都保存在/etc/asterisk目录中&#xff0c;以ini文件的格式保存。我们也可以使用数据库来保存大多数Asterisk配置信息。 Asterisk使用数据库保存配置信息有两种方法&#xff1a;静态和动态&#xff0c;对于不经常修改的配置数据&…

删除按钮_汪涵拜师学艺第七篇:往来单位查询删除按钮和新增判断的设计!

老师好&#xff01;大家好&#xff01;我叫汪涵&#xff1a;今天给大家分享往来单位查询删除按钮和新增判断的设计&#xff01;在开始具体内容之前&#xff0c;请让我先分享我们的价值观&#xff1a;用自律和勤奋来改变命运&#xff0c;不走捷径&#xff0c;有爱心&#xff0c;…

python requests https_解决python的requests模块访问私有SSL证书产生的报错问题

如题访问部分私有SSL证书网站时报如下错误requests.exceptions.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:581)测试环境kali linux 1.1.0Python 2.7.8python-openssl 0.13-2deb7u1requests 2.3.0测试代码#/usr/bin/python#codingutf-8imp…

Ubuntu 12.04(32位)安装Oracle 11g(32位)全过程以及几乎所有问题的解决办法

这两天在Ubuntu上安装Oracle把人折腾毁了&#xff0c;即使照着网上的教程来&#xff0c;还是出了很多问题。好在最后终于搞定了。写出来总结一下&#xff0c;免得以后忘了。 标题注明32位是因为网上教程几乎全是以64位安装为例的&#xff0c;32位系统下照着做是绝对会安装失败的…

dio设置自定义post请求_Flutter Dio简单二次封装和自定义Header

话不多说自己看代码封装的比较简单&#xff0c;比较适合入门学习Dio。import package:dio/dio.dart;import Api.dart;/** 封装 restful 请求** GET、POST、DELETE、PATCH* 主要作用为统一处理相关事务&#xff1a;* - 统一处理请求前缀&#xff1b;* - 统一打印请求信息&#x…

解决asterisk sip呼叫 488 no acceptable here

这两天实验了一下asterisk static realtime方案&#xff0c;将sip.conf的信息保存到mysql数据库里。但是呼叫的时候&#xff0c;总是 报 488 no acceptable here。 这是我的sip.conf文件&#xff0c;数据库里和sip.conf文件一模一样&#xff0c;但是就是不行。 [general] c…