字符搜索正则表达式语法详解

工作之余抽点时间出来写写博文,希望对新接触的朋友有帮助。明天在这里和大家一起学习一下字符搜索

    作为一个术技,时常会到碰正则表达式相干的西东,很多时候忙着赶进度,都是在网上找一个可以决解的正则表达式,或是换另外一种法方实现,直一没有系统地解了正则表达式,明天终究有时间又有闲情来具体地看看正则表达式的语法,不求成为手高,最起码到碰问题能用正则表达式决解,或是拿到一个正则表达式,起码可以看懂面里的意思......

    

“正则表达式”描述在索搜文本正文时要匹配的一个或多个字符串。该表达式可用作一个将字符模式与要索搜的字符串相匹配的模板。

正则表达式含包一般字符(例如,a 到 z 之间的母字)和特殊字符(称为“元字符”)。

    

特殊字符

下表含包了单字符元字符的表列以及它们在正则表达式中的为行。

明说

若要匹配这些特殊字符之一,必须首先义转字符,即,在字符面后加反斜杠字符 (\)。例如,若要索搜“+”文本字符,可应用表达式“\+”。

元字符

为行

示例

*

零次或多次匹配面后的字符或子表达式。

等效于 {0,}

zo* 与“z”和“zoo”匹配。

+

一次或多次匹配面后的字符或子表达式。

等效于 {1,}

zo+ 与“zo”和“zoo”匹配,但与“z”不匹配。

?

零次或一次匹配面后的字符或子表达式。

等效于 {0,1}

当 ?紧随任何其他限定符(*、+、?、{n}、{n,} 或 {n,m})后之时,匹配模式非是婪贪的。非婪贪模式匹配索搜到的、尽可能少的字符串,而认默的婪贪模式匹配索搜到的、尽可能多的字符串。

zo? 与“z”和“zo”匹配,但与“zoo”不匹配。

o+? 只与“oooo”中的单个“o”匹配,而 o+ 与全部“o”匹配。

do(es)? 与“do”或“does”中的“do”匹配。

^

匹配索搜字符串开始的位置。如果标记中含包 m(多行索搜)字符,^ 还将匹配 \n 或 \r 面后的位置。

如果将 ^ 用作括号表达式中的第一个字符,则会对字符集求反。

^\d{3} 与索搜字符串开始处的 3 个数字匹配。

[^abc] 与除 a、b 和 c 外以的任何字符匹配。

$

匹配索搜字符串尾结的位置。如果标记中含包 m(多行索搜)字符,^ 还将匹配 \n 或 \r 面后的位置。

\d{3}$ 与索搜字符串尾结处的 3 个数字匹配。

.

匹配除换行符 \n 外以的任何单个字符。若要匹配含包 \n 在内的恣意字符,请应用诸如 [\s\S] 之类的模式。

a.c 与“abc”、“a1c”和“a-c”匹配。

[]

标记括号表达式的开始和尾结。

[1-4] 与“1”、“2”、“3”或“4”匹配。[^aAeEiIoOuU] 与任何非元音字符匹配。

{}

标记限定符表达式的开始和尾结。

a{2,3} 与“aa”和“aaa”匹配。

()

标记子表达式的开始和尾结。可以存保子表达式以备来将之用。

A(\d) 与“A0”至“A9”匹配。存保该数字以备来将之用。

|

示指在两个或多个项之间停止择选。

z|food 与“z”或“food”匹配。(z|f)ood 与“zood”或“food”匹配。

/

表现 JScript 中的文本正则表达式模式的开始或尾结。在第二个“/”后添加单字符标记可以指定索搜为行。

/abc/gi 是与“abc”匹配的 JScript 文本正则表达式。g(全局)标记指定查找模式的全部匹配项,i(略忽大小写)标记使索搜不区分大小写。

\

将下一字符标记为特殊字符、文本、反向引用或八进制义转符。

\n 与换行符匹配。\( 与“(”匹配。\\ 与“\”匹配。

大多数特殊字符在括号表达式内出现时得到它们的意思,并表现一般字符。有关更多息信,请拜见匹配字符的表列中的“括号表达式中的字符”。

每日一道理
试试看——不是像企鹅那样静静的站在海边,翘首企盼机会的来临,而是如苍鹰一般不停的翻飞盘旋,执著的寻求。 试试看——不是面对峰回路转、杂草丛生的前途枉自嗟叹,而是披荆斩棘,举步探索。 试试看——不是拘泥于命运的禁锢,听凭命运的摆布,而是奋力敲击其神秘的门扉,使之洞开一个新的天地。微笑着,去唱生活的歌谣。

    

元字符

下表含包了多字符元字符的表列以及它们在正则表达式中的为行。

元字符

为行

示例

\b

与一个字边界匹配;即字与空格间的位置。

er\b 与“never”中的“er”匹配,但与“verb”中的“er”不匹配。

\B

非边界字匹配。

er\B 与“verb”中的“er”匹配,但与“never”中的“er”不匹配。

\d

数字字符匹配。

等效于 [0-9]

在索搜字符串“12 345”中,\d{2} 与“12”和“34”匹配。\d 与“1”、“2”、“3”、“4”和“5”匹配。

\D

非数字字符匹配。

等效于 [^0-9]

\D+ 与“abc123 def”中的“abc”和“def”匹配。

\w

与以下恣意字符匹配:A-Z、a-z、0-9 和下划线。

等效于 [A-Za-z0-9_]

在索搜字符串“The quick brown fox…”中,\w+ 与“The”、“quick”、“brown”和“fox”匹配。

\W

与除 A-Z、a-z、0-9 和下划线外以的恣意字符匹配。

等效于 [^A-Za-z0-9_]

在索搜字符串“The quick brown fox…”中,\W+ 与“…”和全部空格匹配。

[xyz]

字符集。与任何一个指定字符匹配。

[abc] 与“plain”中的“a”匹配。

[^xyz]

反向字符集。与未指定的任何字符匹配。

[^abc] 与“plain”中的“p”、“l”、“i”和“n”匹配。

[a-z]

字符范围。匹配指定范围内的任何字符。

[a-z] 与“a”到“z”范围内的任何小写母字字符匹配。

[^a-z]

反向字符范围。与不在指定范围内的任何字符匹配。

[^a-z] 与不在范围“a”到“z”内的任何字符匹配。

{n}

恰好匹配 n 次。非是负数整。

o{2} 与“Bob”中的“o”不匹配,但与“food”中的两个“o”匹配。

{n,}

最少匹配 次。非是负数整。

* 与 {0,} 等相。

+ 与 {1,} 等相。

o{2,} 与“Bob”中的“o”不匹配,但与“foooood”中的全部“o”匹配。

{n,m}

匹配最少 n 次,多至 m 次。n 和 m 非是负数整,其中 n <= m逗号和数字之间不能有空格。

? 与 {0,1} 等相。

在索搜字符串“1234567”中,\d{1,3} 与“123”、“456”和“7”匹配。

(模式)

模式 匹配并存保匹配项。您可以从由 JScript 中的 exec Method回返的数组素元中检索存保的匹配项。若要匹配括号字符 ( ),请应用“\(”或者“\)”。

(Chapter|Section) [1-9] 与“Chapter 5”匹配,存保“Chapter”以备来将之用。

(?:模式)

模式 匹配,但不存保匹配项;即不会存储匹配项以备来将之用。这对于用“or”字符 (|) 组合模式部件的况情很有效。

industr(?:y|ies) 与 industry|industries 等相。

(?=模式)

极积的测预先行。找到一个匹配项后,将在匹配文本之前开始索搜下一个匹配项。不会存保匹配项以备来将之用。

^(?=.*\d).{4,8}$ 对密码应用以下制约:其长度必须介于 4 到 8 个字符之间,并且必须最少含包一个数字。

在该模式中,.*\d 查找后跟有数字的恣意多个字符。对于索搜字符串“abc3qr”,这与“abc3”匹配。

从该匹配项之前(而不是后之)开始,.{4,8} 与含包 4-8 个字符的字符串匹配。这与“abc3qr”匹配。

^ 和 $ 指定索搜字符串的开始和结束位置。这将在索搜字符串含包匹配字符外以的任何字符时阻挠匹配。

(?!模式)

极消的测预先行。匹配与模式 不匹配的索搜字符串。找到一个匹配项后,将在匹配文本之前开始索搜下一个匹配项。不会存保匹配项以备来将之用。

\b(?!th)\w+\b 与不以“th”扫尾的单词匹配。

在该模式中,\b 与一个字边界匹配。对于索搜字符串“ quick ”,这与第一个空格匹配。(?!th) 与非“th”字符串匹配。这与“qu”匹配。

从该匹配项开始,\w+ 与一个字匹配。这与“quick”匹配。

\cx

匹配 x 示指的控制字符。x 的值必须在 A-Z 或 a-z 范围内。如果不是这样,则定假 c 就是文本“c”字符本身。

\cM 与 Ctrl+M 或一个回车符匹配。

\xn

匹配 n,此处的 n 是一个十六进制义转码。十六进制义转码必须恰好是两位数长。答应在正则表达式中应用 ASCII 代码。

\x41 与“A”匹配。\x041 等效于后跟有“1”的“\x04”(因为 n 必须恰好是两位数)。

\num

匹配 num,此处的 num 是一个正数整。这是对已存保的匹配项的引用。

(.)\1 与两个连续的同相字符匹配。

\n

标识一个八进制义转码或反向引用。如果 \n 面后最少有 n 个捕获子表达式,那么 n 是反向引用。否则,如果 n 是八进制数 (0-7),那么 n 是八进制义转码。

(\d)\1 与两个连续的同相数字匹配。

\nm

标识一个八进制义转码或反向引用。如果 \nm 面后最少有 nm 个捕获子表达式,那么 nm 是反向引用。如果 \nm 面后最少有 n 个捕获子表达式,则 n 是反向引用,面后跟有文本 m如果上述况情都不存在,当 n 和 m 是八进制数字 (0-7) 时,\nm 匹配八进制义转码 nm

\11 与制表符匹配。

\nml

当 n 是八进制数字 (0-3),m 和 l 是八进制数字 (0-7) 时,匹配八进制义转码 nml

\011 与制表符匹配。

\un

匹配 n,其中 n 是以四位十六进制数表现的 Unicode 字符。

\u00A9 与版权符号 (©) 匹配。

    

非打印字符

下表含包表现非打印字符的义转列序。

字符

匹配

等效于

\f

换页符。

\x0c 和 \cL

\n

换行符。

\x0a 和 \cJ

\r

回车符。

\x0d 和 \cM

\s

任何空白字符。其中含包空格、制表符和换页符。

[\f\n\r\t\v]

\S

任何非空白字符。

[^\f\n\r\t\v]

\t

Tab 字符。

\x09 和 \cI

\v

垂直制表符。

\x0b 和 \cK

    

优先级序顺

正则表达式的算计式方与算术表达式非常相似;即从左到右停止算计,并循遵优先级序顺。

下表按从高到低的序顺含包了正则表达式运算符的优先级序顺。

运算符

明说

\

义转符

(), (?:), (?=), []

括号和中括号

*、+、?、{n}、{n,}、{n,m}

限定符

^、$、\任何元字符

定位点和列序

|

替换

字符拥有高于替换运算符的优先级,例如,答应“m|food”匹配“m”或“food”。

文章结束给大家分享下程序员的一些笑话语录: 祝大家在以后的日子里. 男生象Oracle般健壮; 女生象win7般漂亮; 桃花运象IE中毒般频繁; 钱包如Gmail容量般壮大, 升职速度赶上微软打补丁 , 追女朋友像木马一样猖獗, 生活像重装电脑后一样幸福, 写程序敲代码和聊天一样有**。

转载于:https://www.cnblogs.com/xinyuyuanm/archive/2013/05/09/3069863.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/378409.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

gRPC之grpc resolver

1、grpc resolver 当我们的服务刚刚成型时&#xff0c;可能一个服务只有一台实例&#xff0c;这时候client要建立grpc连接很简单&#xff0c;只需要指定server 的ip就可以了。但是&#xff0c;当服务成熟了&#xff0c;业务量大了&#xff0c;这个时候&#xff0c;一个实例就…

linux测试固态硬盘读写速度,在 Linux 上检测 IDE/SATA SSD 硬盘的传输速度

你知道你的硬盘在 Linux 下传输有多快吗&#xff1f;不打开电脑的机箱或者机柜&#xff0c;你知道它运行在 SATA I (150 MB/s) 、 SATA II (300 MB/s) 还是 SATA III (6.0Gb/s) 呢&#xff1f;你能够使用 hdparm 和 dd 命令来检测你的硬盘速度。它为各种硬盘的 ioctls 提供了命…

stl标准模板库_C ++标准模板库(STL)中的array :: fill()

stl标准模板库fill() is a member function of "array container", which sets a given value to all array elements. It can also be used to set the value to other of containers also. Value type should be same as container type. fill()是“数组容器”的成…

Opencv——批量处理同一文件夹下的图片(解决savedfilename = dest + filenames[i].substr(len)问题)

文章目录前言一、完整代码二、实现效果前言 第一份代码实现了批量修改同一文件夹下图片的尺寸&#xff0c;有其他需求时仅需修改处理部分的代码以及文件夹路径。 第二份代码实现了批量截取同一文件夹下每张图片的ROI区域作为结果保存&#xff0c;注意截取后按下enter键才会跳到…

linux统计文件目录及其文件个数

linux下统计目录及其子目录的文件的个数 查看某目录下文件的个数 ls -l |grep "^-"|wc -l或find ./company -type f | wc -l 查看某目录下文件的个数&#xff0c;包括子目录里的。 ls -lR|grep "^-"|wc -l查看某文件夹下目录的个数&#xff0c;包括子目录里…

处理文件、摄像头和图形用户界面

1、基本I/O脚本 1.1 读/写图像文件 import numpy import cv2#利用二维Numpy数组简单创建一个黑色的正方形图像 img numpy.zeros((3,3),dtypenumpy.uint8) img #结果为&#xff1a;array([[0, 0, 0],[0, 0, 0],[0, 0, 0]], dtypeuint8)img.shape#结果为&#xff1a;(3, 3)###…

linux桌面天气,Ubuntu 14.10中安装和配置天气应用

对于操作系统平台而言&#xff0c;有各种小插件功能方便用户日常应用。在Ubuntu桌面中提供天气信息的功能&#xff0c;可以使用Unity Dash和桌面应用来获得相关信息&#xff0c;比如Typhoon。但对于用户而言&#xff0c;可以提供快速查询天气状况和温度数据&#xff0c;并且只需…

使用ACE_SOCK_SEQPACK_Association获取socket连接的本地及远程IP端口信息

int connect(const std::string& ip, int port){ ACE_INET_Addr portAddr(port, ip.c_str()); ACE_SOCK_Connector connector; ACE_SOCK_Stream peer; if (-1 connector.connect(peer, portAddr)) { std::cout << "连接服务器(" <&…

linux批处理操作系统_批处理操作系统

linux批处理操作系统批处理操作系统 (Batch Processing Operating System) When we are working in an environment there is a restriction of making use of computer resources effectively and improvement in the programmers output. When we are working with tapes a l…

STL容器及其简单应用(stack、priority_queue、vector、deuqe、list、map/multimap、set/multiset)

目录前言【1】stack操作以及应用stack的几个核心接口利用stack完成进制转换【2】priority_queue操作以及应用priority_queue的几个核心接口利用priority_queue完成合并果子问题【3】vector操作以及应用vector的几个核心接口利用vector完成随机排序【4】deuqe(双向队列)操作以及…

Android SAX API: XmlResourceParser及其扩展应用

XmlResourceParser继承了2个接口&#xff1a;AttributeSet和XmlPullParser。其中XmlPullParser定义了Android SAX框架。跟Java 的SAX API相比&#xff0c;XmlPullParser令人难以置信地简单。 一、使用XmlResourceParser读取资源束中的xml 资源束是应用程序编译后的应用程序包…

linux fdisk 磁盘空间使用率,linux查看磁盘剩余空间以及cpu使用情况

1、查看CPU个数cat /proc/cpuinfo | grep "physical id" | uniqtop可以实时的查看cpu的使用情况2、查看CPU核数cat /proc/cpuinfo | grep "cpu cores" | uniq3、查看CPU型号cat /proc/cpuinfo | grep model name |uniq4、查看内存cat /proc/meminfo | grep…

c语言 函数的参数传递示例_restder()函数,带有C ++中的示例

c语言 函数的参数传递示例C restder()函数 (C remainder() function) remainder() function is a library function of cmath header, it is used to calculate the remainder (IEC 60559), it accepts two parameters (numerator and denominator) and returns the remainder…

jquery validation-jquery的验证框架 详解(1)

jquery validation验证框架是一款非常优秀的客户端数据验证框架。我们在日常的项目中都会应用得到。今天开始我们会分两到三个个阶段 详细的了解这款插件 至于这款插件是多么的优秀&#xff0c;怎么个描述法 我这里就不详细述说。大家可以在接下来的时间里接触并且感觉它的强大…

已知一个掺杂了多个数字字符的中文名拼音,去掉所有数字字符之后,形式为“名”+空格+“姓”;并且名和姓的首字母大写,其他小写,要求输出姓名全拼,且全为小写。(后附详细样例说明)

已知一个掺杂了多个数字字符的中文名拼音&#xff0c;去掉所有数字字符之后&#xff0c;形式为“名”空格“姓”&#xff1b;并且名和姓的首字母大写&#xff0c;其他小写&#xff0c;要求输出姓名全拼&#xff0c;且全为小写。&#xff08;后附详细样例说明&#xff09; 【输入…

【视觉项目】【day2】8.21号实验记录(手机固定高度15cm拍摄+直方图均衡化+模板匹配,模板12个,测试28个,效果十分差)

目录均衡化代码模板图片按照大小排序总代码测试效果新思路由于模板匹配是像素之间的比对&#xff0c;所以不同光照下的像素灰度值也会不同 所以在比对之前&#xff0c;我们需要对测试图和模板图进行直方图均衡化&#xff0c;这一步可以先实现。 今天将采用批量处理的方式&#…

c语言 函数的参数传递示例_isgreater()函数以及C ++中的示例

c语言 函数的参数传递示例C isgreater()函数 (C isgreater() function) isgreater() function is a library function of cmath header, it is used to check whether the given first value is greater than the second value. It accepts two values (float, double or long…

在一个风景秀丽的小镇,一天早上,有N名晨跑爱好者(编号1~N)沿着优雅的江边景观道朝同一方向进行晨跑

【问题描述】 在一个风景秀丽的小镇&#xff0c;一天早上&#xff0c;有N名晨跑爱好者(编号1~N)沿着优雅的江边景观道朝同一方向进行晨跑&#xff0c;第i名跑者从位置si处起跑&#xff0c;且其速度为Vi。换句话说&#xff0c;对所有的实数t≥0&#xff0c;在时刻t时第i名跑者的…

linux内核测试,Linux内核测试的生命周期

内核持续集成(CKI)项目旨在防止错误进入 Linux 内核。在 Linux 内核的持续集成测试 一文中&#xff0c;我介绍了 内核持续集成Continuous Kernel Integration(CKI)项目及其使命&#xff1a;改变内核开发人员和维护人员的工作方式。本文深入探讨了该项目的某些技术方面&#xff…

Linux下动态库使用小结

1. 静态库和动态库的基本概念 静态库&#xff0c;是在可执行程序连接时就已经加入到执行码中&#xff0c;在物理上成为执行程序的一部分&#xff1b;使用静态库编译的程序运行时无需该库文件支持&#xff0c;哪里都可以用&#xff0c;但是生成的可执行文件较大。动态库&#xf…