作为程序员之正则表达式

目录

  • 正则表达式
    • 基础语法
      • 标准字符集合
      • 自定义的字符集合
      • 多行、单行模式
    • 高级语法
      • 选择符和分组
      • 反向引用
      • 预搜索/零宽断言
    • 例子
      • 匹配邮箱

正则表达式

基础语法

标准字符集合

\D 和[^\d]意思一样,就是与 \d 相反

REG意义
\ddigital表示 0 到 9 之间任意的一个数字
\wworld表示任意一个字母或数字或下划线,不包含¥$%等
\sspace表示包括空格、制表符、换行符等空白字符中任意一个
.可以匹配任意一个字符

自定义的字符集合

REG意义
[ad# ]方括号表示匹配 a 或 d 或 # 或 空格
^[ad# ]表示除方括号以外的字符
[a-g]表示匹配 a 到 g 之间的字符,别和上面的混淆了
[^a-f,0-3]匹配除了 a - f 和 0 到 3以外的字符

匹配次数

REG意义
(\d){10}前面的规则重复匹配了10次
{n,m}表示至少重复n次,最多重复m次
{n,}至少n次
?同{0,1}
+同{1,}
*同{0,}

多行、单行模式

  1. 忽略大小写:ignorecase
  2. 单行模式:single line 整个串作为一个模板串
  3. 多行模式:multi line 模板串分为多个行

    字符边界/匹配位置

    REG意义
    ^与字符串开始的地方匹配
    $与字符串结束的地方匹配
    \b表示在边界处匹配字符,放在左右会不一样的结果

高级语法

选择符和分组

REG意思
\|表示‘或’的意思,匹配左边或右边
()对正则表达式分组,更好地组织匹配
(?:Expression)不把()组中匹配到的字符不保存到group中

反向引用

\nnn反向引用|把捕获的字符分组编号,左括号为一个分组

预搜索/零宽断言

也是匹配位置

很少用的

REG意义
(\w)(?=Expression)匹配以Expression匹配到的字符结尾的字符
(\w)(?!Expression)匹配不能以Expression匹配到的字符结尾的字符
(\w)(?<=Expression)位置前面可以匹配Expression
(\w)(?<!Expression)位置后面可以Expression

表达式 方向 说明
|GEG|意义|
|:----|----:|----:|
|(?=xxx)|正向预搜索(向右) 正向预搜索,判断当前位置右侧是否能匹配指定表达式 |
|(?!xxx) | 正向预搜索(向右) 正向预搜索否定,判断当前位置右侧是否不能够匹配指定表达式 |
|(?<=xxx)| 反向预搜索,反向预搜索,判断当前位置左侧是否能够匹配指定表达式|

例子

匹配邮箱

brdlianyao_org.gif
23170831-5d9e8c439750496fb2ffec7616fecb7b.jpg

要考虑的问题:

  1. 把@前面的给匹配了:(\w+)
  2. 匹配“.”:. (因为“.”表示任意字符,所以要转义一下才能匹配到“.”)
  3. 把@后面的域名给匹配了,要考虑多层域名的匹配
  4. 用户名和域名中的大小写
  5. 用户名中含有 “.”
  6. 并不允许用户名中出现”-“

第一版
没能匹配到用户名中有 ”.“的邮箱
(\w+)@(\w+)(\.[a-zA-Z]{2,5}){1,2}

2989389@qq.com
adfj32KddkfKJAD@163.com
ajdf23AKDJFO@yahoo.com.cn
akdjf239290@guet.org
KFADJSFOAJDSFOAEJ@GUET.EDU.CN

最终版


![](https://images0.cnblogs.com/blog/582013/201312/23170854-ccd9c8305e1d43e998a0240d67cdc1f2.jpg)
这个可以匹配用户名含有“.“的邮箱

package regex;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class MatchMail {
public static void main(String[] args) {

    //正则表达式Pattern p = Pattern.compile("(\\w)+(\\.\\w+)*@(\\w)+((\\.\\w{2,3}){1,3})");//待匹配的字符串String str = "2989389@qq.com"+ "adfj32KddkfKJAD@163.com"+ "ajdf23AKDJFO@yahoo.com.cn"+ "akdjf239290@guet.org"+ "KFADJSFOAJDSFOAEJ@GUET.EDU.CN"+"23jka32ir.323dfj@qq.com"+"23rfasdf.com.@163.qq.com";//用正则表达式去匹配字符串Matcher m = p.matcher(str);int i = 0;//如果发现,m.find()则为truewhile(m.find()){//每一组匹配到的字符都被放到了group里System.out.println(m.group(0));i++;}System.out.println(i);
}

}


###中文字符###
**[\u4e00-\u9fa5]**
***###用正则表达式取出正则表达式中括号里的数据
![](http://images2015.cnblogs.com/blog/640685/201509/640685-20150901151130888-1768887603.png)

package atest;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Aa {
public static void main(String args[]) throws Exception {
// 用正则表达式把字符串中的浮点数提取出来
// "\d[.]\d" 不能处理 .t3
// “\(.*?\)” 也是可以的
Pattern p = Pattern.compile("[\d]+\.[\d]+");
String u = "Mv(2.50),Tl(3.25),3.t3,3.,3..,Tr(3.26),Bk(2.16)";
Matcher m = p.matcher(u);

    // 统计有多少个浮点数int i = 0;while (m.find()) {System.out.println(m.group());i++;}System.out.println(i);
}

}

###匹配IP地址###
> 1. 匹配:三个字符一个点 三个字符一个点 三个字符一个点 三个字符
> 2. IP地址<255
> 3. IP地址的数字不能以0开始,如:012.* 第一版:
```
((\d{1,3})\.){3}\d{1,3}
```
把562.264.351也匹配了,没能确定IP地址<255* 第二版(最终版)
```
(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)
```
```/ ***    最简洁的IP判断正则表达式*  25[0-5]                     250-255*  2[0-4]\d                    200-249*  [01]?\d\d?                 000-199(0-9 \d)(10-99 \d\d)(100-99 1\d\d)*  ($|(?!\.$)\.)               结束 或者 不以.结束的加上.*  (?!^0{1,3}(\.0{1,3}){3}$)     排除 0.0.0.0 /^(?!^0{1,3}(\.0{1,3}){3}$)((25[0-5]|2[0-4]\d|[01]?\d\d?)($|(?!\.$)\.)){4}$/*  (?!^255(\.255){3}$)           排除 255.255.255.255*/ 
```###电话、手机号码##
> 固定电话7位数,包含0开头和”—”
> 移动电话11位数,以13或15开头```
(0\d{2,3}-\d{7,9})|(1[35]\d{9})
```
![](http://images2015.cnblogs.com/blog/640685/201509/640685-20150901221837544-1968355426.png)

package regex;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class TestCode {
public static void main(String[] args) {
Pattern p = Pattern.compile("(0\d{2,3}-\d{7,9})|(1[35]\d{9})");
String str = "15907877344"
+ "0774-1593849"
+ "13877477862"
+ "1555615951"
+ "6651651565151"
+ "13515a1dfa91w13"
+ "434$tfsf51asf51"
+ "8E94 WE8";
Matcher m = p.matcher(str);
while(m.find())
{
System.out.println(m.group(0));
}
}
}

````

所用到的工具是RegexBuddy
022028425952741.png

转载于:https://www.cnblogs.com/tianjintou/p/4695953.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/256933.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

javascript 的dateObj.getTime() 在为C#的获取方式

publicstringGetTime() { Int64 retval 0; DateTime st newDateTime(1970, 1, 1); TimeSpan t (DateTime.Now.ToUniversalTime() -st); retval (Int64)(t.TotalMilliseconds 0.5); returnretval.ToString(); } 在Net中的实际测试代码 MSScriptControl.Scri…

Jmeter服务器监控插件使用

Jmeter服务器监控插件使用 Jmeter-Plugins支持CPU、Memory、Swap、Disk和Network的监控&#xff0c;在测试过程中更加方便进行结果收集和统计分析。 一、准备工作&#xff1a; 1、下载Jmeter-Plugins插件&#xff0c;下载Server端ServerAgent插件&#xff1b; 2、解压Jmeter-Pl…

CCNA系列课程(4)交换技术

第四节课 交换技术杜飞2009-06-28咱们今天来看一下局域网交换技术&#xff0c;也称为层2交换技术&#xff0c;内容主要包括层2交换的工作原理、网络环路、如何利用Spanning-Tree Protocol 来解决网络环路、VLAN及VTP技术&#xff0c;闲话少说&#xff0c;书归正传。我们在…

python学习之路基础篇(第八篇)

一、作业&#xff08;对象的封装&#xff09;     要点分析 1.封装&#xff0c;对象中嵌套对象 2.pickle,load,切记&#xff0c;一定要先导入相关的类二、上节内容回顾和补充      面向对象基本知识&#xff1a; 1.类和对象的…

Ubuntu实现树莓派交叉编译

一、交叉编译 在一个平台上生成另一个平台上的可执行代码。为什么要大费周折的进行交叉编译呢&#xff1f;一句话&#xff1a;不得已而为之。有时是因为目的平台上不允许或不能够安装所需要的编译器&#xff0c;而又需要这个编译器的某些特征&#xff1b;有时是因为目的平台上的…

ubuntu系统安装vscode教程

方法一&#xff1a; 依次输入如下命令 1、sudo add-apt-repository ppa:ubuntu-desktop/ubuntu-make 2、sudo apt-get update 3、sudo apt-get install ubuntu-make 4、umake ide visual-studio-code 提示输入a即可 方法二&#xff1a; 在windows系统下载安装包&#xff0c…

Vue2 源码漫游(一)

Vue2 源码漫游&#xff08;一&#xff09; 描述&#xff1a; Vue框架中的基本原理可能大家都基本了解了&#xff0c;但是还没有漫游一下源码。 所以&#xff0c;觉得还是有必要跑一下。 由于是代码漫游&#xff0c;所以大部分为关键性代码&#xff0c;以主线路和主要分支的代码…

神经网络中的反向传播算法

神经网络中的方向传播算法讲得复杂难懂。简单地说明它的原理&#xff1a; 神经网络&#xff1a;输入层&#xff0c;隐藏层&#xff0c;输出层。根据线性关系&#xff0c;激活函数&#xff0c;并最终根据监督学习写出误差表达式。此时&#xff0c;误差函数可写成&#xff0c;那么…

有限元笔记02:第三章

1.局部坐标到全局坐标变换 2.

Android 抽屉布局

目前部分APP使用一种类似抽屉式的布局&#xff0c;像QQ那种&#xff0c;感觉很炫&#xff0c;自己也一直想做一个像那样的布局&#xff0c;&#xff08;ps网上很多这样的例子&#xff0c;我下面做的就是参考网上的改变的&#xff09; 废话不就不说了&#xff0c;直接上代码 1、…

双目标定算法

坐标系基础知识&#xff1a; > 1.1. 从像素坐标系(u,v) 到 世界坐标系(Xw,Yw,Yw) 这里直接拿上篇博文的结果&#xff0c;中间省去了其它坐标系直接的关系&#xff0c;直接给出&#xff0c;如下所示&#xff1a; 公式如下&#xff1a; > 1.2. 符号规定( Notation ) 为了…

Excel使用控件创建动态地图图表

[本文软件Excel 2010] 效果图&#xff1a; 首先我们看一下数据源 数据源中第二列是对应图形的名称。首先创建图形&#xff0c;我们可能在网络中找到各个地图的矢量图形。不过不是每个地图图形都适合我们&#xff0c;或许企业划分非按照行政区划分。因此可以尝试自己绘制&#x…

使用Configuration Manager部署及管理软件更新(2)

承接上一篇文章&#xff1a;http://ericxuting.blog.51cto.com/8995534/1543835 一、 确定软件更新符合性 1. 打开Configuration Manager管理控制台&#xff0c;点击软件库&#xff0c;展开软件更新&#xff0c;点击所有软件更新 2. 点击主页中的运行摘要&#xff0c;等待对话框…

Fiddler 域名过滤

原来一直没意识到Fiddler过滤&#xff0c;导致每次抓包都要自己判断、搜索好多东西&#xff0c;真是呵呵&#xff01; 过滤设置很简单&#xff0c;看懂一张图就解决问题了。 箭头 那两处设置下&#xff0c;圆圈处保存再进行抓包即可 转载于:https://www.cnblogs.com/eejron/p/4…

windows中VS卸载opencv配置,重新安装其他版本

1、找到工程的属性管理器&#xff0c;电机Debug64和Release64下面的 包含目录和库目录&#xff0c;删掉其原由配置的oepncv路径&#xff1b; 找到链接器中的附加依赖项&#xff0c;删掉原有的配置&#xff1b;

学习笔记(36):Python网络编程并发编程-IO模型介绍

立即学习:https://edu.csdn.net/course/play/24458/296460?utm_sourceblogtoedu I/O模型介绍&#xff1a;I/O模型表示处于等待状态的模型&#xff0c;如套接字通讯的accept和recv函数一样 1.同步I/O 2.异步I/O 3.阻塞I/O 4.非阻塞I/O

AD9 如何画4层pcb板

新建的PCB文件默认的是2层板&#xff0c;教你怎么设置4层甚至更多层板。在工具栏点击Design-->Layer Stack Manager.进入之后显示的是两层板&#xff0c;添加为4层板&#xff0c;一般是先点top layer, 再点Add Layer,再点Add Layer&#xff0c;这样就成了4层板。见下图。 有…

windows上使用cmake 编译yaml-cpp源码,生成yam-cpp.lib

1、打开cmake-gui 2、添加CmakeList 3、建立build 4、进入工程中生成debug和release版本的lib

BZOJ 3039: 玉蟾宫( 悬线法 )

最大子矩阵...悬线法..时间复杂度O(nm)悬线法就是记录一个H向上延伸的最大长度(悬线), L, R向左向右延伸的最大长度, 然后通过递推来得到. ------------------------------------------------------------------#include<bits/stdc.h>using namespace std;#define ok(c) …

学习笔记(37):Python实战编程-yield实现生成器

立即学习:https://edu.csdn.net/course/play/19711/255579?utm_sourceblogtoedu1.yield return generator yield是一个返回的是一个生成器对象&#xff0c;是通过next函数一次一次地进行函数地迭代来获取结果的&#xff0c;而return函数则是将结果返回后&#xff0c;不再与…