正则表达式匹配(动规)

文章目录

  • 题目
  • 思路
    • 转移方程
    • 特征
    • 再探 i 和 j
  • 代码


题目

请实现一个函数用来匹配包含 .* 的正则表达式。模式中的字符 . 表示任意一个字符,而 * 表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串 aaa 与模式 a.aab*ac*a 匹配,但与 aa.aab*a 均不匹配。

来源:力扣(LeetCode)


思路

再一次膜拜大佬 作者:jyd
本文基于大佬的思路做自己的细节解析。

其实动规的难点一直在于“找规律”。(恐怕这也是所有算法题的难点,哈哈)

本题其实就是在考察程序员思考问题的全面性。

转移方程

先建立这道题的转移方程:

f[i][j] 代表 s 的前 i 个和 p 的前 j 个能否匹配。

当正则表达式中为 正常字符. 时,问题是很好解决的:

f[i][j]=f[i−1][j−1]

前 i 个 s前 j 个 p 是否匹配还要看 前 i-1 个 s前 j-1 个 p 是否匹配。

难点就在于是 字符 + * 时该怎么处理:

分为将字符看成 出现0次(也就是不看这两位)和 出现多次(看这个组合):

  • 不看:直接砍掉正则串的后面两个, f[i][j] = f[i][j-2]
  • 看:正则串不动,主串前移一个,f[i][j] = f[i-1][j]

上面两点,大部分题解已经说的很明白了,但其实又很抽象。我们不妨用例子来看一下:

  • 第一种比较好理解 —— f[i][j] = f[i][j-2]

s=abcd
p=abcde*

将主串的最后一位视为 i(a),正则串最后一位视为 j(*)。显而易见两个字符串是完全匹配的。只需要 * 前面的 e(j-1) 出现0次就可(正则串里面的 d 就是 j-2)。

  • 第二种理解起来可能有点抽象 —— f[i][j] = f[i-1][j]

s=abccc
p=abc*

此时 i为cj为*,因为 *前面的字符 可以 出现多次,也就是出现1次的递归操作。因此此时我们做的操作就是:

  • 已经知道了 ij(也就是*前的字符) ,那么再试着看看 i-1 还是不是 j

也就是原本相互匹配的字符我们不看了(都做-1操作),ij 彼此是匹配的,理应再看 i-1j-1,但是我们想要 j 多出现几次,因此 j-1 的操作没有执行。这就是下图中,jyd大佬所说的 p[j-2]多出现1次
在这里插入图片描述
图中总说 s[i-1] p[j-1] 为什么不是直接用 s[i] p[j] 呢?这个问题讲完初始化dp数组首行我们再细说。

特征

弄懂了主要的验证是否匹配的操作,接下来我们需要弄懂一些特例:

首先明晰一点:正则串和主串都是可以为空串的。

  • 空主串空正则是匹配的。
  • 非空串空正则必不匹配。
  • 空主串非空正则,不能直接判定匹配与否。
  • 非空串非空正则,那肯定是需要计算的了。

我们可以根据上面的特征,来初始化dp二维数组。

行代表s,列代表p,dp[0][j] 代表s为空,dp[i][0]代表p为空。

第四点其实就是我们的转移方程。因此我们来详解一下第三点:

s= '' '' 时,p=a*b*c*p=ab* 前者可以做到和空主串完美匹配,后者却不行。因此我们可以得出以下规律:

在这里插入图片描述
因此可以得到初始化dp首行的代码(首列无需做多余更改,空正则除了匹配空主串,其余皆不匹配):

// 初始化dp首行
dp[0][0] = 1;
for(size_t i = 2; i < cols; i += 2){dp[0][i] = dp[0][i-2] && p[i-1] =='*';
}

再探 i 和 j

我读完大佬写的题解的时候其实还是很懵懂的,真正豁然开朗是看了大佬的图解。大佬做图解一直有一手的~

下面结合图解来讲一下我们遗留的问题,dp[i][j] 和与之相对应的 s[i-1] p[j-1]

我们借用一下大佬的图来看一下:
在这里插入图片描述
我们会发现,前面提到:

  • 第一行,也就是下标为0的那行,代表 s 为空串
  • 第一列,也就是下标为0的那列,代表 p 为空串

我们是从第二行(下标为1的行)和第二列(下标为1的列)开始保存 s 和 p 的非空部分的

因此,举个具体的例子:dp[1][1]其逻辑含义是,保存的值表示 前1个s前1个p 是否匹配。在物理上代表 s[0]p[0] 组成的点。因此我们也就不难理解大佬图解中频繁出现的 dp[i][j]s[i-1] p[j-1] 之间的关系了。


代码

class Solution {
public:bool isMatch(string s, string p) {int rows = s.size()+1;int cols = p.size()+1;vector<vector<int>> dp(rows, vector<int>(cols, 0));// 初始化dp首行dp[0][0] = 1;for(size_t i = 2; i < cols; i += 2){dp[0][i] = dp[0][i-2] && p[i-1] =='*';}// 动规for(size_t i = 1; i < rows; i++){for(size_t j = 1; j < cols; j++){if(p[j-1] != '*'){if(dp[i-1][j-1] && (s[i-1]==p[j-1] || p[j-1] == '.')){dp[i][j] = 1;}}else{if(dp[i][j-2] || (dp[i-1][j] && (s[i-1] == p[j-2] || p[j-2] == '.'))){dp[i][j] = 1;}}}}return dp[rows-1][cols-1];}
};

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/443796.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在循环递增一次的数组中插入元素

文章目录题目思路如何建立左右区间&#xff1f;如何查找最高点&#xff1f;那我们怎么判断 num 到底处于什么样的位置呢&#xff1f;如何确定插入位置&#xff1f;插入元素代码题目 给一个只循环递增一次的数组 res&#xff0c;res 满足首元素大于等于尾元素&#xff0c;形如&…

表示数值的字符串(有限状态自动机与搜索)

文章目录题目思路一代码一思路二代码二题目 思路一 考察有限状态自动机&#xff08;参考jyd&#xff09;&#xff1a; 字符类型&#xff1a; 空格 「 」、数字「 0—9 」 、正负号 「 」 、小数点 「 . 」 、幂符号 「 eE 」 。 状态定义&#xff1a; 按照字符串从左到右的…

树的子结构

文章目录题目深搜深搜代码广搜广搜代码题目 输入两棵二叉树A和B&#xff0c;判断B是不是A的子结构。(约定空树不是任意一个树的子结构) B是A的子结构&#xff0c; 即 A中有出现和B相同的结构和节点值。 例如: 给定的树 A: 给定的树 B&#xff1a; 返回 true&#xff0c;因为…

写题过程中碰见的小问题

文章目录和--vector二维vector的初始化数组中最大的数max_element()数组所有元素之和accumulate()vector数组去重对pair类型的vector排序对元素都为正整数的vector利用sort默认的升序排列进行降序排列一维数组转二维数组size_t和int如何不用临时变量交换两个数?将类函数的形参…

LeetCode——二叉树序列化与反序列化

文章目录题目思路问题一问题二代码实现题目 请实现两个函数&#xff0c;分别用来序列化和反序列化二叉树。 设计一个算法来实现二叉树的序列化与反序列化。不限定序列 / 反序列化算法执行逻辑&#xff0c;你只需要保证一个二叉树可以被序列化为一个字符串并且将这个字符串反序…

jsp中生成的验证码和存在session里面的验证码不一致的处理

今天在调试项目的时候发现&#xff0c;在提交表单的时候的验证码有问题&#xff0c;问题是这样的&#xff1a;就是通过debug模式查看得知&#xff1a;jsp页面生成的验证码和表单输入的页面输入的一样&#xff0c;但是到后台执行的时候&#xff0c;你会发现他们是不一样的&#…

求1~n这n个整数十进制表示中1出现的次数

文章目录题目思路代码复杂度分析题目 输入一个整数 n &#xff0c;求1&#xff5e;n这n个整数的十进制表示中1出现的次数。 例如&#xff0c;输入12&#xff0c;那么1&#xff5e;12这些整数中包含1 的数字有1、10、11和12。可得1一共出现了5次。 思路 将个位、十位……每位…

求数字序列中的第n位对应的数字

文章目录题目思路代码复杂度分析致谢题目 数字以0123456789101112131415…的格式序列化到一个字符序列中。在这个序列中&#xff0c;第5位&#xff08;从下标0开始计数&#xff09;是5&#xff0c;第13位是1&#xff0c;第19位是4&#xff0c;等等。 请写一个函数&#xff0c…

一学就废的归并排序

文章目录其他与排序有关的文章原理代码实现复杂度分析其他与排序有关的文章 一学就废的三种简单排序【冒泡、插入、选择】 原理 归并排序&#xff08;Merge sort&#xff09;&#xff1a; 归并排序对元素 递归地 进行 逐层折半分组&#xff0c;然后从最小分组开始&#xff0c…

树状数组的相关知识 及 求逆序对的运用

文章目录树状数组概念前缀和和区间和树状数组原理区间和——单点更新前缀和——区间查询完整代码离散化sort函数unique函数去重erase函数仅保留不重复元素通过树状数组求逆序对树状数组概念 树状数组又名二叉索引树&#xff0c;其查询与插入的复杂度都为 O(logN)&#xff0c;其…

二叉搜索树相关知识及应用操作

文章目录概念查找二叉搜索树的第k大节点概念 二叉查找树&#xff08;Binary Search Tree&#xff09;&#xff0c;&#xff08;又名&#xff1a;二叉搜索树&#xff0c;二叉排序树&#xff09;——它或者是一棵空树&#xff0c;或者是具有下列性质的二叉树&#xff1a; 若它的…

二叉树相关知识及求深度的代码实现

文章目录树二叉树满二叉树和完全二叉树二叉树的性质代码实现求二叉树的深度树 树是一种非线性的数据结构&#xff0c;它是由n个有限结点组成一个具有层次关系的集合。 树的相关名词&#xff1a; 根节点&#xff1a;没有前驱结点的结点。父节点&#xff0c;子节点&#xff1a…

大端小端存储模式详解及判断方法

文章目录大小端模式的概念两种模式出现原因两种模式的优劣大小端的应用情景判断机器的字节序大小端模式的概念 当我们查看数据在内存中的存储情况时&#xff0c;我们经常会发现一个很奇怪的现象&#xff0c;什么现象呢&#xff1f; int main() {int i 12;return 0; }数据在内…

Linux 内存管理 | 物理内存、内存碎片、伙伴系统、SLAB分配器

文章目录物理内存物理内存分配外部碎片内部碎片伙伴系统(buddy system)slab分配器物理内存 在Linux中&#xff0c;内核将物理内存划分为三个区域。 在解释DMA内存区域之前解释一下什么是DMA&#xff1a; DMA&#xff08;直接存储器访问&#xff09; 使用物理地址访问内存&am…

Linux 内存管理 | 虚拟内存管理:虚拟内存空间、虚拟内存分配

文章目录虚拟地址空间用户空间内核空间用户空间内存分配malloc内核空间内存分配kmallocvmalloc虚拟地址空间 在早期的计算机中&#xff0c;程序是直接运行在物理内存上的&#xff0c;而直接使用物理内存&#xff0c;通常都会面临以下几种问题&#xff1a; 内存缺乏访问控制&a…

Linux | 编译原理、gcc的命令参数、自动化构建工具 make/Makefile

文章目录编译原理预处理编译汇编链接gcc的常用命令参数make 和 Makefile 的概念make的运行通配符自动化变量伪目标.PHONE:【命令】编译原理 在解释 makefile 前&#xff0c;首先解释一下 .c 文件变成 .exe 文件要经过的四个步骤——预处理、编译、汇编和链接&#xff08;参考来…

Linux | 进程概念、进程状态(僵尸进程、孤儿进程、守护进程)、进程地址空间

文章目录进程和程序操作系统如何控制和调度程序进程控制块–PCB子进程进程状态僵尸进程孤儿进程守护进程&#xff08;精灵进程&#xff09;进程地址空间引言页表进程和程序 程序&#xff1a; 一系列有序的指令集合&#xff08;就是我们写的代码&#xff09;。进程&#xff1a;…

Linux 进程控制 :进程创建,进程终止,进程等待,程序替换

文章目录进程创建进程等待程序替换进程终止进程创建 fork函数&#xff1a; 操作系统提供的创建新进程的方法&#xff0c;父进程通过调用 fork函数 创建一个子进程&#xff0c;父子进程代码共享&#xff0c;数据独有。 当调用 fork函数 时&#xff0c;通过 写时拷贝技术 来拷贝…

Linux 内存管理 | 连续分配方式 和 离散分配方式

文章目录前言连续分配单一连续分配分区式分配固定分区分配动态分区分配可重定位分区分配离散分配分段分页多级页表快表(TLB)段页式Linux前言 Linux 内存管理 | 虚拟内存管理&#xff1a;虚拟内存空间、虚拟内存分配 Linux 内存管理 | 物理内存、内存碎片、伙伴系统、SLAB分配器…

操作系统 | 用户态和内核态的切换(中断、系统调用与过程(库函数)调用)

文章目录中断过程调用系统调用过程调用和系统调用的区别中断 用户态、内核态之间的切换是怎么实现的? 用户态→内核态 是通过中断实现的。并且 中断是唯一途径 。核心态→用户态 的切换是通过执行一个特权指令&#xff0c;将程序状态字 (PSW) 的标志位设置为 用户态 。 中断…