学习KMP (概念 + 模板 + 例题: 子串查找)

我又回来了,感jio这几天有点勤啊!!
这一次我带着KMP来了,在这里插入图片描述
在这里插入图片描述

文章目录

  • KMP介绍
  • 模板
  • 例题: 子串查找
    • 题目
    • 暴力题解
    • KMP题解
    • 代码实现

KMP介绍

KMP,即 Knuth-Morris-Pratt 字符串查找算法,由Donald Knuth、Vaughan Pratt、James H. Morris三人于1977年联合发表,故取这3人的姓氏命名此算法。

KMP的算法流程如下:
假设字符串S现匹配到位置i,模式串P匹配到位置j:
①若j==-1,或S[i]==P[j],则i++,j++,继续后面的匹配
②若j!=-1且S[i]!=P[j],则i不变,j=next[j]
(这样就意味着当每次失配时,模式串P相对于字符串S向右移动了j-next[j]位)
这样就不用每次从头开始跑了

那么我们来看看next数组是怎么计算的。
①寻找模式串P的最长前缀、后缀
假设字符串S为ABCDAB ABCDABCDABDE,模式串P为ABCDABD

字符串前缀后缀最大公共元素长度
A0
ABAB0
ABCA,ABC,BC0
ABCDA,AB,ABCD,CD,BCD0
ABCDAA,AB,ABC,ABCDA,DA,CDA,BCDA1
ABCDAB2
ABCDABD

字符ABCDABD
公共元素长度0000120

ABCDAB ABCDABCDABDE
ABCDABD
这时D和空格匹配,
那么P向右移动的位数=已匹配的字符数(6)-上一个字符的最大公共元素长度(B的时候长度为2)=4
当第一位也不匹配的时候,直接向后移动一位。

模板

void kmp () {int len = strlen ( p );for ( int i = 1, j = 0;p[i];i ++ ) {while ( j && p[j] != p[i] )j = nxt[j];nxt[i + 1] = p[j] == p[i] ? ++ j : 0;}int tot = 0;for ( int i = 0, j = 0;s[i];i ++ ) {while ( j && p[j] != s[i] )j = nxt[j];if ( p[j] == s[i] && ++ j == len ) {tot ++;j = nxt[j];}}printf ( "%d", tot );
}

看懂了的话,就来到例题试试吧!
在这里插入图片描述

例题: 子串查找

题目

给出两个字符串s和p,其中p为s的子串,求p在s中的出现次数。
必须完全连续匹配,且s,p全部为大写或小写字母

输入格式
第一行为一个字符串,即为s
第二行为一个字符串,即为p
输出格式
输出一个整数,表示p在s中的出现次数。

输入输出样例
输入
zyzyzyz
zyz
输出
2

N<=1000000

暴力题解

暴力很好想,就是一个一个地跑,一旦遇到不匹配的,就从头开始重新跑:
假设字符串S现匹配到位置i,模式串P匹配到位置j。
那么,当S[i]==P[j]的时候,i++,j++,并继续下一次匹配。
若S[i]!=P[j],则i=i-j+1,j=0,即将i移动到此轮匹配的下一位,j置0重新匹配。

代码就不献给诸君了,因为我懒得写

KMP题解

遇到某些题目,例如给多个匹配串和一个模式串,大家千万不要跑n遍next数组,
没有必要因为,next根本没有变。
在这里插入图片描述
因为这道题是个模板,看懂了KMP介绍的各位小可爱,就不需要再解释为什么了?

我重点分析一下代码这玩意儿:
nxt[i]的含义:在模式串p中,从0到i-1为止前缀后缀字符最大匹配长度。
第一个for循环就是处理出nxt,因为当我们处理到i时,要找到0~i-1的nxt,
怕麻烦,我们可以把nxt整体往后移1,这样i就对应了nxt[i-1]
注意循环里的while (j=nxt[j])不能写成j=0,举个栗子:
abcdefababacdefababxyz
abacdefabab
ans:2,你如果写成0,wrong ans:1
因为写成零的话当你走到模式串p的倒数第二个字符,即a的时候你没有存下1,
导致最后循环到b的时候nxt没有成为2,反而是0,在s中查找的时候就会错过一个答案开头(关注加粗)

第二个循环就是找个数了,前文提到是将整个p右移x-nxt[i],而我则是写成将p的下标变成nxt[i]
控制s不变,这样就是个相对对应关系了,我们反正是用下标操作,不一定要移动两个字符串
好好理解吧~~
while里的j也不能直接赋值成为0,不然你连样例都过不了,还做什么??
具体原因与上面如出一辙,我不再阐释。。。

一句话就是如果写成j=0,那么那些所有模式串结尾等于模式串开头的数据,基本上你都凉了~~
abcdabcda
abcda
这种类似数据你可能都要少算,因为s有两个模式串共用了一个字符,你就GG了

我知道很多小可爱,看完后。。
在这里插入图片描述
也就只有大牛 不有可能,大佬都被我搞蒙了,看来我技术还是不错的~

代码实现

#include <cstdio>
#include <cstring>
#define MAXN 1000005
char s[MAXN], p[MAXN];
int nxt[MAXN];void kmp () {int len = strlen ( p );for ( int i = 1, j = 0;p[i];i ++ ) {while ( j && p[j] != p[i] )j = nxt[j];nxt[i + 1] = p[j] == p[i] ? ++ j : 0;}int tot = 0;for ( int i = 0, j = 0;s[i];i ++ ) {while ( j && p[j] != s[i] )j = nxt[j];if ( p[j] == s[i] && ++ j == len ) {tot ++;j = nxt[j];}}printf ( "%d", tot );
}int main() {scanf ( "%s %s", s, p );kmp ();return 0;
} 

那个男人,带着KMP走来了,又一脸懵逼地离开了?
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/318323.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

直播预告 - 博时基金DevOps体系建设和自动化测试分享

最近几年&#xff0c;基金行业发展比较快&#xff0c;业务范围从传统公募到大资管&#xff0c;业务地域从中国大陆到全球化&#xff0c;在互联网金融浪潮中扮演了重要角色&#xff0c;金融科技又带来新的挑战和机遇。据毕马威2014年研究报告显示&#xff0c;由于新技术、人口变…

P7854-「EZEC-9」GCD Tree【构造】

正题 题目连接:https://www.luogu.com.cn/problem/P7854 题目大意 给出nnn数字的一个序列aaa。 现在要求构造一棵树&#xff0c;使得对于任意的(x,y)(x,y)(x,y)都有 gcd(ax,ay)alca(x,y)gcd(a_x,a_y)a_{lca(x,y)}gcd(ax​,ay​)alca(x,y)​ 1≤n≤105,1≤ai≤1061\leq n\leq…

YBTOJ:公共子串(KMP)

文章目录题目描述解析代码题目描述 解析 我的做法是二分答案&#xff0c;暴力枚举子串&#xff0c;对其他的字符串进行KMP。 复杂度logL*L2 没有一次AC&#xff0c;因为忘记了字符串清零&#xff01;&#xff0c;否则它会和上次二分的字符串没被覆盖到的部分连在一起。 之前遇…

Asp.Net Core + Docker 搭建

一、Docker安装&#xff08;1&#xff09;机器准备 本次实验&#xff0c;我是在Win10上,使用Vmware Workstation虚拟机安装的Ubuntu 18.04.l LTS版本进行搭建。&#xff08;2&#xff09;安装Docker# yum install docker注意:如果提示未安装yum 使用命令:apt-get install yum&a…

Strange Housing CodeForces - 1471F

题意&#xff1a; 有 n 个点和 m 条边&#xff0c;对点进行染色。要求一条边的两个点不能都染色&#xff0c;并且删除两端都没有染色的边之后&#xff0c;图连通。请给出一种染色方案。 题解&#xff1a; 第一反应就是01染色&#xff0c;但是题目是有可能存在奇环的&#xf…

P4100-[HEOI2013]钙铁锌硒维生素【矩阵求逆,最大匹配】

正题 题目链接:https://www.luogu.com.cn/problem/P4100 题目大意 给出nnn个线性无关的向量AiA_iAi​&#xff0c;然后给出nnn个向量BiB_iBi​&#xff0c;求一个字典序最小的排列ppp使得将任意的AiA_iAi​替换为BpiB_{p_i}Bpi​​后依旧线性无关。 1≤n≤3001\leq n\leq 300…

数数字

今天中午1小时&#xff0c;定时两道&#xff0c;我就知道自己的太阳降落了。。。orz 文章目录题目题解代码实现题目 PB 带来了若干只蒟蒻。 众所周知&#xff0c;NTF 是数论学会的会长&#xff0c;于是 PB 准备用数字击败 NTF&#xff0c;以证明 PB 比 NTF 更强。 于是 PB 准…

YBTOJ:前缀数组(KMP)

文章目录题目描述解析代码题目描述 解析 题面脸上写着5个大字&#xff1a;我是KMP 但是本题没有自己做出来。。。我一开始的思路其实很接近题解了&#xff0c;只是被我舍弃了qwq。 后来卡在暴力nL2的瓶颈上&#xff0c;用了个倍增的诡异操作搞到了nLlogL&#xff0c;但是n5&am…

Strange Partition CodeForces - 1471A

Strange Partition CodeForces - 1471A 题意&#xff1a; 对于数组b可以两两合并其中的相连元素&#xff0c;beauty值就是对于数组b中的b[i]除以k向上取整的和&#xff0c;求出beauty值的范围。 题解&#xff1a; 题目给的是向上取整&#xff0c;也就是越合并值有可能越低&…

西安活动 | 2019年1月13号 拥抱开源, 又见.NET 线下交流活动报名进行中

随着.NET Core的发布和开源&#xff0c;.NET又重新回到人们的视野。.NET Core的下个3.0即将release&#xff0c;加入非常多的新功能&#xff0c;越来越拥抱变化&#xff0c;DevOps和Microservice的最佳实践已经在.NET Core落地&#xff0c;比如 Ocelot网关、GrpcConsul 服务注册…

C++STL(set……)

set 底层实现是用红黑树。 set 建立 set<int> s; // 不可重&#xff0c;默认升序 set<int,less> s; // 不可重&#xff0c;升序 set<int,greater> s; // 不可重&#xff0c;降序 multiset<int> s; // 可重集 set 也可以重载&#xff0c;利用结构体实现…

[ZOJ 3203] 灯泡

今天这个**又带着题走来了&#xff01;&#xff01; 文章目录[TOC] 题目题解代码实现题目 相比 wildleopard 的家&#xff0c;他的弟弟 mildleopard 比较穷。他的房子是狭窄的而且在他的房间里面仅有一个灯泡。每天晚上&#xff0c;他徘徊在自己狭小的房子里&#xff0c;思考如…

P5591-小猪佩奇学数学【单位根反演】

正题 题目链接:https://www.luogu.com.cn/problem/P5591 题目大意 给出n,p,kn,p,kn,p,k求 (∑i0n(ni)pi⌊ik⌋)mod998244353\left(\sum_{i0}^n\binom{n}{i}p^i\left\lfloor\frac{i}{k}\right\rfloor \right)\mod 998244353(i0∑n​(in​)pi⌊ki​⌋)mod998244353 1≤n,p<9…

YBTOJ:字符串题(KMP)

文章目录题目描述解析1.p[i]>0:2.p[i]0&#xff1a;代码题目描述 解析 我个人做起来很费劲的一道题&#xff0c;用vector&#xff0c;并查集等等东西搞来搞去过掉了&#xff08;竟然只WA了一次 &#xff09; 看题解思路就一下子清晰了&#xff0c;还是对KMP的理解不到位。 …

Strange List CodeForces - 1471B

题意&#xff1a; 对于长度为n的数组a&#xff0c;从第一位开始如果可以整除x&#xff0c;就将x个a/x的结果加到数组最后&#xff0c;然后对下一位进行一样的操作&#xff0c;直到第x位不可以整除x&#xff0c;到此结束&#xff0c;然后计算此时数组的总和 题解&#xff1a; …

Asp.Net Core 轻松学-正确使用分布式缓存

前言本来昨天应该更新的&#xff0c;但是由于各种原因&#xff0c;抱歉&#xff0c;让追这个系列的朋友久等了。上一篇文章 在.Net Core 使用缓存和配置依赖策略 讲的是如何使用本地缓存&#xff0c;那么本篇文章就来了解一下如何使用分布式缓存&#xff0c;通过本章&#xff0…

计算几何初步

两点之间距离 欧氏距离 即欧几里得距离。 平面内两点的距离为 \[\sqrt{(x_1-x_2)^2(y_1-y_2)^2} \]立体空间内两点的距离为 \[\sqrt{(x_1-x_2)^2(y_1-y_2)^2(z_1-z_2)^2} \]\(\dots\) \(n\) 维空间内两点的距离为 \[\sqrt{\sum_{i1}^{n}{(x_1-x_2)^2}} \]曼哈顿距离 二维空间内…

树链剖分概念及模板 + 例题 [POJ3237 tree + 软件包管理器]

文章目录概念模板例题1&#xff1a;软件包管理器题目题解代码实现例题2&#xff1a;POJ3237 tree题目题解代码实现概念 树链剖分主要是用于解决以下这两个问题。 1、更改树上点x到点y的最短路径上的所有结点的值 2、查询树上点x到点y的最短路径上的所有结点的和。 在讲树链剖分…

P3706-[SDOI2017]硬币游戏【高斯消元,字符串hash】

正题 题目链接:https://www.luogu.com.cn/problem/P3706 题目大意 给出 nnn 个长度为 mmm 的 H/TH/TH/T 串。 开始一个空序列&#xff0c;每次随机在后面加一个 H/TH/TH/T &#xff0c;求每个串第一次出现的概率。 1≤n,m≤3001\leq n,m\leq 3001≤n,m≤300 解题思路 数据范…

YBTOJ:字符串匹配(KMP)

文章目录题目描述解析代码题目描述 解析 看了题解。。。 这题的关键在于可以变换匹配的一个充要条件&#xff1a; 每个字符与前一个相同字符的距离相同 这个搞出来之后就可以以它为关键字进行KMP了 注意&#xff01; 当与前一个字符的距离超过匹配长度时&#xff0c;是没有意义…