KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。
Border
Border n.边界;边境;国界;边界地区;边疆;镶边;包边;(草坪边等的)狭长花坛
一个字符串的 border 指的是这个字符串的 最长公共前后缀 ,border 的长度不能等于原字符串的长度,例如:
abbab 的 border 就是ab,因为 ab 既是 abbab 的前缀也是后缀。
Next 表
N e x t i Next_i Nexti 表示以下标 i i i 为结尾的前缀的 border 的长度。
求解 Next 表
如果 t n e x t i + 1 = t i + 1 t_{next_i+1}=t_{i+1} tnexti+1=ti+1 那么 n e x t i + 1 next_{i+1} nexti+1 显然应该等于 n e x t i + 1 next_i+1 nexti+1
如果 t n e x t i + 1 ≠ t i + 1 t_{next_i+1}\not= t_{i+1} tnexti+1=ti+1 前缀next[i]的border,也即前缀next[next[i]],他同时也是前缀next[i]的后缀,而前缀next[i]又是i的后缀,所以前缀next[next[i]]也是前缀i的后缀。
getnext函数模板
void getnechst(string s){int i,j;for(nechst[1]=j=0,i=2;s[i];i++){while(j&&s[i]!=s[j+1]){j=nechst[j];}if(s[i]==s[j+1]){j++;}nechst[i]=j;}
}
题目
1. 模板题 字符串匹配
洛谷 P3375 【模板】KMP
#include<bits/stdc++.h>
using namespace std;
int nechst[1000005],ans;
void getnechst(string s){int i,j;for(nechst[1]=j=0,i=2;s[i];i++){while(j&&s[i]!=s[j+1]){j=nechst[j];}if(s[i]==s[j+1]){j++;}nechst[i]=j;}
}
void kmp(string s,string s1){int i,j;for(j=0,i=1;s1[i];i++){while(j&&s1[i]!=s[j+1]){j=nechst[j];}if(s1[i]==s[j+1]){j++;}if(!s[j+1]){printf("%d\n",i-j+1);j=nechst[j];}}
}
int main(){string s,s1;cin>>s>>s1;s=' '+s;s1=' '+s1;getnechst(s1);kmp(s1,s);for(int i=1;s1[i];i++){printf("%d ",nechst[i]);}return 0;
}
2. 终曲(加强版)
题意
给定三个字符串,从第一个字符串中取出一个子串,要求包含第二个子串和第三个子串,求满足条件的最短子串
思路
利用vector存储子串的匹配位置,再进行二分查找
代码
#include<bits/stdc++.h>
using namespace std;
long long nechst[200005];
vector<long long>vl1,vl2,vr1,vr2;
vector<pair<long long,long long> >rg;
string ans;
long long ansr=0x3f3f3f3f,ansl;
void update(long long l,long long r){if(ansr-ansl>r-l){ansr=r;ansl=l;rg.clear();rg.push_back(make_pair(l,r));}else if(ansr-ansl+1==r-l+1){rg.push_back(make_pair(l,r));}
}
void getnechst(char s[]){int i,j;nechst[i]=0;for(j=0,i=2;s[i];i++){while(j&&s[i]!=s[j+1]){j=nechst[j];}if(s[i]==s[j+1]){j++;}nechst[i]=j;}
}
void getans(string s){if(ans.size()==0||ans>s){ans=s;}
}
void kmp(char s[],char s1[],vector<long long>& vl,vector<long long>& vr){long long n=strlen(s1+1);getnechst(s1);long long i,j,sum=0;for(j=0,i=1;s[i];i++){while(j&&s[i]!=s1[j+1]){j=nechst[j];}if(s[i]==s1[j+1]){j++;}if(!s1[j+1]){vl.push_back(i-n+1);vr.push_back(i);j=nechst[j];}}
}
int main(){char s[200005],s1[105],s2[105];scanf("%s%s%s",s+1,s1+1,s2+1);kmp(s,s1,vl1,vr1);kmp(s,s2,vl2,vr2);long long n=vl1.size(),m=vl2.size();if(n==0||m==0){printf("No");return 0;}for(int i=0;i<n;i++){long long idx=lower_bound(vr2.begin(),vr2.end(),vl1[i])-vr2.begin();if(idx!=m){update(min(vl1[i],vl2[idx]),max(vr1[i],vr2[idx]));}idx--;if(idx>=0){update(min(vl1[i],vl2[idx]),max(vr1[i],vr2[idx]));}}long long len=rg.size();for(int i=0;i<len;i++){char t=s[rg[i].second+1];s[rg[i].second+1]='\0';getans(string(s+rg[i].first));s[rg[i].second+1]=t;}cout<<ans;return 0;
}