所谓拓展kmp,就是拓展的kmp
(逃)
前言
小清新算法,更像一个trick。
exkmp能够在线性复杂度内求出字符串所有后缀与字符串本身的lcp。
个人感觉这个东西和kmp关系不大,反而有些像马拉车的思想。
之前学的东西,现在才想起来写一个解析。
解析
定义 ziz_izi 表示字符串的后缀 iii 与开头的lcp。
考虑在求完 z1...i−1z_{1...i-1}z1...i−1 的情况下,如何求解 ziz_izi。
设 pospospos 为满足 pos+zpospos+z_{pos}pos+zpos 最大的位置,r=pos+zpos−1r=pos+z_{pos}-1r=pos+zpos−1。
分情况讨论:
- i>ri>ri>r:暴力算出 ziz_izi,并使 pos←ipos\gets ipos←i。
- i≤ri\le ri≤r:此时在 rrr 左侧 iii 的 lcp 情况与 i−pos+1i-pos+1i−pos+1 是相同的,所以先令 zi←min(r−i+1,zi−pos+1)z_i\gets \min(r-i+1,z_{i-pos+1})zi←min(r−i+1,zi−pos+1),如果这个 min\minmin 取的是前一项,就再暴力尝试拓展 ziz_izi。
和马拉车类似的,当我们暴力计算 ziz_izi 而产生复杂度时,都必然伴随着 rrr 的增大,rrr 最多不会超过 nnn,所以均摊总复杂度为 O(n)O(n)O(n)。
代码
void exkmp(){z[1]=0;int pl=0;for(int i=2;i<=n;i++){if(i>pl+z[pl]-1){while(s[1+z[i]]==s[i+z[i]]) ++z[i];}else{z[i]=min(pl+z[pl]-i,z[i-pl+1]);if(z[i]==pl+z[pl]-i){while(s[1+z[i]]==s[i+z[i]]) ++z[i];} }if(i+z[i]>pl+z[pl]) pl=i;}return;
}