《LeetCode力扣练习》代码随想录——字符串(KMP算法学习补充——针对next数组构建的回退步骤进行解释)
学习路径
-
代码随想录:28. 实现 strStr()
-
CSDN:【详解】KMP算法——多图,多例子(c语言)
个人补充
-
看了以上学习路径后,对于KMP有了很深的认识,但是两位作者都没有提到一个重要的步骤的原因——构造next数组时
k=next[k]; // 向前回退
这一步骤的原因和思想。其实这一步我认为是KMP的精髓所在,也是KMP思想的体现,所以在理解之后,将想法记录下来,方便回顾。 -
个人理解KMP的精髓是:不要浪费。已经匹配过的字符串就算遇到不匹配的字符也不要浪费,还有利用的空间,有点像剥削了…
-
CSDN文章中,构造next数组的时候,当遇到不匹配的字符时,需要向前回退的例子还是过于特殊,导致回退一次就可以匹配上,这里我又重新构造了新的字符串:
分别是求next[6]和next[8]的值。
在构建next数组的时候,同时也运用到了KMP算法,并不是在搜寻字符串的时候才运用到,有点递归的感觉
以第二个next为例,当根据之前的最长相等前后缀aba、aba无法直接求得更长的前后缀时(b!=c,否则可以直接构成abac、abac了,直接赋值4),这时候不能直接放弃,还没有榨干之前字符串的价值,我们需要跳转
k=next[k];
重点来了,为什么要跳转到next[k]呢?
aba、aba是两个最长相等前后缀,同时他们自己也有自己的最长相等前后缀。并且第一个aba的最长相等前缀和第二个aba的最长相等后缀(因为两个字符串是相等的)这一点很重要!!!
next[k]
还有一层含义:阻止当前的最大相等前后缀成长为更长的相等前后缀的字符,也就是说这个字符阻止了更长的最大相等字符串的出现!!!当第一个
next[k]
匹配失败后,我们跳到第二个next[k]
,组织第一个aba的最长相等前后缀a变得更长的字符b的位置,因为上面所说的,我要尝试一下第一个aba的前缀+阻止字符和第二个aba的后缀+当前字符next[7]对应的b能否组成一对最长相等前后缀,这样的话(aba、aba这一对就没有被浪费,还可以利用他们本身的前后缀再次查找,并且由于这一对本身没有成功,所以他们的字串如果成功的话必然是最大的相等前后缀)总结一下,这个回退的操作有点像二分法的感觉,第一个前后缀不行,就把他们分开,看前缀的前缀+阻止字符和后缀的后缀+新匹配的字符 能否构成新的前后缀,如果还不行就在回退,再一分为二,一直到第一个字符都不行,next[k]为-1,就代表着一点都不一样,赋值为0,表示没有了。
构建next数组和字符串匹配都用到了KMP,区别是什么呢?next是用前缀的前缀去匹配后缀的后缀;字符串匹配是前缀不行,换前缀的前缀上,不行的话再试。两个操作基本一样,但是next在于写入值,字符串匹配在于移动。
-
到这里我个人的解释就结束了,我是自己把这里想明白之后,KMP算法就顿悟了,没想明白之前,每次回退都十分忐忑。
-
我的具体实现代码在这里:《LeetCode力扣练习》代码随想录——字符串(实现 strStr()—Java)