进阶的做法就是KMP算法,当然暴力也能ac。
KMP主要用一个nex列表,nex[i]存储(模式串needle中)从第0个到i个字符串s中的一个相等前后缀的最大长度。比如说对于aabaa来说,最大长度应该是(前缀aa)和后缀(aa)的长度2,再比如说对于aabaaba来说,最大长度为(前缀aaba)和后缀(aaba)的长度4。
下图是董晓算法的例子,不过他是从1开始计数,我们Python都是0开始计数。
对上图,双指针分别在模式串上滑动,一个j从前缀开始,一个i从后缀开始。
当i=9,j+1=6的时候,两者不匹配,就是代码中, p[j] !=p[j+1],让j=nex[j],意思是发现aabaaa和aabaab不匹配了,现在找到aabaa的(相等前后缀的最大长度),那就是aa,j跳到2的位置,相对于j = nex[j]。为什么要找到aabaa的(相等前后缀的最大长度),因为现在aabaa+a与aabaa+b不匹配了,需要找到与aabaa+b相匹配的最大前缀长度,那么需要对aabaa进行缩少,
目前在最大长度的情况下,前缀是aabaa,后缀是aabaa,分别编号1,2,3,4,5
找到aabaa的(相等前后缀的最大长度)相对于找到1,2(aa)和4,5(aa)相等,再考虑aa+a和aa+b匹不匹配,看起来不匹配,再找到aa的(相等前后缀的最大长度)为(a),那么a+a显然和a+a相匹配。看不懂还是去b沾:F03【模板】KMP 算法_哔哩哔哩_bilibili
下面是KMP的整个算法:
class Solution:def strStr(self, haystack: str, needle: str) -> int:s = haystackp = needleleth = len(p)nex = [-1]*lethj = -1nex[0] = 0for i in range(1, leth):while j != -1 and p[i] != p[j+1]:j = nex[j] - 1if p[i] == p[j+1]:j += 1nex[i] = j + 1x = -1for idx in range(len(s)):while x != -1 and s[idx] != p[x+1]:x = nex[x] - 1if s[idx] == p[x+1]:x += 1if x == leth -1:return idx - leth + 1return -1