预处理:
判断一个串是不是回文串,往往要分开编写,造成代码的拖沓
int LongestPalindrome(const char * s, int n){int i, j, max;if (s == 0 || n < 1)return 0;max = 0;for (i = 0; i < n; ++i){//i is the middle point of palindromefor (j = 0; (i - j >= 0) && (i + j < n);++j)// for the lenth of palindrome is oddif (s[i - j] != s[i + j])break;if (--j * 2 + 1>max) max = j * 2 + 1;for (j = 0; (i - j >= 0) && (i + j + 1 < n); ++j)//for the even caseif (s[i - j] != s[i + j + 1])break;if (--j * 2 + 2 > max)max = j * 2 + 2;}return max;}void LongestPalindrome_test(){char s[] = "aba";int length = LongestPalindrome(s,strlen(s));cout << length << endl;}
上面的循环中,对于回文长度本身的奇偶性,我们进行区别处理。这样有点拖沓。我们根据一个简单的事实:长度为n的字符串,共有n-1个“邻接”,加上首字符的前面后某字符的后面,共有n+1的“空(gap)”。因此,字符串本身和gap一起,共有2n+1个,必定是奇数。
- abba --> #a#b#b#a# 此回文这样处理后长度4-->9
- aba --> #a#b#c# 此回文这样处理后长度3-->7
因此,将待计算母串扩展成gap串,则里面的回文字串的长度都变成了奇数,我们计算的时候只用考虑奇数匹配即可。
数组 int P[size]:
字符串12212321--> S[] = "$#1#2#2#1#2#3#2#1#";( 为了统一处理,最前面加一个特殊字符。则下标从1开始)
用一个数组P[i]来记录以字符S[i] 为中心的最长回文字串向左/向右扩张的长度(包括S[i]),比如S和P的对应关系:
S: "# 1 # 2 # 2 # 1 # 2 # 3 # 2 # 1 #";P: {1 2 1 2 5 2 1 4 1 2 1 6 1 2 1 2 1}
P[i]-1正好是原字符串中回文串的总长度。
“# 1 # 2 # 2 # 1 #”
“---------1 2 3 4 5”
P[i] = 5
原始回文字符串长度是偶数的情况,则在gap串中P[i]的值多了中间的一个#。P[i]-1 == length
"# 1 # 2 # 3 # 2 # 1 # "
"---------------------1 2 3 4 5 6 "
p[i] = 6
原始回文字符串长度是奇数的情况,则在gap串种P[i]的值多了最后的#号。P[i]-1 == length
目前,只要知道了数组P的值,就能求得最多长回文的大小了。但是,怎么求呢P呢?请看下文。
如何求数组P:
S: "# 1 # 2 # 2 # 1 # 2 # 3 # 2 # 1 #";P: {1 2 1 2 5 2 1 4 1 2 1 6 1 2 1 2 1}
我们的任务,假定已经得到了前i个值,考察i+1如何计算。即:在P[0...i-1]已知的情况下,利用其中信息,计算P[i]的值。
- 通过简单遍历,找到i个三元组{k,P[k],k+p[k]},0<=k<=i-1。(以k为中心的字符形成的最大回文子串的最右位置是k+p[k]-1)
- 以k+p[k]为关键字,挑选出这i个三元组中,k+p[k]最大的那个三元组,不妨记作(id,P[id],id+P[id])。进一步,为了简化,记mx=P[id]+id,因此,得到三元组为(id,P[id],mx),这个三元组的含义非常明显:所有i个三组中,向右达到最远的位置,就是mx。
- 在计算P[i]的时候,考察i是否落在了区间[0,mx)中;
-1. 若i在mx的右侧,说明[0,mx)没有能够控制住i,P[0..i-1]都已知,无法给P[i]的计算带来有价值的信息。
-2. 若i在mx的左侧,说明[0,mx)控制(也有可能部分控制)了i,现在以图示来详细考察这种情况。这就是Manacher递推关系。
Manacher递推关系:
记i关于id的对称点位j(j=2*id - i),若此时满足条件mx-iP[j].
记my为mx关于id的对称点();
由于以S[id]为中心的最大回文字串为S[my+1...id...mx-1],
即:S[my+1....,id]与S[id,...,mx-1]对称,而i和j关于id对称,因此P[i]=Pj。
记i关于id的对称点位j(),若此时满足条件mx-iP[j]:
记my为mx关于id的对称点();
由于以S[id]为中心得最大回文字串为S[my+1,...id...mx-1],即S[my+1,...,id]与S[id,...,mx-1]对称,而i和j关于id对称,因此P[i]至少等于mx-i(途中绿框部分)
Manacher代码
void Manacher(char * s, int *p){int size = strlen(s);p[0] = 1;int id = 0;int mx = 1;for (int i = 1; i < size; i++){if (mx > i) p[i] = min(p[2 * id - i], mx - i);else p[i] = 1;/*这里计算s[i]处实际回文的长度,如果没有manacher算法,则这里p[i]每次都是从1开始而manancher算法利用了P[0...i-1]的信息,让i可能从大于1的地方开始*/for (; s[i - p[i]] == s[i + p[i]]; p[i]++);if (mx < i + p[i]){mx = i + p[i];id = i;}}}void Manacher_test(){char * s = "abbca2r";int size = (int)strlen(s);cout << s << endl;int sizenew = size * 2 + 2;//加上开始的$char * snew = new char[sizenew + 1];//别忘了最后的\0snew[0] = '$';int j = 0;for (int i = 1; i < 2 * size + 2; i++){if (i % 2 == 0)snew[i] = s[j++];elsesnew[i] = '#';}snew[sizenew] = '\0';cout << snew << endl;int * p = new int[sizenew];Manacher(snew,p);Print(p,sizenew);}
Manacher的改进
p[j] > mx - i: p[i] = mx - i
p[j] < mx - i: p[i] = p[j]
p[j] = mx - i: p[i] >= p[j]
根据上面的源码,原始Manacher算法,前两个等号都是大于等于。
下面是改进的Manacher算法:
void Manacher2(char * s, int * p){int size = strlen(s);p[0] = 1;int id = 0;int mx = 1;for (int i = 1; i < size; i++){if (mx>i){if (mx > i){if (p[2 * id - 1] != mx - i){p[i] = min(p[2*id - i],mx-i); //能确定p[i]的值}else{p[i] = p[2*id - i];for (; s[i - p[i]] == s[i + p[i]]; p[i]++);}}}else{p[i] = 1;for (; s[i - p[i]] == s[i + p[i]]; p[i]++);}if (mx < i + p[i]){mx = i + p[i];id = i;}}}