题目大意:
求出这些DNA序列中的最长且字典序最小的公共子串。
思路分析:
二分长度的答案,去height中扫描这个长度是否满足,一旦满足就立即输出。这样就能够保证字典序最小了。
#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
#define maxn 1005
using namespace std;char str[maxn];
int sa[maxn],t1[maxn],t2[maxn],c[maxn],n;void suffix(int m)
{int *x=t1,*y=t2;for(int i=0;i<m;i++)c[i]=0;for(int i=0;i<n;i++)c[x[i]=str[i]]++;for(int i=1;i<m;i++)c[i]+=c[i-1];for(int i=n-1;i>=0;i--)sa[--c[x[i]]]=i;for(int k=1;k<=n;k<<=1){int p=0;for(int i=n-k;i<n;i++)y[p++]=i;for(int i=0;i<n;i++)if(sa[i]>=k)y[p++]=sa[i]-k;for(int i=0;i<m;i++)c[i]=0;for(int i=0;i<n;i++)c[x[y[i]]]++;for(int i=0;i<m;i++)c[i]+=c[i-1];for(int i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];swap(x,y);p=1;x[sa[0]]=0;for(int i=1;i<n;i++)x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;if(p>=n)break;m=p;}
}
int rank[maxn],height[maxn];
void getheight()
{int k=0;for(int i=0;i<n;i++)rank[sa[i]]=i;for(int i=0;i<n;i++){if(k)k--;if(!rank[i])continue;int j=sa[rank[i]-1];while(str[i+k]==str[j+k])k++;height[rank[i]]=k;}
}
int pos,N,fans;
bool vis[20];
int bel[maxn];bool ok()
{for(int i=1;i<=N;i++)if(!vis[i])return false;return true;
}
bool check(int len)
{pos=-1;memset(vis,false,sizeof vis);int i;for(i=1;i<n;i++){if( height[i]<len ){if(ok()){pos=sa[i-1];return true;}memset(vis,false,sizeof vis);}else{if(!vis[bel[sa[i-1]]])vis[bel[sa[i-1]]]=true;if(!vis[bel[sa[i]]])vis[bel[sa[i]]]=true;if(ok()){pos=sa[i];return true;}}}if(ok())pos=sa[i-1];return pos!=-1;
}
char tmp[100];
int main()
{int T;scanf("%d",&T);while(T--){scanf("%d",&N);int top=0;for(int i=1;i<=N;i++){scanf("%s",tmp);for(int j=0;j<60;j++){bel[top]=i;str[top++]=tmp[j];}bel[top]=i;str[top++]=127-i;}str[top-1]=0;n=top;suffix(128);getheight();int l=3,r=60,mid,ans=0;while(l<=r){mid=(l+r)>>1;if(check(mid))ans=mid,fans=pos,l=mid+1;else r=mid-1;}if(ans<3)printf("no significant commonalities");else{for(int i=fans;i<fans+ans;i++)printf("%c",str[i]);}puts("");}return 0;
}