介绍
AC自动机是kmp算法和trie树的结合
大体就是做这样的题用:
可以发现,这题和trie树的区别是把多个单词往一篇文章匹配,而trie恰好相反
匹配的时候其实就是判断子串,所以又用到了kmp
定义失配指针nxt[i]:表示root到nxt[i]结点的字符串是到 i 结点的字符串的在本树中的最长后缀(其实和kmp差不多啦)
设文章下一个字是s,当前trie树结点是a
每次发现a结点下方没有s的儿子(膝下无子 ) 就回去重新找失配指针
现在考虑处理失配指针
因为显然nxt[i]的深度小于i,所以采用bfs,从而保证当前结点以上的所有的结点的nxt都解决完
核心代码
void solve(){for(int i=1;i<=26;i++) tree[0][i]=1;int q[N]={};q[1]=1;nxt[1]=0;for(int st=1,ed=1;st<=ed;st++){int now=q[st];for(int i=1;i<=26;i++){if(!tree[now][i]) tree[now][i]=tree[nxt[now]][i];else{q[++ed]=tree[now][i];int v=nxt[now];nxt[tree[now][i]]=tree[v][i];}}}
}
看代码也可以发现,当tree[i][j]无定义时,直接指向了它的失配指针
然后就好办了
void ac(){int p=1;int l=strlen(s+1);for(int i=1;i<=l;i++) a[i]=s[i]-'a'+1;for(int i=1;i<=l;i++){p=tree[p][a[i]];int k=p;while(k>1){//防止遗漏ans+=end[k];end[k]=0;//本题需要清零k=nxt[k];}}return;
}
例题代码
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<map>
#include<vector>
#include<queue>
#include<stack>
#include<deque>
#include<set>
#include<string>
#include<iostream>
#include<climits>
#define mem(a,b) memset(a,b,sizeof(a));
using namespace std;
const int M=1000050;
const int N=100050;
const int mod=100003;
typedef pair<int,int>pr;
int m,n,k,b,c,d;
int num=1,tree[N][28],end[M];
char s[M];
int a[M];
void add(){int l1=strlen(s+1);for(int i=1;i<=l1;i++) a[i]=s[i]-'a'+1;int u=1;for(int i=1;i<=l1;i++){if(!tree[u][a[i]]) tree[u][a[i]]=++num;u=tree[u][a[i]];}end[u]++;
}
int nxt[N];
void solve(){for(int i=1;i<=26;i++) tree[0][i]=1;int q[N]={};q[1]=1;nxt[1]=0;for(int st=1,ed=1;st<=ed;st++){int now=q[st];for(int i=1;i<=26;i++){if(!tree[now][i]) tree[now][i]=tree[nxt[now]][i];else{q[++ed]=tree[now][i];int v=nxt[now];nxt[tree[now][i]]=tree[v][i];}}}
}
int ans=0;
void ac(){int p=1;int l=strlen(s+1);for(int i=1;i<=l;i++) a[i]=s[i]-'a'+1;for(int i=1;i<=l;i++){p=tree[p][a[i]];int k=p;while(k>1){ans+=end[k];end[k]=0;k=nxt[k];}}return;
}
int main(){scanf("%d",&k);while(k--){mem(tree,0);mem(end,0);ans=0;num=1;scanf("%d",&n);for(int i=1;i<=n;i++){scanf("%s",s+1);add();}scanf("%s",s+1);solve();ac();printf("%d\n",ans);}
}
/*
1
5
she
he
say
shr
her
yasherhs
*/