正题
题目链接:https://www.luogu.com.cn/problem/P6793
题目大意
给出两个长度为nnn的字符串,取出他们所有长度为kkk的连续子串分别构成两个可重集合A,BA,BA,B。
你每次可以花费xxx点代价修改AAA中一个字符串长度为xxx的后缀,求至少花费多少代价能够使得两个集合完全相同。
1≤k≤n≤1.5×1051\leq k\leq n\leq 1.5\times 10^51≤k≤n≤1.5×105
解题思路
两个串S,TS,TS,T的匹配代价是max{k−LCP(S,T),0}max\{k-LCP(S,T),0\}max{k−LCP(S,T),0}
这个和之前有道题很像,沿用想法就是在后缀树上搞。
两个点的LCPLCPLCP可以在他们后缀树上的LCALCALCA处得到。
现在问题就变为了有一些黑白点,知道两个点匹配的代价与LCALCALCA的关系,求最小代价和。
基础贪心?直接在深度小的地方合并完就好了。
后缀树就是把反串跑广义SAM就好了
时间复杂度O(n)O(n)O(n)
code
#include<cstdio>
#include<cstring>
#include<algorithm>
#define ll long long
using namespace std;
const ll N=6e5+10;
struct node{ll to,next;
}a[N];
ll n,k,tot,ls[N],v[N][2],ans;
ll ch[N][26],fa[N],len[N],cnt;
char sa[N],sb[N];
ll Insert(ll p,ll c){if(ch[p][c]){ll q=ch[p][c];if(len[p]+1==len[q])return q;ll nq=++cnt;len[nq]=len[p]+1;memcpy(ch[nq],ch[q],sizeof(ch[nq]));fa[nq]=fa[q];fa[q]=nq;for(;p&&ch[p][c]==q;p=fa[p])ch[p][c]=nq;return nq;}ll np=++cnt;len[np]=len[p]+1;for(;p&&!ch[p][c];p=fa[p])ch[p][c]=np;if(!p)fa[np]=1;else{ll q=ch[p][c];if(len[p]+1==len[q])fa[np]=q;else{ll nq=++cnt;len[nq]=len[p]+1;memcpy(ch[nq],ch[q],sizeof(ch[nq]));fa[nq]=fa[q];fa[q]=fa[np]=nq;for(;p&&ch[p][c]==q;p=fa[p])ch[p][c]=nq;}}return np;
}
void addl(ll x,ll y){a[++tot].to=y;a[tot].next=ls[x];ls[x]=tot;return;
}
void dfs(ll x){for(ll i=ls[x];i;i=a[i].next){ll y=a[i].to;dfs(y);v[x][0]+=v[y][0];v[x][1]+=v[y][1];}ll tmp=min(v[x][0],v[x][1]);ans+=max(k-len[x],0ll)*tmp;v[x][0]-=tmp;v[x][1]-=tmp;return;
}
signed main()
{scanf("%lld%lld",&n,&k);scanf("%s",sa+1);scanf("%s",sb+1);ll last=cnt=1;for(ll i=n;i>=1;i--)last=Insert(last,sa[i]-'a'),v[last][0]+=((n-i+1)>=k);last=1;for(ll i=n;i>=1;i--)last=Insert(last,sb[i]-'a'),v[last][1]+=((n-i+1)>=k);for(ll i=2;i<=cnt;i++)addl(fa[i],i);dfs(1);printf("%lld\n",ans);return 0;
}