一种后缀数组的奇妙运用

最近参加了thucamp,其中day5的E题是一个有难度的字符串。

大部分人都是用后缀自动机做,我也是这样感觉的,不过想了好一会儿也没有很清晰的思路,但是突然想到了一个用后缀数组建树的方法,我2h码了7kb的代码,但是居然能够一遍过,有点不可思议。

题目:
有一个长度为 n ( < = 2 ∗ 1 0 5 ) n(<=2*10^5) n(<=2105),对于每个 i i i,有 p i p_i pi的概率选出前缀 i i i,有 1 − p i 1-p_i 1pi的概率选出前缀 i i i反转,求所有字符串构成的trie树的大小的期望值。

思路:令 s 2 s_2 s2 s s s反转,那么 s 2 s_2 s2所有的后缀就是所有前缀 i i i的反转。

考虑 s 2 s_2 s2所有后缀和 s s s构成的字典树,某个节点会不会出现取决于它的子树中是否存在被选择的 s 2 s_2 s2后缀或 s s s的前缀。

特别地,如果存在某个 i i i,使得 s 2 s2 s2长度为 i i i后缀和 s s s长度为 i i i的前缀都存在 x x x的子树中,那么 x x x必然存在。

现在我们先不考虑 s s s,只考虑 s 2 s_2 s2所有后缀形成的字典树。

然后我们把原来的字典树上的点按照子树中有哪些后缀分类,总共有不超过 2 n 2n 2n种,而且每一类必然是一直往上的一条链,我们完全可以把每一类以一个点表示,因此我们只需要建出归类以后的树即可。

于是我们先用后缀数组排序,求出 h e i g h t height height数组,然后类似笛卡尔树一样合并,具体做法是把height从大到小排序,然后不断合并。

于是我们就可以统计出没有 s s s时的贡献了。

然后就是考虑 s s s经过点的贡献。

我们先要确定s的路径,这只需要找到和s有最长公共前缀的 s 2 s_2 s2后缀,然后在合并后的字典树往上跳即可。因为 s 2 s_2 s2的后缀已经排序,所以我们只需要二分答案即可。

还有就是要找到所有必然存在的点,注意到单调性,因此我们仍然用二分来检查。

最后顺着路径统计一遍即可。

#include<bits/stdc++.h>
#define rep(i,x,y) for(int i=x;i<=y;i++)
#define dwn(i,x,y) for(int i=x;i>=y;i--)
#define ll long long
using namespace std;
template<typename T>inline void qr(T &x){x=0;int f=0;char s=getchar();while(!isdigit(s))f|=s=='-',s=getchar();while(isdigit(s))x=x*10+s-48,s=getchar();x=f?-x:x;
}
int cc=0,buf[31];
template<typename T>inline void qw(T x){if(x<0)putchar('-'),x=-x;do{buf[++cc]=int(x%10);x/=10;}while(x);while(cc)putchar(buf[cc--]+'0');
}
const int N=2e5+10,mod=998244353;
int power(int a,int b){int ret=1;while(b){if(b&1)ret=1ll*ret*a%mod;a=1ll*a*a%mod;b>>=1;}return ret;
}
int n;
char s[N],s2[N];//s2 -> reverse s
int height[N],sa[N],rk[N];
struct node{int h,id;
}a[N];
int fa[N],id[N];
int p[N];
int sum[N],isum[N],suf[N];
int zero[N];
int findfa(int x){return x==fa[x]?x:fa[x]=findfa(fa[x]);}
struct tree{int l,r,lenL,lenR,fa;
}t[N<<1];int cnt,root;
int val[N<<1];
int tp,sta[N];
namespace SA{//use s2 to create height[]int c[N],x[N],y[N];void getSA(){int m=256;rep(i,1,n)c[x[i]=s2[i]]++;rep(i,2,m)c[i]+=c[i-1];dwn(i,n,1)sa[c[x[i]]--]=i;for(int k=1;k<=n;k<<=1){int num=0;rep(i,n-k+1,n)y[++num]=i;rep(i,1,n)if(sa[i]>k)y[++num]=sa[i]-k;rep(i,1,m)c[i]=0;rep(i,1,n)c[x[i]]++;rep(i,2,m)c[i]+=c[i-1];dwn(i,n,1)sa[c[x[y[i]]]--]=y[i],y[i]=0;swap(x,y);x[sa[1]]=num=1;rep(i,2,n)x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;if(num==n)break;m=num;}rep(i,1,n)rk[sa[i]]=i;int k=0;rep(i,1,n){if(rk[i]==1)continue;if(k)k--;int j=sa[rk[i]-1];while(i+k<=n&&j+k<=n&&s2[i+k]==s2[j+k])k++;height[rk[i]]=k;}}
}
bool cmp(node p1,node p2){//you have to sort the id, or the structure of the tree will have some problemsif(p1.h==p2.h)return p1.id<p2.id;return p1.h>p2.h;
}
bool iszero(int x,int y){if(zero[y]-zero[x-1])return 0;return 1;
}
void solve(){qr(n);if(n==1){puts("2");return;}scanf("%s",s+1);rep(i,1,n)qr(p[i]);suf[n+1]=1;dwn(i,n,1)suf[i]=1ll*suf[i+1]*(mod+1-p[i])%mod;rep(i,1,n)s2[n+1-i]=s[i];SA::getSA();//build the merged suffix trierep(i,2,n)a[i-1]=(node){height[i],i};sort(a+1,a+n,cmp);rep(i,1,n){t[++cnt]=(tree){i,i,0,n-sa[i]+1};fa[i]=i;id[i]=i;}rep(i,1,n-1){int now=a[i].id;int x=id[findfa(now-1)],y=id[findfa(now)];if(t[x].lenR==a[i].h){t[y].fa=x;t[y].lenL=a[i].h+1;t[x].l=min(t[x].l,t[y].l);t[x].r=max(t[x].r,t[y].r);fa[findfa(now)]=findfa(now-1);}else if(t[y].lenR==a[i].h){t[x].fa=y;t[x].lenL=a[i].h+1;t[y].l=min(t[y].l,t[x].l);t[y].r=max(t[y].r,t[x].r);fa[findfa(now-1)]=findfa(now);}else{t[x].lenL=t[y].lenL=a[i].h+1;t[x].fa=t[y].fa=++cnt;t[cnt]=(tree){min(t[x].l,t[y].l),max(t[x].r,t[y].r),0,a[i].h};fa[findfa(now)]=findfa(now-1);id[findfa(now-1)]=cnt;}}rep(i,1,cnt){if(t[i].l==1&&t[i].r==n){root=i;break;}}//we precalculate the ans of the suffix trie//and then update the value of the vertex in the prefixrep(i,0,n)sum[i]=1;rep(i,1,n){int pos=rk[n+1-i];sum[pos]=p[i];}isum[0]=1;rep(i,1,n){if(!sum[i]){sum[i]=1;zero[i]=1;}sum[i]=1ll*sum[i]*sum[i-1]%mod;zero[i]+=zero[i-1];isum[i]=power(sum[i],mod-2);}int ans=0;rep(i,1,cnt){int num=t[i].lenR-t[i].lenL+1;int E=(mod+1-1ll*sum[t[i].r]*isum[t[i].l-1]%mod*iszero(t[i].l,t[i].r))%mod;ans=(ans+1ll*num*E%mod)%mod;}//we binary search the lexicographic order to find the path of prefix in the trieint l=1,r=n,mid,pos=n+1;while(l<=r){mid=(l+r)/2;int flag=0,len=n+1-sa[mid];rep(i,1,len){if(s[i]<s2[sa[mid]+i-1]){flag=1;break;}if(s[i]>s2[sa[mid]+i-1]){flag=2;break;}}if(!flag)flag=2;if(flag==1)pos=mid,r=mid-1;else l=mid+1;}int t1=0,t2=0;if(1<=pos&&pos<=n){rep(i,1,n+1-sa[pos]){if(s[i]==s2[sa[pos]+i-1])t2++;else break;}}pos--;if(1<=pos&&pos<=n){rep(i,1,n+1-sa[pos]){if(s[i]==s2[sa[pos]+i-1])t1++;else break;}}if(t1<t2)pos++;int match=max(t1,t2);while(1){sta[++tp]=pos;if(pos==root)break;pos=t[pos].fa;}memset(id,0,sizeof(id));//reuse idrep(i,1,tp){int x=sta[i];rep(j,t[x].lenL,min(match,t[x].lenR)){id[j]=x;}}//find how many vertex will certainly exist//if the subtree include the prefix and the suffix(binary search)l=1,r=match,mid,pos=0;while(l<=r){mid=(l+r)/2;bool bk=0;int x=id[mid];rep(i,mid,n){int tt=rk[n+1-i];if(t[x].l<=tt&&tt<=t[x].r){bk=1;break;}}if(bk)pos=mid,l=mid+1;else r=mid-1;}rep(i,0,match){int x=id[i];int E=(mod+1-1ll*sum[t[x].r]*isum[t[x].l-1]%mod*iszero(t[x].l,t[x].r))%mod;ans=(ans-E+mod)%mod;if(i<=pos)E=1;else{E=1ll*sum[t[x].r]*isum[t[x].l-1]%mod*iszero(t[x].l,t[x].r);E=1ll*E*suf[i]%mod;E=(mod+1-E)%mod;}ans=(ans+E)%mod;}rep(i,match+1,n){int E=(mod+1-suf[i])%mod;ans=(ans+E)%mod;}qw(ans);puts("");
}
int main(){int tt;tt=1;while(tt--)solve();return 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/52838.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

webpack4手动搭建Vue项目

小满视频 很多解释使用通义灵码搜的,通义灵码的搜索结果也是有错误的全程使用pnpm包管理工具&#xff0c;和npm的用法基本一样 学习总结 1. 多看看webpack官网 2. webpack的作用&#xff1a;配置一堆东西&#xff0c;达到运行程序的目的 3. 无论什么东西都转成js&#xff0c;…

理解数据库系统的内部结构

数据库系统在我们的数字世界中扮演着关键角色。本文将介绍数据库系统的内部结构&#xff0c;帮助初学者了解其基本概念。 数据库系统的三级模式 数据库系统内部采用三级模式二级映像结构&#xff0c;包括外模式、模式和内模式。这种结构确保了数据的逻辑独立性和物理独立性。…

51-java jpa和mybatis的区别

‌JPA和MyBatis是两种不同的持久层框架&#xff0c;它们在设计和使用上有显著的区别。‌ ‌JPA&#xff08;Java Persistence API&#xff09;‌ 是一个ORM&#xff08;对象关系映射&#xff09;框架&#xff0c;它是Java EE的一部分&#xff0c;旨在通过注解或XML配置来定义实…

CHAMELEON算法原理及Python实践

CHAMELEON&#xff08;变色龙&#xff09;算法是一种两阶段的层次聚类算法&#xff0c;其原理和特点可以归纳如下&#xff1a; 一、算法概述 CHAMELEON算法通过动态建模的方式&#xff0c;结合了数据的初始划分&#xff08;通过图划分算法&#xff09;和一种新颖的层次聚类方…

如何在Android项目中进行性能优化分析?

引言 在开发过程中&#xff0c;性能优化是一个重要的话题。用户对于应用的性能有着非常高的期望&#xff1a;快速启动、流畅的操作体验、低内存消耗等。那么&#xff0c;作为开发者&#xff0c;我们如何才能在项目中进行性能优化分析呢&#xff1f;今天就来和大家聊聊这个话题…

Linux常见基础命令

Linux基础 初级学习阶段需要了解的知识一、Linux基础命令查阅命令帮助信息1.man2.help Linux命令的基本实用目录操作文件内容操作查看某文件下的用户操作日志压缩和解压缩sudo用户权限操作用户权限操作TOP文件安装 上一篇 VMware安装linux环境 初级学习阶段需要了解的知识 1.…

什么是 AWS CloudWatch?

AWS CloudWatch 是 AWS 提供的一项全面的监控和可观测性服务&#xff0c;使用户能够收集和可视化指标、日志和事件&#xff1b;设置警报&#xff1b;并根据预定义的条件自动执行操作。CloudWatch 提供对 AWS 资源和应用程序的运行状况、性能和运行状态的深入了解&#xff0c;使…

autoware整体架构的分析

autoware framework sensinglidar driver&#xff08;lidar驱动&#xff09;PointCloud Preprocessing&#xff08;点云预处理&#xff09;Detection&#xff08;检测&#xff09;GNSS (全球导航卫星系统)IMU (惯性测量单元) Localization&#xff08;定位&#xff09;Pose Ini…

8.28安装linux服务器注意事项和一些命令

一、解析域名配置 vi /etc/named.conf 配置相关的域名 systemctl start named //开启named服务 二、防火墙查找端口号列表 firewall-cmd --list -ports; 开启端口号 firewall-cmd --add-port端口号/tcp 重载防火墙 firewall-cmd --reload

#Datawhale X 李宏毅苹果书 AI夏令营#1.2了解线性模型

1.2线性模型 什么是线性模型&#xff1f; 初始模型&#xff1a;, 其中y表示观看人数&#xff0c;x1表示前一天的观看人数&#xff0c;这个模型就是在用前一天的观看人数来预测当前的观看人数。 模型改进&#xff1a; 然而真实的数据是有周期性的&#xff0c;每隔7天&#…

这本大模型书一定要读!李开复、周鸿祎都强烈推荐的《实战AI大模型》(附PDF)

《实战AI大模型》是一本旨在填补人工智能&#xff08;AI&#xff09;领域&#xff08;特别是AI大模型&#xff09;理论与实践之间鸿沟的实用手册。书中介绍了AI大模型的基础知识和关键技术&#xff0c;如Transformer、BERT、ALBERT、T5、GPT系列、InstructGPT、ChatGPT、GPT 4、…

无人机之云台的作用

无人机云台在无人机技术中扮演着至关重要的角色&#xff0c;其作用主要体现在以下几个方面&#xff1a; 一、 确保拍摄稳定性 防抖动&#xff1a;无人机在飞行过程中&#xff0c;尤其是在复杂环境下&#xff0c;如遇到风力干扰或进行高速飞行时&#xff0c;机身容易产生震动和…

Prometheus+Grafana的安装和入门

概念 什么是Prometheus? Prometheus受启发于Google的Brogmon监控系统&#xff08;相似kubernetes是从Brog系统演变而来&#xff09;&#xff0c; 从2012年开始由google工程师Soundclouds使用Go语言开发的开源监控报警系统和时序列数据库(TSDB)。&#xff0c;并且与2015年早起…

【Linux —— POSIX信号量 - 基于环形队列的生产消费模型】

Linux —— POSIX信号量 - 基于环形队列的生产消费模型 POSIX信号量信号量的概念POSIX信号量的类型信号量的操作 POSIX信号量函数基于环形队列的生产消费模型设计思路同步和安全性代码 POSIX信号量 信号量的概念 POSIX信号量是一种用于进程和线程之间同步的机制&#xff0c;主…

CSS 的超级好用的object-fit属性

object-fit 是 CSS 中的一个非常有用的属性&#xff0c;它决定了替换元素&#xff08;如 <img>、<video>、<canvas> 等&#xff09;的内容应该如何适应其使用的高度和宽度。这个属性解决了在不同布局和屏幕尺寸下&#xff0c;如何优雅地控制元素内容显示的问…

【netty系列-08】深入Netty组件底层原理和基本实现

Netty系列整体栏目 内容链接地址【一】深入理解网络通信基本原理和tcp/ip协议https://zhenghuisheng.blog.csdn.net/article/details/136359640【二】深入理解Socket本质和BIOhttps://zhenghuisheng.blog.csdn.net/article/details/136549478【三】深入理解NIO的基本原理和底层…

数据结构(邓俊辉)学习笔记】串 16——Karp-Rabin算法:串即是数

文章目录 1. 化串为数2. 凡物皆数3. 亦是数 1. 化串为数 接下来的这节&#xff0c;我们再来讨论一种十分另类的串匹配算法&#xff0c;也就是所谓的 Karp-Rabin 算法。回顾此前所介绍的几种串匹配算法&#xff0c;我们所面临的难题是一样的。也就是说在这里&#xff0c;我们每次…

Windows 10/11降级漏洞的工具包现已发布 仅供安全测试

早前有研究人员在分析 Windows 10/11 更新机制时发现微软虽然已经考虑到潜在的安全问题增加了各种限制&#xff0c;但还是存在失误因此存在弱点&#xff0c;研究人员则通过该弱点成功降级了系统。通过该漏洞不仅可以成功降级系统&#xff0c;同时系统还会认为自己已经完成更新并…

python高阶知识之函数装饰器详解

先看一个示例 定义一个函数&#xff0c;传入数字&#xff0c;经过for循环后写入txt文件。 def writenum(num:int):""":param num: 传入数字:return:"""for i in range(num):with open(1.txt,a) as e:e.write(str(i)) 当执行函数后会在相同目录…

Java面试题·区别题·JavaSE部分

系列文章目录 总章 Java区别题 文章目录 系列文章目录前言private/默认/protected/public权限修饰符的区别&和&&区别和联系&#xff0c;I和II区别和联系if和switch的不同之处和equals的区别和联系数组做形参和可变参数做形参联系和区别接口和抽象类的异同之处面向…