后缀数组SA

后缀数组SA

模板

花了不少时间才理解倍增求SASASA的实现方法,我还是太菜了。

定义sa[i]sa[i]sa[i]表示排名为iii的后缀的起始位置。
定义rank[i]rank[i]rank[i]表示起始位置为iii的后缀的排名。
显然两者之前互逆。

void solve()
{int m=122;for (int i=1;i<=m;i++) cnt[i]=0;for (int i=1;i<=n;i++) cnt[x[i]=a[i]]++;for (int i=1;i<=m;i++) cnt[i]+=cnt[i-1];for (int i=n;i>=1;i--) sa[cnt[x[i]]--]=i;for (int k=1;k<=n;k<<=1){int p=0;for (int i=1;i<=m;i++) y[i]=0;for (int i=n-k+1;i<=n;i++) y[++p]=i;for (int i=1;i<=n;i++) if (sa[i]>k) y[++p]=sa[i]-k;for (int i=0;i<=m;i++) cnt[i]=0;for (int i=1;i<=n;i++) cnt[x[y[i]]]++;for (int i=1;i<=m;i++) cnt[i]+=cnt[i-1];for (int i=n;i>=1;i--) sa[cnt[x[y[i]]]--]=y[i];swap(x,y);x[sa[1]]=p=1;for (int i=2;i<=n;i++)x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?p:++p;if (p>=n) break;m=p;}
}

Height以及LCP

定义LCP(x,y)LCP(x,y)LCP(x,y)表示字符串xxxyyy之间的最长公共前缀长度。

定义height[i]height[i]height[i]表示suffix[sa[i−1]]suffix[sa[i-1]]suffix[sa[i1]]suffix[sa[i]]suffix[sa[i]]suffix[sa[i]]LCPLCPLCP的长度,即相邻排名的后缀的LCPLCPLCP长度。

容易发现一个性质
对于任意的j,kj,kj,k,若rank[j[<rank[k]rank[j[<rank[k]rank[j[<rank[k],则suffix(j),suffix(k)suffix(j),suffix(k)suffix(j),suffix(k)LCPLCPLCP的长度为
mini=rank[j]+1rank[k]height[i]min_{i=rank[j]+1}^{rank[k]}height[i] mini=rank[j]+1rank[k]height[i]
即两个后缀j,kj,kj,kLCPLCPLCP长度是排名在它们之间所有的后缀(包括suffix(k)suffix(k)suffix(k))的heightheightheight值的最小值。

根据这一性质,倘若我们可以求出height[i]height[i]height[i],我们就可以通过STSTST表,O(nlgn)O(nlgn)O(nlgn)预处理,O(1)O(1)O(1)询问两个后缀的LCPLCPLCP答案了。

而对于heightheightheight数组,也有一个重要的性质:
height[i−1]−1≤height[i]height[i-1]-1\leq height[i] height[i1]1height[i]
于是可以O(n)O(n)O(n)计算heightheightheight了。

void get_height()
{for (int i=1;i<=n;i++) rnk[sa[i]]=i;for (int i=1,j=0;i<=n;i++){if (j) j--;while (a[i+j]==a[sa[rnk[i]-1]+j]) j++;height[rnk[i]]=j;}
}

SA的简单应用

1.求最长重复子串

答案为heightheightheight最大值。

2.求最长重复k次子串

二分答案,转化为判断是否存在长度为xxx的子串重复至少kkk次。将所有相邻且heightheightheight大于等于xxx的都分在一组,判断是否有一组的后缀个数大于kkk即可。

时间复杂度O(n)O(n)O(n)

3.本质不同子串个数

答案为产生的新串数量-重复出现的串的数量。
∑i(n−i+1)−height[rnk[i]]\sum_{i} (n-i+1)-height[rnk[i]]i(ni+1)height[rnk[i]]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/315771.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用.NET Core 编写端到端测试

什么是端到端测试端到端测试也称E2E,与单元测试、集成测试、组件测试、契约测试相比&#xff0c;端到端测试的目的是验证整个系统是否满足业务目标&#xff0c;而不管使用的组件架构如何&#xff0c;为了实现这一点&#xff0c;系统被视为一个黑盒子&#xff0c;测试尽可能多地…

Manacher

Manacher(马拉车算法) Manacher算法主要用于求解回文串问题&#xff0c;能够统计出以每一个位置为中心的回文串的个数&#xff0c;效率极高。 模板 题目描述 Manacher算法的实现过程&#xff1a; 1.在字符串每两个字符之间插入一个分隔符。 2.iii从111到nnn求解P[i]P[i]P[i…

.NET/C# 使用 ConditionalWeakTable 附加字段(CLR 版本的附加属性,也可用用来当作弱引用字典 )...

如果你使用过 WPF/UWP 等 XAML UI 框架&#xff0c;那么应该了解到附加属性的概念。那么没有依赖属性支持的时候如何做附加属性的功能呢&#xff1f;你可能会想到弱引用。但这需要做一个弱引用字典&#xff0c;要写的代码还是非常麻烦的。本文介绍 .NET 的 ConditionalWeakTabl…

P4548 [CTSC2006]歌唱王国

P4548 [CTSC2006]歌唱王国 题目描述 Solution 这一题在《具体数学&#xff08;混泥土数学&#xff09;》里讲得很详细了啊&#xff0c;这里相当于总结一下&#xff0c;想具体了解的直接看书吧。 我们先考虑字符集为222的情况&#xff0c;设硬币正面朝上(H)(H)(H)的概率为pp…

在C#中使用Json.Net进行序列化和反序列化及定制化

序列化&#xff08;Serialize&#xff09;是将对象转换成字节流&#xff0c;并将其用于存储或传输的过程&#xff0c;主要用途是保存对象的状态&#xff0c;以便在需要时重新创建该对象&#xff1b;反序列化&#xff08;Deserialize&#xff09;则是将上面的字节流转换为相应对…

SRM614 Div1 Hard

SRM614 Div1 Hard 题目描述 Solution 显然有&#xff1a; E(x,y)(E(x−1,y)E(x,y−1))/21E(x,y)(E(x-1,y)E(x,y-1))/21 E(x,y)(E(x−1,y)E(x,y−1))/21 直接高斯消元时间复杂度O((nm)3)O((nm)^3)O((nm)3)。 可以发现这种做法十分浪费&#xff0c;消元之后会有大量冗余元素&…

知乎个人精选 | 绝版的专业书到哪里找最快最高效?

估计书到用时方恨少是很多软件开发人员的苦恼&#xff0c;当然我这里提到的"少"表示稀少&#xff0c;买不到之意~比如你加入一家政府机构或给为政府机构服务的公司做开发&#xff0c;主要做传统软件&#xff0c;对方需要使用 Win Forms做开发&#xff0c;你打算系统性…

HUD4035Maze

HUD4035Maze 题目描述 Solution 很容易写出期望的式子&#xff1a; 令fif_ifi​表示从iii号节点开始期望几步走出迷宫。 令pi1−ki−eip_i1-k_i-e_ipi​1−ki​−ei​表示选择走向其他边的概率。 令did_idi​表示iii号结点的度数。 fikif1pi∑fjdi10eiAnsf1f_ik_if_1p_i\sum…

正反案例介绍SOLID原则

一.概述SOLID五大原则使我们能够管理解决大多数软件设计问题。由Robert C. Martin在20世纪90年代编写了这些原则。这些原则为我们提供了从紧耦合的代码和少量封装转变为适当松耦合和封装业务实际需求的结果方法。使用这些原则&#xff0c;我们可以构建一个具有整洁&#xff0c;…

LOJ#2145. 「SHOI2017」分手是祝愿

LOJ#2145. 「SHOI2017」分手是祝愿 题目描述 Solution 首先有一个结论&#xff1a; 灯的状态序列a1,a2...ana_1,a_2...a_na1​,a2​...an​唯一对应了一个最优操作序列b1,b2...bnb_1,b_2...b_nb1​,b2​...bn​。 因为编号最大的灯只能由开关自己来改变。 因此&#xff0c;…

ASP.NET Core 中的静态文件

1.前言当我们创建Core项目的时候&#xff0c;Web根目录下会有个wwwroot文件目录&#xff0c;wwwroot文件目录里面默认有HTML、CSS、IMG、JavaScript等文件&#xff0c;而这些文件都是Core提供给客户端使用的静态文件。但是这些静态文件需要在Core里面配置才可以对外公开访问。2…

LOJ#2542. 「PKUWC2018」随机游走

LOJ#2542. 「PKUWC2018」随机游走 题目描述 Solution 去过一个点集中所有节点的期望时间不好求&#xff0c;考虑min−maxmin-maxmin−max容斥&#xff0c;转化为求第一次到达某一个点集的期望时间。 我们对于每一个点集sss&#xff0c;都求出fif_ifi​表示从iii结点到点集s…

基于Kebernetes 构建.NET Core技术中台

今天下午在腾讯云社区社区分享了《基于Kubernetes 构建.NET Core技术中台》&#xff0c;下面是演讲内容的文字实录。我们为什么需要中台我们现在处于企业信息化的新时代。为什么这样说呢&#xff1f;过去企业信息化的主流重心是企业内部信息化。但现在以及未来的企业信息化的主…

P3706 [SDOI2017]硬币游戏

P3706 [SDOI2017]硬币游戏 题目描述 Solution 前置技能&#xff1a; P4548 [CTSC2006]歌唱王国 歌唱王国就是n1n1n1的情况。 我们用类似的方法&#xff0c;先考虑两个串的情况。 设SAS_ASA​表示AAA串最先选到的概率&#xff0c;设SBS_BSB​表示BBB串最先选到的概率。 则…

RedLock 实现分布式锁

并发是程序开发中不可避免的问题&#xff0c;根据系统面向用户、功能场景的不同&#xff0c;并发的重视程度会有不同。从程序的角度来说&#xff0c;并发意味着相同的时间点执行了相同的代码&#xff0c;而有些情况是不被允许的&#xff0c;比如&#xff1a;转账、抢购占库存等…

AGC030D - Inversion Sum

AGC030D - Inversion Sum 题目描述 Solution 考虑dpdpdp&#xff0c;fi,jf_{i,j}fi,j​表示第iii个位置的数大于第jjj个位置的数的概率。 对于每一个询问修改贡献即可。 时间复杂度O(nqn2)O(nqn^2)O(nqn2)。 #include <vector> #include <list> #include <m…

[翻译] NumSharp的数组切片功能 [:]

原文地址&#xff1a;https://medium.com/scisharp/slicing-in-numsharp-e56c46826630翻译初稿&#xff08;英文水平有限&#xff0c;请多包涵&#xff09;&#xff1a;由于Numsharp新推出了数组切片这个牛逼的功能&#xff0c;所以.NET社区距离拥有强大的开源机器学习平台又近…

P3978 [TJOI2015]概率论

P3978 [TJOI2015]概率论 题目描述 Solution 设CnC_nCn​表示nnn个节点的树的个数&#xff08;卡特兰数&#xff09;&#xff0c;SnS_nSn​表示nnn个节点的所有树的叶子的个数和。 Cn∑i0n−1CiCn−i−1[n0]Sn2∑i0n−1SiCn−i−1[n1]C_n\sum_{i0}^{n-1} C_iC_{n-i-1}[n0]\\ …

Visual Studio 2019 16.1发布,更快更高效

Visual Studio 2019 16.1 已正式发布&#xff0c;可以看到&#xff0c;新版本的启动速度有了显著的提升&#xff0c;还节省了不少的内存空间。主要更新如下&#xff1a;IDE现已公开发布 Visual Studio IntelliCode&#xff0c;并且可以随任何支持 C#、C、TypeScipt/JavaScript …

牛顿迭代法

牛顿迭代法 定义 在一般意义下&#xff0c;牛顿迭代法可以求出一个函数的零点&#xff0c;而在多项式意义下&#xff0c;牛顿迭代能够求出&#xff1a;给定一个G(x)G(x)G(x)&#xff0c;求F(x)F(x)F(x)&#xff0c;使得G(F(x))≡0(modxn)G(F(x)) \equiv 0\;\;\;(mod\;\;x^n)G…