几个冷门字符串算法的学习笔记(最小表示法,exKMP,Lyndon Word)

所有下标均从1开始

最小表示法

给定一个串,求字典序最小的循环同构。

我们把串复制一遍接在后面,然后求出[1,N][1,N][1,N]开始的长为NNN的子串中最小的

先设i=1,j=2i=1,j=2i=1,j=2

然后暴力找出iiijjj往后匹配的第一个不同的位置,记为i+ki+ki+kj+kj+kj+k

如果Si+k<Sj+kS_{i+k}<S_{j+k}Si+k<Sj+k,说明iiijjj优,所以jjj不是最优解;然后发现i+1i+1i+1j+1j+1j+1优,所以j+1j+1j+1不是最优解……这样可以让jjj直接跳到j+k+1j+k+1j+k+1

Si+k>Sj+kS_{i+k}>S_{j+k}Si+k>Sj+k同理

如果i=ji=ji=j,随便让一个+1+1+1即可

两个指针都不能超过NNN,一个超过之后另一个就是答案

因为所有位置都会被遍历,而最优解一定不会被丢掉,所以正确性可以保证。

复杂度显然是O(N)O(N)O(N)

模板题

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
char s[10005];
int main()
{int T;scanf("%d",&T);while (T--){scanf("%s",s);int n=strlen(s);int i=0,j=1;while (i<n&&j<n)for (int k=0;;k++){if (s[(i+k)%n]!=s[(j+k)%n]){if (s[(i+k)%n]>s[(j+k)%n])i+=k+1;else j+=k+1;if (i==j) j++;break;}if (k==n) goto end;}end:printf("%d\n",min(i,j)+1);}return 0;
}

(远古代码,和上面讲的略有不同,仅供参考)

扩展KMP

官方名称应该叫Z算法,不知道为啥传到国内就变成扩展KMP了

但实际上思想和manacher很像所以应该叫扩展马拉车

解决的问题是给两个串S,TS,TS,T,求 TTT的每个后缀和SSS 的最长公共前缀

先把SSS接在TTT后面,中间加个#之类的东西 把这个串记为AAA

然后设pip_ipi表示AAA的从iii开始的后缀和TTT(也可以是AAA)的最长公共前缀

并且设公共前缀扩展到的最右位置为mxmxmx,取到这个最大值的iiixxx

然后iii222开始遍历(因为p1p_1p1没有意义还会把算法搞砸)

如果i<mxi<mxi<mx

在这里插入图片描述
因为上下橙色位置相同,所以pi=pi−x+1p_i=p_{i-x+1}pi=pix+1,当然要和mx−i+1mx-i+1mxi+1min⁡\minmin

如果i≥mxi \geq mximx,不管

然后暴力扩展,更新mxmxmx,没了

复杂度显然O(∣S∣+∣T∣)O(|S|+|T|)O(S+T)

模板题

#include <iostream>
#include <cstdio>
#include <cstring>
#include <cctype>
#define MAXN 200005
using namespace std;
char s[MAXN],t[MAXN];
int p[MAXN];
int main()
{scanf("%s%s",t+1,s+1);int m=strlen(s+1);strcat(s+1,"#");strcat(s+1,t+1);int n=strlen(s+1);for (int i=2,x=0,mx=0;i<=n;i++){p[i]=i<=mx? min(p[i-x+1],mx-i+1):0;while (s[i+p[i]]==s[p[i]+1]) ++p[i];if (i+p[i]-1>mx) x=i,mx=i+p[i]-1;}for (int i=1;i<=n;i++)if (s[i]=='#') puts("");else printf("%d ",i>1? p[i]:m);return 0;
}

Lyndon Word

定义:一个串是Lyndon Word(以下简称LW),当且仅当它本身是自己字典序最小的后缀

下文字符串的比较均为字典序,+为字符串拼接

性质1 两个LW u,vu,vu,v,如果u<vu<vu<v,那么u+vu+vu+v是LW

对于vvv的后缀,它比vvv大,所以一定不是最小的;

对于vvv,因为u<vu<vu<v,所以u+v<vu+v<vu+v<v

对于(u的后缀)+v(u的后缀)+v(u)+v,因为u<(u的后缀)u<(u的后缀)u<(u),所以u+v<(u的后缀)+vu+v<(u的后缀)+vu+v<(u)+v

所以u+vu+vu+v是最小的

所以LW可以递归定义:

  1. 单个字符是LW
  2. 多个字典序递增的LW顺次拼接后是LW

性质2 一个LW将最后一个字符变大后仍是LW

只有最后一个只包含一个字符的后缀变大,前面大小关系不变

性质3 任意字符串SSS存在且仅存在一种分解方式S=s1+s2+...+snS=s_1+s_2+...+s_nS=s1+s2+...+sn,使得所有sis_isi均为LW且单调不增

证明是不可能的,这辈子都是不可能的

把性质3中的分解称为Lyndon分解

接下来要讲的就是线性求Lyndon分解的Duval算法

首先三个指针i,j,ki,j,ki,j,k,表示iii以前的分解已经固定,现在处理第kkk个字符,jjj一会儿说

[1,i)[1,i)[1,i)s1+s2+...+sns_1+s_2+...+s_ns1+s2+...+sn,其中sis_isi为LW且单调不增

[i,k)[i,k)[i,k)t+t+...+t+t1t+t+...+t+t_1t+t+...+t+t1,其中ttt是LW,t1t_1t1ttt的可空前缀

也就是一个LW不断循环,最后一个循环节可以不完整。注意这不一定是[i,k)[i,k)[i,k)的Lyndon分解,因为t1t_1t1不一定是LW

别问为啥,问就是归纳法

现在把SkS_kSk加在后面,如果要继续循环,应该加的是Sk−循环节长度S_{k-循环节长度}Sk,我们把这个kkk应该跟的位置记为jjj

如果Sj=SkS_j=S_kSj=Sk,说明循环正常,继续往后

如果Sj<SkS_j<S_kSj<Sk,根据性质1,最后一个不完整的循环节t1t_1t1加上SkS_kSk是个LW并且比前面的ttt都大,不断向前合并发现整段都是LW。所以将[i,k][i,k][i,k]一长串合并成新的ttt,即令j=ij=ij=i

如果Sj>SkS_j>S_kSj>Sk 不管t1t_1t1SkS_kSk大小关系,反正后面怎么加怎么都会小于ttt,所以没ttt啥事了,把所有ttt固定下来,t1t_1t1作为新的循环节。然后t1t_1t1这个地方,我们之前以为它会进入循环,然而它没有,这里面漏了一些信息,所以需要从t1t_1t1的开头重新分解

模板题

#include <iostream>
#include <cstdio>
#include <cstring>
#include <cctype>
#define MAXN (1<<20)+5
using namespace std;
char s[MAXN];
int main()
{scanf("%s",s+1);int n=strlen(s+1);for (int i=1;i<=n;){int j=i,k=i+1;while (s[j]<=s[k]){if (s[j]==s[k]) ++j;else j=i;++k;}while (i<=j){printf("%d ",i+k-j-1);i+=k-j;}}return 0;
}

我 华 灯 宴 呢

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/315101.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

.NET Core IdentityServer4实战 第Ⅴ章-单点登录

OiDc可以说是OAuth的改造版&#xff0c;在最初的OAuth中&#xff0c;我们需要先请求一下认证服务器获取下Access_token&#xff0c;然后根据Access_token去Get资源服务器, 况且OAuth1 和 2 完全不兼容&#xff0c;易用性差&#xff0c;而OIDC可以在登陆的时候就把信息返回给你&…

【CF594E】Cutting the Line 【贪心】【Lyndon Word】【扩展kmp】

传送门 题意&#xff1a;给一个字符串SSS和正整数kkk&#xff0c;将SSS分成最多kkk段&#xff0c;每段不变或翻转&#xff0c;使得最后的字典序最小。 ∣S∣≤5106|S|\leq5\times10^6∣S∣≤5106 发现不翻转可以看成拆成若干单字符分别翻转&#xff0c;所以先分析一下必须翻转…

一份好的工作总结才能帮你升职加薪

这里是Z哥的个人公众号每周五早8点 按时送达当然了&#xff0c;也会时不时加个餐&#xff5e;我的第「79」篇原创敬上最近有点忙&#xff0c;搬出之前攒的一篇文章来应急一下。一篇能助你挣更多钱的文章。好了&#xff0c;下面开始。我的读者们大部分是互联网行业的&#xff0c…

腾讯开源软件镜像站上线

腾讯开源软件镜像站(Tencent Open Source Mirror Site)已于近日上线&#xff0c;其官方名称为「腾讯云软件源」&#xff0c;由腾讯云提供支持。官方表示搭建此开源镜像站的目的在于宣传自由软件的价值&#xff0c;提高自由软件社区文化氛围&#xff0c;推广自由软件在国内的应用…

ASP.NET Core on K8S学习初探(2)

“ [LOG] ASP.NET Core on K8S Starting...”在上一篇《单节点环境搭建》中&#xff0c;通过Docker for Windows在Windows开发机中搭建了一个单节点的K8S环境&#xff0c;接下来就是动人心弦的部署ASP.NET Core API到K8S了。但是&#xff0c;在部署之前&#xff0c;我还是把基本…

Educational Codeforces Round 96 E. String Reversa 线段树模拟序列交换

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 思路&#xff1a; 与上一篇题解大同小异&#xff0c;无非就是不需要枚举排列了。 // Problem: E. String Reversal // Contest: Codeforces - Educational Codeforces Round 96 (Rated for Div. 2) // URL:…

ASP.NET Core on K8S学习初探(1)

“ [LOG] ASP.NET Core on K8S Starting...”01—写在之前当近期的一个App上线后&#xff0c;发现目前的docker实例&#xff08;应用服务BFF中台服务工具服务&#xff09;已经越来越多了&#xff0c;而我司目前没有专业的运维人员&#xff0c;发现运维的成本逐渐开始上来&#…

.NET Core IdentityServer4实战 第Ⅳ章-集成密码登陆模式

回顾下ClientCredentials模式&#xff0c;在ReSourceApi中定义了我们公开服务&#xff0c;第三方网站想要去访问ReSourceApi则需要在身份验证服务中获取toekn&#xff0c;根据token的内容&#xff0c;硬编码去访问公开服务&#xff08;ResApi&#xff09;,这个还是非常简单的&a…

Codeforces Round #656 (Div. 3) F. Removing Leaves 贪心 + 模拟

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 思路&#xff1a; 首先有一个贪心策略就是每次都找一个叶子节点最多的点&#xff0c;让后删掉他的kkk个叶子节点&#xff0c;现在我们就来考虑如何模拟这个过程。 我们整一个vector<set<int>>ve…

.NetCore中三种注入生命周期的思考

.NetCore彻底诠释了“万物皆可注入”这句话的含义&#xff0c;在.NetCore中到处可见注入的使用。因此core中也提供了三种注入方式的生命周期使用&#xff0c;分别是&#xff1a;AddTransient&#xff1a;每次请求&#xff0c;都获取一个新的实例。即使同一个请求获取多次也会是…

兰州大学第一届 飞马杯 体育课排队 二分 + 最大流 + 输出路径

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 思路&#xff1a; 读懂题就会辣&#xff0c;经典模型了&#xff0c;二分时间&#xff0c;让后将其转换成二分图&#xff0c;左边是人&#xff0c;右边是位置&#xff0c;能在规定时间到的连边&#xff0c;跑…

从零开始实现ASP.NET Core MVC的插件式开发(一) - 使用Application Part动态加载控制器和视图...

如果你使用过一些开源CMS的话&#xff0c;肯定会用过其中的的插件化功能&#xff0c;用户可以通过启用或者上传插件包的方式动态添加一些功能&#xff0c;那么在ASP.NET Core MVC中如何实现插件化开发呢&#xff0c;下面我们来探究一下。本系列只是笔者的一些尝试&#xff0c;并…

兰州大学第一届 飞马杯 ★★快乐苹果树★★ 树链剖分 + 懒标记 + 树状数组

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 思路&#xff1a; 第一次听说树链剖分能在fa[top[i]]fa[top[i]]fa[top[i]]的地方加懒标记&#xff0c;学到了学到了。 首先不能被题目吓住&#xff0c;这个题目仔细剖析一下不难发现一些性质&#xff1a; 以…

.NET分布式框架 | Orleans 知多少

引言公司物联网项目集成Orleans以支持高并发的分布式业务&#xff0c;对于Orleans也是第一次接触&#xff0c;本文就分享下个人对Orleans的理解。这里先抛出自己的观点&#xff1a;Orleans 是一个支持有状态云生应用/服务水平伸缩的基于Virtual Actor 模型的.NET分布式框架。下…

nowcoder 牛牛的最大兴趣组 质因子 + 思维

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 思路&#xff1a; 首先nnn很小的话可以暴力连边&#xff0c;让后染个色求一个颜色最多的即可。但是这个题显然不行&#xff0c;由于是三次方&#xff0c;所以考虑质因子入手。 首先很容易就能想到将所有的数…

ASP.NET Core on K8S学习初探(3)部署API到K8S

“ 终于可以部署ASP.NET Core到K8S中了...”在上一篇《基本概念快速一览》中&#xff0c;我们把基本的一些概念快速地简单地不求甚解地过了一下&#xff0c;本篇开始我们会将ASP.NET Core WebAPI部署到K8S&#xff0c;从而结束初探的旅程。01—准备一个WebAPI这里准备一个空的A…

K-D Tree学习笔记

引入 K-D Tree 是一种处理高维空间的数据结构。 支持O(nk−1k)O(n^{\frac {k-1}k})O(nkk−1​)查询给定超矩形内的点的信息&#xff0c; kkk 为维数。 可以用替罪羊树的思想实现动态插入。 但其实用的最多的是在错误的复杂度内查询奇奇怪怪的点信息。 构建 K-D Tree 是平…

Codeforces Round #633 B. Edge Weight Assignment 结论题 + dp

传送门 文章目录题意&#xff1a;思路&#xff1a;题意&#xff1a; 思路&#xff1a; 首先考虑最小值&#xff0c;如果从一个叶子结点出发到任意叶子的距离都为偶数&#xff0c;那么只需要一个值就可以满足条件。如果有奇数的&#xff0c;考虑111 ^ 222 ^ 303030&#xff0c;…

ASP.NET Core Web API中使用Swagger

本节导航Swagger介绍在ASP.NET CORE 中的使用swagger在软件开发中,管理和测试API是一件重要而富有挑战性的工作。在我之前的文章《研发团队,请管好你的API文档》 也专门阐述了通过文档管理工具,来保证API文档和代码的一致性,这样更加有助于团队的协作。以往我们总是通过第三方平…

【ZJOI2015】幻想乡战略游戏【点分树】【带权重心】

题意&#xff1a;nnn个点带边权的树&#xff0c;动态修改点权viv_ivi​&#xff0c;最小化 钦定一个点xxx 后 ∑idist(x,i)∗vi\sum\limits_{i} dist(x,i)*v_ii∑​dist(x,i)∗vi​的值。 n,q≤105n,q \leq10^5n,q≤105&#xff0c;度数不超过202020 限制度数的树上的一些诡异…