求最长回文串-从动态规划到马拉车之路(下)

预备知识:

(1)在一个数轴上有两点i和j(i<=j)关于点m对称,那么有 i = 2m-j;

 证明: 因为 i<=j 且 i 和 j 关于 m 对称,那么有 (i + j)/ 2 = m

  所以 i = 2m - j;

(2)回文串的对称性:

 由回文串的定义可以知道,奇回文关于最中心的数对称,而偶回文关于最中心的两个数之间的间隔对称。

根据回文串的对称性质,可以得到如下图所示的有用结论:


 如图所示,A是一个从0到N的回文串,且M是回文串A的中心,那么就能推出字符串

AL[0...f(M)] ==AR[g(M)...N],其中f(M)为对M向下取整,g(M)为对M向上取整;

 那么如果图中的B是回文串(B包含在A的左半区内),且以I为中心;而且J和I关于M对称,

那么以J为中心一定存在一个回文串C,且C和B完全相同;

 推论:


 如上图所示,如果J关于M的对称点I为中心的回文串的最左端B0超出了回文串A的最左端A0,

那么我们就无法肯定地说一定存在一个以J为中心的回文串C,且C与B完全相同了(因为[B0,A0)

范围内的字符在回文A以外,不受对称性的控制)。但是如果我们舍弃B的[B0,A0)部分,也就是取

上图中的[A0,A0']为以I为中心的回文串B';那么就能确定以J为中心的[AN',AN]也是回文串,

[AN',AN]和[A0,A0']完全相同(其中的AN'和A0'也关于M对称)。

(3) 把奇回文和偶回文的分类考察统一为一种考察

 这是一种技巧性的处理方式,给定了一个字符串babad;

在考察babad为是不是回文的时候,我们要考虑它是否关于最中心的b对称(即是否为ba|b|ad),

在考察子串baba是否为回文串的时候,要考虑是否关于最中心的ab之间的间隙对称(即是否为ba|ba);

这就使得我们需要分情况去讨论字符串是否为回文串。

 现在对字符串做如下的处理,华丽变身为如下的字符串#b#a#b#a#d#,对与这个字符串,

你要确定它本身是不是回文串,依然需要分成奇回文和偶回文来讨论。但是如果你通过它来确定它的

生成源(babad)是否为回文串,那么就只需要按奇回文的情况来考虑就可以了。额,具体来说就是,

如果我考虑#b#a#b#a#d#是否以某个#为中心是回文串的时候,实际就是考察生成源是否以两个字母之间

的间隙为中心为回文串(偶回文情况);如果我考虑#b#a#b#a#d#是否以某个非#的字符为中心的回文串时,

实际就是考察生成源是否是以该字母为中心的回文串(奇回文情况);

 用上篇中提到的扩展法来处理#b#a#b#a#d#,且只考虑奇回文情况,那么可以得到下表:


 从表中我们看出,在只考虑奇回文的情况下,求的的每个回文串的长度设为L;那么有生成源的回文的长度为(L-1)/2;并且长度为L的回文子串的开始字符和结束字符在该字符串中的下标分别设为S和E;

那么S/2向下取整为对应的生成源的回文子串在生成源中的开始下标;(E-1)/2向下

取整为对应的生成源的回文子串在生成源中的结束下标。

例如(#b#a#b#a#d#)中第6行有#a#b#a#的回文子串长度为7,开始下标为2,结束下标为8

 那么就对应于生成源(babad)的回文子串aba长度为3,开始下标为1,结束下标为3。


“马拉车算法”

 首先定义长度为奇数的字符串S的半径为r(S) = (S.length()-1)/2 ;

如下图所示:


 然后定义输入 radses ,radses[i]用来存放已经求的的以i为中心的奇回文的半径r;

 再定义, current_center,current_rights_index分别为已经求得半径的奇回文中结束下标最大

的奇回文的中心,最右下标。为什么要记录这个量,其实是为了尽可能的取减少重

复计算(也就是尽可能的利用预备知识中的(2));因为current_rights_index越大,

自加后i在它的左侧的可能就越大;这样就更可能的对这个i利用预备知识(2),

直接确定一个以i为中心的较大的初始半径,减少比较次数。

 定义,result_center,result_rads所求的最长的回文串的中心和半径;

代码实现如下:

# -*- coding:utf-8 -*-
# Author: Evan Mi
import math
# 要测试的字符串
test_str = 'babad'
# enriched_len 是指#b#a#b#a#d#的长度
enriched_len = len(test_str)*2 + 1#
radses = [0]*enriched_lencurrent_rights_index = 0
current_center = 0result_rads = 0
result_center = 0for i in range(enriched_len):   # 遍历所有增强后的字符串#b#a#b#a#d# 这里我并没有真的构建该字符串,只是假装有一个if current_rights_index > i:"""如过i在current_rights_index的左侧,那么就可以利用预备知识(2)来确定更长的初始半径symmetric_i = 2*current_center - i 预备知识(1) 求出i关于current_center对称的点的下标radses[i] = min(radses[symmetric_i], current_rights_index - i)当i在current_rights_index的左侧时,预备知识(2)或其推论,必然有一个成立;current_rights_index - i(推论中的AN - J 由对称性 也是 I - A0)是推论成立时的半径,radses[symmetric_i]是预备知识(2)成立时的情况。这里用min,读者可以从预备知识(2)中的图上看出来,推论成立的时候一定是current_rights_index - i小,而反之则是radses[symmetric_i];当然也可能一起成立,相等取最小也是OK的。"""symmetric_i = 2*current_center - iradses[i] = min(radses[symmetric_i], current_rights_index - i)else:radses[i] = 0"""i - (radses[i] + 1) >= 0 半径向左扩展1,不超出列表范围i + (radses[i] + 1) < enriched_len 半径向右扩展1,不超出列表范围((i - (radses[i] + 1)) % 2 == 0 and (i + (radses[i] + 1)) % 2 == 0) 扩展后的最左端和最右端的字符都是#这里要说明,在给一个字符串填充#以后,所有的下标为偶数的字符都是#,大家可以自己证明。(test_str[math.floor((i - (radses[i] + 1))/2)] == test_str[math.floor((i + (radses[i] + 1))/2)]))在被#号填充后的字符串中,所有不是#号的字符,也就是来自源字符串的字符的下标除以2,向下取整,就是对应与该字符在源字符串中的下标。第三和第四个条件的或组合,其实就是判断半径扩展一以后两端的字符是否相同。这里因为并没有真正的去用#来填充原列表,而是在想象中完成,所以我们通过第三个判断来判断在想象中填充过的字符串的两个对应位置是否都是#号,第四个判断条件则是判断想象中填充过的字符串的两个来自于源字符串的字符是否相同; 当然,你也可以真的建立一个填充过的列表,那么第三和第四条判断就变成了:填充过的数组[i-radses[i]] == 填充过的数组[i+radses[i]];但是多用了n+1个空间"""while i - (radses[i] + 1) >= 0 and i + (radses[i] + 1) < enriched_len and \(((i - (radses[i] + 1)) % 2 == 0 and (i + (radses[i] + 1)) % 2 == 0) or(test_str[math.floor((i - (radses[i] + 1))/2)] ==test_str[math.floor((i + (radses[i] + 1))/2)])):radses[i] = radses[i] + 1   # 两端都可以扩展,那么半径扩展1if current_rights_index < i + radses[i]:  # 保持current_rights_index为最右的端点current_rights_index = i + radses[i]current_center = iif result_rads < radses[i]:  # 保存result_rads为半径最大(也就是我们要求的最长回文串)result_rads = radses[i]result_center = i"""
这里用到了前提(3),从填充的字符的开始和结束下标转换为源字符的开始和结束下标解释结束下标应该为
(result_center+result_rads-1)/2向下取整,
由于在python中,为前开后闭,所以变成了
(result_center+result_rads-1+1)/2向下取整,
也就是(result_center+result_rads)/2向下取整,
"""
print(test_str[math.floor((result_center-result_rads) / 2):math.floor((result_center+result_rads)/2)])



时间复杂度(原子操作是比较),下图中的每一个绿色,都代表该方格与它左边的对称方格进行了一次比较:


可以看到,比较的次数不可能是 n^2+(......),而是 an+常数,所以时间复杂度是O(n)




本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/569207.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Copy: 了解SQL Server锁争用:NOLOCK 和 ROWLOCK 的秘密

From http://blog.csdn.net/Atwind/archive/2007/10/19/1832844.aspx 关系型数据库&#xff0c;如SQL Server&#xff0c;使用锁来避免多用户修改数据时的并发冲突。当一组数据被某个用户锁定时&#xff0c;除非第一个用户结束修改并释放锁&#xff0c;否则其他用户就无法修改…

react-json渲染

在js文件内 //定义react组件 import React from react; import ReactDom from react-dom import ./components/assets/taobao.cssclass TaoBao extends React.Component{state{list:[{title:女装,href:javescript:;,hot:false,child:[{title:衬衫,href:javescript:;,hot:false}…

pageContext对象

这个对象代表页面上下文&#xff0c;该对象主要用于访问JSP之间的共享数据。使用pageContext可以访问page、request、session、application范围的变量。 pageContext是PageContext类的实例&#xff0c;它提供了如下两个方法来访问page、request、session、application范围的变量…

noi.ac #543 商店

我们考虑可并堆维护&#xff0c;从深到浅贪心选取。 用priority_queue启发式合并的话&#xff0c;是60pts: #include<iostream> #include<cstdio> #include<cstring> #include<algorithm> #include<cmath> #include<queue> #include<ct…

软件设计师--文件索引

问题&#xff08;题目&#xff09;如下图所示&#xff1a;这道题最中要的是理解什么是直接索引、一级间接索引、二级间接索引&#xff1a; 直接索引&#xff1a;地址项直接指向文件块 一级间接索引&#xff1a;地址项&#xff08;一层&#xff09;指向存放地址项&#xff08;二…

Floyd算法及其应用

Part I-Introduction Floyd算法是一种求图上多源最短路径的算法&#xff0c;适用于中小规模的图&#xff0c;思维简单易懂。 Floyd算法的实质是&#xff08;区间&#xff09;动态规划&#xff0c;在这里做一个简单的概述。 对于一个有\(n\)个结点的图&#xff0c; 令\(dis[i][j…

软件设计师--最早开始时间和最晚开始时间

题目如图所示&#xff0c;解法如下&#xff1a; 方法&#xff1a; 先求最早开始时间&#xff1a;A是开始节点&#xff0c;所以A的最早开始时间是0&#xff0c;并且最早开始时间等于最晚开始时间。等得到图中红色的部分。 其他节点的最早开始时间为以该节点作为弧头的所有有向…

软件设计师 --哈夫曼树的一个经典问题

题目如下&#xff1a;有很多人反应&#xff0c;他们怎么做都做不出正确的答案&#xff0c;结果发过他们画的哈夫曼树的图以后&#xff0c;发现图完全是错误的&#xff1b; 如下图所示&#xff1a;为什么错误的&#xff0c;因为在遇到有两个权重为17的树的时候&#xff0c;没有遵…

mini2440烧写nor flash

1. 安装Setup_JLinkARM_V440.exe 2. 打开JLINK ARM 3. File->Open Project&#xff0c;打开 s3c2440a_embedclub.jflash4. Options->Project settings... 选择 Flash&#xff0c;点击 Select flash device&#xff0c;选中开发板对应的 Nor Flash 芯片型号。比 如 S29AL0…

软件设计师--判定覆盖,判定条件覆盖,条件组合覆盖--一个栗子

针对上图的一个判断条件&#xff0c;在这里将分别讨论判定覆盖、判定条件覆盖、条件组合覆盖的情况&#xff1a; 设T1A>3,T2B>3;为该判定节点的两个子条件。 (一&#xff09;判定覆盖&#xff1a; 所谓的判定覆盖就是让判定的真分支和假分支各执行一次&#xff0c;只要…

python3 多继承搜索__init__方法的两种策略

继承情形一&#xff1a;测试代码如下&#xff1a; class A(object):def __init__(self):print(A)class B(object):def __init__(self):print(B)class C(A):def __init__(self):print(C)class D(B): def __init__(self):print(D)class E(C, D):pass执行当前代码 xE()&#xff0c…

Unity Shader 屏幕后效果——Bloom外发光

Bloom的原理很简单&#xff0c;主要是提取渲染图像中的亮部区域&#xff0c;并对亮部区域进行模糊处理&#xff0c;再与原始图像混合而成。 一般对亮部进行模糊处理的部分采用高斯模糊&#xff0c;关于高斯模糊&#xff0c;详见之前的另一篇博客&#xff1a; https://www.cnblo…

不要假装努力,结果不会陪你演戏!

转载于:https://www.cnblogs.com/strive-19970713/p/11171205.html

机器学习基石-作业二-第10题分析

题目如上图所示&#xff0c;答案是&#xff1a;&#xff1b;在网上看到的答案中有一个很好的解释就是说在一个n纬的欧几里德空间里&#xff0c;分别按照参数做一个垂直于每个轴的超平面&#xff0c;这些超平面能够打散这么多个点。首先我承认这个事实&#xff0c;具体的证明还没…

机器学习基石作业二中的DECISION_STUMP实现

概要&#xff1a;在林老的题目描述中&#xff0c;DECISION_STUMP&#xff08;其实就是“决策桩”&#xff0c;也就是只有一层的决策树&#xff09;。题目中提到了的选去是把属性&#xff08;一维的&#xff09;按照从小到大的顺序排列以后取两个挨着的值的平均值&#xff0c;网…

【MM系列】SAP 关于更改物料的价格控制类型

公众号&#xff1a;SAP Technical本文作者&#xff1a;matinal原文出处&#xff1a;http://www.cnblogs.com/SAPmatinal/ 原文链接&#xff1a;【MM系列】SAP 关于更改物料的价格控制类型前言部分 大家可以关注我的公众号&#xff0c;公众号里的排版更好&#xff0c;阅读更舒适…

机器学习基石-作业三-第2题分析以及通过H证明EIN的讨论

题目&#xff1a; 这是机器学习基石作业三种的第二小题&#xff0c;额&#xff0c;在网上看了很多解答&#xff08;解答也不多&#xff09;感觉都没有说清楚为什么&#xff0c;所以励志清楚滴解决一下这个问题&#xff0c;经过努力&#xff0c;自认为得到了详细的解答&#xff…

Nginx的平滑升级记录---适用于编译安装的Nginx

一、查看自己的Nginx的版本号 [rootlocalhost sbin]# cd /usr/local/nginx/sbin/ [rootlocalhost sbin]# ls nginx [rootlocalhost sbin]# ./nginx -V nginx version: nginx/1.15.0 built by gcc 4.8.5 20150623 (Red Hat 4.8.5-36) (GCC) configure arguments: 二、确定自己要…