数据结构(邓俊辉)学习笔记】串 07——KMP算法:分摊分析

文章目录

  • 1.失之粗糙
  • 2.精准估计

1.失之粗糙

以下,就来对 KMP 算法的性能做一分析。我们知道 KMP 算法的计算过程可以根据对齐位置相应的分为若干个阶段,然而每一个阶段所对应的计算量是有很大区别的。很快就会看到,如果只是简单地从最坏的角度来进行估计,我们将无法准确地来评估这种算法,而实际上真正有效的方法是,放眼整个计算过程,将整体的计算成本分摊到每一个阶段。

没错,分摊。我们这里需要再一次地借助分摊的分析技巧,而这里我们将要采用的估算方法也是分拆分析中的一种典型手法。

我们首先来看一种貌似无可厚非,但实则非常粗糙的估算方法。
在这里插入图片描述

这一方法建议我们将注意力放在文本串中的任意字符上,因为这种方法认为,我们只要估算出每一个字符所参与的比对次数,也自然地就可以得到整体的比对次数。然而我们很快就会发现,在任何一个特定的字符处,我们的模式串的确有可能会多次地后移。实际上不能构造出这样的例子,也就是相对于文本串中的某个特定字符,模式串有可能需要连续的后移多次,并且用其中多答 Ω(m) 个字符,与文本串中的这个字符进行比对。当然具体的次数可能是m/3、m/40 或者m/500。但无论如何,在渐进的意义上,都可以达到Ω(m)次。因此,如果再考虑到主串所贡献的那个因子 n,那么按照这种思路,KMP 的时间复杂度似乎会高达Ω(n*m)。

这样一个分析结论多少会让我们感到沮丧,因为蛮力算法也不过如此。然而事实上,这种方法的确实失之粗糙,而接下来更为精细地分析将表明,KMP 算法的效率即便在最坏情况下也不会超过线性O(n)。

2.精准估计

在这里插入图片描述为了对KMP算法性能作出更为精细的分析,我们可以参照在第一章就确立的方法,将这个算法中,不涉及到实质计算内容的非迭代部分都删除掉,而将注意力集中于复杂度的主体,也就是其中的这个循环。

在这里,我们需要引入一个观察量 k。 在算法执行过程中的任何时刻,这个 k 都等于 2*i - j。实际上,在很多开发环境中,都提供了观察功能,允许你设置这样一个表达式,并且在算法的调试运行过程中,动态地给出表达式所对应的数值。

实际上,随的算法中这个迭代过程的不断推进,这个观察变量 k, 必然是单调递增的。这一性质并不难看出,实际上无非 if 和 else 两种可能。

  1. 首先,如果当前这步迭代选取的是 if 分支,那么,根据算法的流程,i 和 j 会同步地递增一个单位。于是,作为 2*i - j,k 应该恰好增加一个单位。
  2. 反之,如果当前这步迭代进入的是 else 分支,那么尽管 i 不会受到任何影响,但是 j 会被替换为它对应的 next 表项,你应该记得我们此前已经指出, j 所对应的那个 next 表项必然会严格地小于 j。也就是说,经过这样一次替代之后,在数值上 j 必然会严格地减少,所以 k 也至少会增加一个单位。

综合这两种情况,我们就会发现 ,k 随着迭代的进行的确会严格单调地不断递增。

因此,整个计算过程中所进行的迭代步数就绝对不会超过 k。也就是说只要我们能够界定 k 的上界,也就自然确定了整个算法复杂度的上界。那么 k 的变化幅度究竟是多大呢?

  1. 首先,既然 i 和 j 的初值都是0,所以 k 的初值也应该是0。
  2. 而在算法结束时,i 至多与 n 同阶,而 j 也至少是一个常数。这也就意味着在渐进的意义上,k 绝对不会超过线性的范围。

至此,我们也就确凿地给出了 KMP 算法性能的一个准确估计。是的,这里给出的估计方法非常初等,因此其结论也毋庸置疑。

当然,作为进一步的探求,你或许会好奇于这里的 k,也就是 2*i - j 的具体含义,自行探索。

在这里插入图片描述

当然,作为 KMP 算法的有机组成部分,我们也不要忘了 next 表的构造过程。然而,正如我们已经看到的,这个预处理算法的原理及过程与主算法完全相同,因此其复杂度也应该线性正比于它自己的输入规模,也就是模式串的长度 O(m)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/52465.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CocosCreator3.8 IOS 构建插屏无法去除的解决方案

CocosCreator3.8 IOS 构建插屏无法去除的解决方案 在实际项目开发过程中,我们通常无需CocosCreator 自带的插屏,一般采用自定义加载页面。 然后在构建IOS 项目时,启用(禁用)插屏无法操作,如下图所示&#…

运放阻抗和噪声(同相放大器的输入/输出阻抗 + 电压跟随器阻抗 + 噪声 +信噪比)

2024-8-27,星期一,21:03,天气:阴雨,心情:晴。培训终于结束啦,开始轮岗了,看了两天PPT,加油加油,继续学习。 今天继续学习第六章运算放大器,主要学…

第4章 汇编语言和汇编软件

第4章 汇编语言和汇编软件 该章主要介绍了汇编语言和汇编语言编译器的安装和使用。 汇编语言程序 该小节主要介绍了为什么要有汇编语言和汇编语言程序的一些基础写法。 书中有提到CPU有不同的架构,汇编语言有不同的风格,那么不同的CPU架构和不同的汇…

正则表达式——详解

正则表达式是什么? 正则表达式(Regular Expression,通常简写为 regex、regexp 或 RE)是一种强大的文本处理工具,用于描述一组字符串的模式。它可以用来匹配、查找、替换等操作,几乎所有现代编程语言都支持…

cola_os学习笔记(上)

cola_os的学习笔记 声明 该项目系本人学习项目所做的笔记。该项目的项目地址为cola_os: 300行代码实现多任务管理的OS,在很多MCU开发中,功能很简单,实时性要求不强,如果使用RTOS显得太浪费,任务多了管理不当又很乱&a…

Anaconda3简介与安装步骤

目录 Anaconda3简介与功能 1.Anaconda3简介 2.主要功能和特点 3.使用场景 4.总结 Anaconda3安装 1.Anaconda3下载 1.1我的百度网盘 1.2官网下载 1.2.1访问官网 1.2.2输入邮箱 1.2.3登录你的邮箱下载(你的噶) 2.安装 2.1双击安装 2.2选择安…

计算机视觉编程 3(图片处理)

目录 图像差分 高斯差分 形态学-物体计数 ​编辑 图片降噪 图像差分 # -*- coding: utf-8 -*- from PIL import Image from pylab import * from scipy.ndimage import filters import numpy# 添加中文字体支持 from matplotlib.font_manager import FontProperties font…

VMWare中添加Ubuntu20.04.06镜像

一、下载Ubuntu镜像 Ubuntu20.04: 官方下载地址https://releases.ubuntu.com/20.04.6/ 进入官网 点击下图红框位置,下载镜像镜像名为ubuntu-20.04.6-desktop-amd64.iso 也可点击下面链接直接下载:https://releases.ubuntu.com/20.04.6/ubu…

车间多台分散PLC如何在不同协议的情况下实现无线通讯?

项目背景 为推动企业智能化数字化升级,积极响应节能减排与能源可持续发展的号召,进一步增强企业竞争力,同时为避免大幅度电缆铺设及维护工作,厂区需要针对目前的燃煤发电作业进行技术及流程的无线改造。通过这些无线技改措施的实施…

2023年最新自适应主题懒人网址导航v3.9php源码

源码简介 这个懒人网址导航源码是一个基于PHPMySQL开发的网址导航系统。该版本是在原有3.8版本的基础上进行了修复和功能增强。我们建议新用户直接使用这个最新版本,放弃旧版本。如果你有二次开发的能力,可以根据更新日志自行进行升级。我们将在后期继续…

记录一次target引发的事故:一直提示数据库连接超时

你们好,我是金金金。 场景 启动项目,一直报数据库连接超时: The last packet sent successfully to the server was 0 milliseconds ago. The driver has not received any packets from the server. The error may exist in com/xuecheng/sy…

稚晖君智元机器人远程机器人系列发布:引领具身智能新高度

在最近的发布会上,前华为“天才少年”稚晖君及其团队亮相了他们的最新作品——智元机器人的第二代远程机器人系列。这次发布会不仅展示了丰富的产品线,还揭示了其未来的发展路线以及开源计划。本文将详细解析本次发布会的亮点和技术背后的创新。 一、发…

Kafka事件(消息、数据、日志)的存储

1、查看有关kafka日志配置文件的信息 2、查看kafka全部主题的日志文件 3、查看每个主题的日志文件 4、__consumer_offsets-xx文件夹的作用 package com.power;public class Test {public static void main(String[] args) {int partition Math.abs("myTopic".hashCo…

秋招TCP篇(较全的TCP网络知识,通俗理解底层逻辑)

TCP详细知识 计算机网络八股-局域网和广域网详解八股-OSI七层模型和TCP/IP五层模型八股-数据在网络之间传递的过程八股-UDP详解根据协议格式详解TCPSocket详解八股-TCP可靠性机制确认应答超时重传超时重传等待时间数据去重 八股-三次握手和四次挥手三次握手四次挥手为什么要三次…

中科服务器磁盘未断电状态被人拔插导致raid故障,安装系统找不到系统盘 修复raid再次安装系统成功

1,根据提示按del进入bios 直接回车 改成good状态保存(多块盘的话重复此操作即可,直到让盘的状态显示good或者online) 然后回到上级导入raid信息 raid信息导入 设置成yes,然后保存退出 然后他会自己同步数据&…

Linux 软件编程多路复用tcp

1.select的缺点: 1.select监听的文件描述符集合是一个数组,有上限(1024个) 2.select监听的文件描述符集合在应用层,内核层监听事件后需要传递给用户层带来资源开销 3.select需要用户手动查找产生事件的文件…

【Linux】分析一段oom及oops报错日志

oom相关日志分析: Oom-killer错误是因系统内存分配不足,为保障系统正常运行会随机kill掉占用较多的内存进程。 该日志已经输出内存占满相关提示,内存上限为16G,当前已使用16G,内存限制导致分配失败次数为586755次。 OOPS相关日志…

交换排序(冒泡排序和快速排序)

一、基本思想 所谓交换,就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置。 交换排序的特点是:将键值较大的记录向序列的尾部移动,键值较小的记录向序列的前部移动。 二、冒泡排序 1.核心思想 两两相邻的元素进行比…

6G网络的关键技术、应用前景与挑战并存的科技征途

移动通信技术正以前所未有的速度迭代更新,而6G技术的研发与商用化进程渐渐成为了当前科技领域的热点与焦点。在5G技术尚未完全普及的今天,全球各国已纷纷将目光投向了更加充满想象的6G网络时代。本文将探讨全球6G研发的最新进展,特别是欧盟与…

Linux进程间通信——互斥锁与信号量详解

文章目录 互斥锁信号量整形信号量记录形信号量利用信号量实现进程互斥利用信号量实现同步利用信号量实现前驱关系 互斥锁 现实中的锁有两种状态,打开和关闭,分别对应这资源可以被使用,和不可以被使用,我们可以通过使用钥匙对锁的…