数据结构(邓俊辉)学习笔记】串 07——KMP算法:分摊分析

文章目录

  • 1.失之粗糙
  • 2.精准估计

1.失之粗糙

以下,就来对 KMP 算法的性能做一分析。我们知道 KMP 算法的计算过程可以根据对齐位置相应的分为若干个阶段,然而每一个阶段所对应的计算量是有很大区别的。很快就会看到,如果只是简单地从最坏的角度来进行估计,我们将无法准确地来评估这种算法,而实际上真正有效的方法是,放眼整个计算过程,将整体的计算成本分摊到每一个阶段。

没错,分摊。我们这里需要再一次地借助分摊的分析技巧,而这里我们将要采用的估算方法也是分拆分析中的一种典型手法。

我们首先来看一种貌似无可厚非,但实则非常粗糙的估算方法。
在这里插入图片描述

这一方法建议我们将注意力放在文本串中的任意字符上,因为这种方法认为,我们只要估算出每一个字符所参与的比对次数,也自然地就可以得到整体的比对次数。然而我们很快就会发现,在任何一个特定的字符处,我们的模式串的确有可能会多次地后移。实际上不能构造出这样的例子,也就是相对于文本串中的某个特定字符,模式串有可能需要连续的后移多次,并且用其中多答 Ω(m) 个字符,与文本串中的这个字符进行比对。当然具体的次数可能是m/3、m/40 或者m/500。但无论如何,在渐进的意义上,都可以达到Ω(m)次。因此,如果再考虑到主串所贡献的那个因子 n,那么按照这种思路,KMP 的时间复杂度似乎会高达Ω(n*m)。

这样一个分析结论多少会让我们感到沮丧,因为蛮力算法也不过如此。然而事实上,这种方法的确实失之粗糙,而接下来更为精细地分析将表明,KMP 算法的效率即便在最坏情况下也不会超过线性O(n)。

2.精准估计

在这里插入图片描述为了对KMP算法性能作出更为精细的分析,我们可以参照在第一章就确立的方法,将这个算法中,不涉及到实质计算内容的非迭代部分都删除掉,而将注意力集中于复杂度的主体,也就是其中的这个循环。

在这里,我们需要引入一个观察量 k。 在算法执行过程中的任何时刻,这个 k 都等于 2*i - j。实际上,在很多开发环境中,都提供了观察功能,允许你设置这样一个表达式,并且在算法的调试运行过程中,动态地给出表达式所对应的数值。

实际上,随的算法中这个迭代过程的不断推进,这个观察变量 k, 必然是单调递增的。这一性质并不难看出,实际上无非 if 和 else 两种可能。

  1. 首先,如果当前这步迭代选取的是 if 分支,那么,根据算法的流程,i 和 j 会同步地递增一个单位。于是,作为 2*i - j,k 应该恰好增加一个单位。
  2. 反之,如果当前这步迭代进入的是 else 分支,那么尽管 i 不会受到任何影响,但是 j 会被替换为它对应的 next 表项,你应该记得我们此前已经指出, j 所对应的那个 next 表项必然会严格地小于 j。也就是说,经过这样一次替代之后,在数值上 j 必然会严格地减少,所以 k 也至少会增加一个单位。

综合这两种情况,我们就会发现 ,k 随着迭代的进行的确会严格单调地不断递增。

因此,整个计算过程中所进行的迭代步数就绝对不会超过 k。也就是说只要我们能够界定 k 的上界,也就自然确定了整个算法复杂度的上界。那么 k 的变化幅度究竟是多大呢?

  1. 首先,既然 i 和 j 的初值都是0,所以 k 的初值也应该是0。
  2. 而在算法结束时,i 至多与 n 同阶,而 j 也至少是一个常数。这也就意味着在渐进的意义上,k 绝对不会超过线性的范围。

至此,我们也就确凿地给出了 KMP 算法性能的一个准确估计。是的,这里给出的估计方法非常初等,因此其结论也毋庸置疑。

当然,作为进一步的探求,你或许会好奇于这里的 k,也就是 2*i - j 的具体含义,自行探索。

在这里插入图片描述

当然,作为 KMP 算法的有机组成部分,我们也不要忘了 next 表的构造过程。然而,正如我们已经看到的,这个预处理算法的原理及过程与主算法完全相同,因此其复杂度也应该线性正比于它自己的输入规模,也就是模式串的长度 O(m)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/52465.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt5.14.2 操作PostgreSQL 记录

在Qt5.14.2中操作PostgreSQL数据库. #include <QSqlDatabase> #include <QSqlQuery> #include <QSqlError> #include <QDebug>// 初始化数据库连接QSqlDatabase db QSqlDatabase::addDatabase("QPSQL");//qDebug() << "aaaa&qu…

CocosCreator3.8 IOS 构建插屏无法去除的解决方案

CocosCreator3.8 IOS 构建插屏无法去除的解决方案 在实际项目开发过程中&#xff0c;我们通常无需CocosCreator 自带的插屏&#xff0c;一般采用自定义加载页面。 然后在构建IOS 项目时&#xff0c;启用&#xff08;禁用&#xff09;插屏无法操作&#xff0c;如下图所示&#…

运放阻抗和噪声(同相放大器的输入/输出阻抗 + 电压跟随器阻抗 + 噪声 +信噪比)

2024-8-27&#xff0c;星期一&#xff0c;21:03&#xff0c;天气&#xff1a;阴雨&#xff0c;心情&#xff1a;晴。培训终于结束啦&#xff0c;开始轮岗了&#xff0c;看了两天PPT&#xff0c;加油加油&#xff0c;继续学习。 今天继续学习第六章运算放大器&#xff0c;主要学…

第4章 汇编语言和汇编软件

第4章 汇编语言和汇编软件 该章主要介绍了汇编语言和汇编语言编译器的安装和使用。 汇编语言程序 该小节主要介绍了为什么要有汇编语言和汇编语言程序的一些基础写法。 书中有提到CPU有不同的架构&#xff0c;汇编语言有不同的风格&#xff0c;那么不同的CPU架构和不同的汇…

正则表达式——详解

正则表达式是什么&#xff1f; 正则表达式&#xff08;Regular Expression&#xff0c;通常简写为 regex、regexp 或 RE&#xff09;是一种强大的文本处理工具&#xff0c;用于描述一组字符串的模式。它可以用来匹配、查找、替换等操作&#xff0c;几乎所有现代编程语言都支持…

cola_os学习笔记(上)

cola_os的学习笔记 声明 该项目系本人学习项目所做的笔记。该项目的项目地址为cola_os: 300行代码实现多任务管理的OS&#xff0c;在很多MCU开发中&#xff0c;功能很简单&#xff0c;实时性要求不强&#xff0c;如果使用RTOS显得太浪费&#xff0c;任务多了管理不当又很乱&a…

Anaconda3简介与安装步骤

目录 Anaconda3简介与功能 1.Anaconda3简介 2.主要功能和特点 3.使用场景 4.总结 Anaconda3安装 1.Anaconda3下载 1.1我的百度网盘 1.2官网下载 1.2.1访问官网 1.2.2输入邮箱 1.2.3登录你的邮箱下载&#xff08;你的噶&#xff09; 2.安装 2.1双击安装 2.2选择安…

开启创意编程新篇章:Scratch的持续创新与功能拓展

开启创意编程新篇章&#xff1a;Scratch的持续创新与功能拓展 Scratch&#xff0c;这款广受全球儿童和教育工作者喜爱的编程工具&#xff0c;从未停止过创新的步伐。随着技术的发展和用户需求的增长&#xff0c;Scratch团队一直在不断地为其添加新的编程特性和功能。本文将综合…

【Android】如何使用adb抓取Android系统的WiFi日志

🐚作者简介:花神庙码农(专注于Linux、WLAN、TCP/IP、Python等技术方向)🐳博客主页:花神庙码农 ,地址:https://blog.csdn.net/qxhgd🌐系列专栏:WLAN技术📰如觉得博主文章写的不错或对你有所帮助的话,还望大家三连支持一下呀!!! 👉关注✨、点赞👍、收藏�…

计算机视觉编程 3(图片处理)

目录 图像差分 高斯差分 形态学-物体计数 ​编辑 图片降噪 图像差分 # -*- coding: utf-8 -*- from PIL import Image from pylab import * from scipy.ndimage import filters import numpy# 添加中文字体支持 from matplotlib.font_manager import FontProperties font…

groovy闭包语法详解(二)

文章目录 线程中的闭包调用自定义闭包重写doCall查找并调用闭包成员闭包中的形参扩展闭包的实参控制 线程中的闭包调用 package com.juan.groovyclass MyThread extends Thread {// 闭包成员变量Closure closureMyThread(Closure c) {this.closure c// 启动线程&#xff0c;运…

数据结构基础.顺序表与链表

数据结构&#xff1a; 1.衡量一个程序是否优秀&#xff1a; 1.时间复杂度&#xff1a; 数据量增长与程序运行时间的比例关系以函数描述称为时间渐进复杂度函数,简称时间复杂度 O(c) > O(logn) > O(n) > O(nlogn) > O(n^2) > O(n^3) > O…

VMWare中添加Ubuntu20.04.06镜像

一、下载Ubuntu镜像 Ubuntu20.04&#xff1a; 官方下载地址https://releases.ubuntu.com/20.04.6/ 进入官网 点击下图红框位置&#xff0c;下载镜像镜像名为ubuntu-20.04.6-desktop-amd64.iso 也可点击下面链接直接下载&#xff1a;https://releases.ubuntu.com/20.04.6/ubu…

车间多台分散PLC如何在不同协议的情况下实现无线通讯?

项目背景 为推动企业智能化数字化升级&#xff0c;积极响应节能减排与能源可持续发展的号召&#xff0c;进一步增强企业竞争力&#xff0c;同时为避免大幅度电缆铺设及维护工作&#xff0c;厂区需要针对目前的燃煤发电作业进行技术及流程的无线改造。通过这些无线技改措施的实施…

2023年最新自适应主题懒人网址导航v3.9php源码

源码简介 这个懒人网址导航源码是一个基于PHPMySQL开发的网址导航系统。该版本是在原有3.8版本的基础上进行了修复和功能增强。我们建议新用户直接使用这个最新版本&#xff0c;放弃旧版本。如果你有二次开发的能力&#xff0c;可以根据更新日志自行进行升级。我们将在后期继续…

oracle和mysql查询某字段在哪个表中

oracle和mysql查询某字段在哪个表中 oracle的 select TABLE_NAME from user_tab_columns where COLUMN_NAME字段名mysql的&#xff1a; select table_schema ,table_name from information_schema.columns where column_name ‘字段名’ 查询结果table_schema为数据库名&a…

记录一次target引发的事故:一直提示数据库连接超时

你们好&#xff0c;我是金金金。 场景 启动项目&#xff0c;一直报数据库连接超时&#xff1a; The last packet sent successfully to the server was 0 milliseconds ago. The driver has not received any packets from the server. The error may exist in com/xuecheng/sy…

稚晖君智元机器人远程机器人系列发布:引领具身智能新高度

在最近的发布会上&#xff0c;前华为“天才少年”稚晖君及其团队亮相了他们的最新作品——智元机器人的第二代远程机器人系列。这次发布会不仅展示了丰富的产品线&#xff0c;还揭示了其未来的发展路线以及开源计划。本文将详细解析本次发布会的亮点和技术背后的创新。 一、发…

unittest 和 pytest 的区别

一、用例编写规则 1.unittest 提供了 test cases、test suites、test fixtures、test runner 相关的类,让测试更加明确、方便、可控。使用 unittest 编写用例,必须遵守以下规则: &#xff08;1&#xff09;测试文件必须先 import unittest &#xff08;2&#xff09;测试类必须…

js去重的方法

js去重的方法 for循环indexOf const result [] for(let i0;i<arr.length;i){if(result.indexOf(arr[i]-1)){result.push(arr[i])} }filter indexOf arr.filter((item,index,arr) > arr.indexOf(item)-1)用set数据结构&#xff08;set会把数组变成一系列无序的、没有…