【C语言】深入理解KMP算法及C语言实现

一、KMP算法简介

 KMP算法(Knuth-Morris-Pratt算法)是一种高效的字符串匹配算法,由Donald Knuth、James H. Morris和 Vaughan Pratt共同发明。KMP算法的核心思想是当一次字符比较失败时,利用已经得到的部分匹配信息,将模式字符串向右滑动一段距离后继续比较,从而避免从头开始匹配,提高匹配效率。

二、KMP算法原理

  1. 前缀和后缀
    KMP算法中,我们关心模式字符串的前缀和后缀。对于模式字符串P,长度为m,我们定义P的前缀为P[0…i](0 <= i < m),后缀为P[j…m-1](0 <= j < m)。如果前缀和后缀相等,我们称这个前缀和后缀为P的一个border。
  2. 部分匹配表(Partial Match Table,PMT)
    KMP算法通过计算模式字符串的一个特殊数组——部分匹配表(PMT),来存储每个位置之前(包括当前位置)的字符串的最长border长度。这个数组也被称为next数组。PMT的计算过程如下:
    (1)初始化PMT数组,令PMT[0] = -1,PMT[1] = 0。
    (2)遍历模式字符串P,对于每个位置i(1 < i < m),找到P[0…i-1]的最长border长度,记为k。如果P[k] == P[i],则PMT[i] = k + 1;否则,继续寻找更短的border,直到找到或k = -1。
  3. KMP匹配过程
    KMP匹配过程如下:
    (1)初始化两个指针i和j,分别指向主字符串S和模式字符串P的起始位置。
    (2)遍历主字符串S,对于每个位置i,进行如下操作:
    a. 如果P[j] == S[i],则i和j分别指向下一个位置,继续比较。
    b. 如果P[j] != S[i],则利用PMT数组,将j移动到PMT[j]的位置,继续比较。
    c. 如果j移动到模式字符串的起始位置,则i指向下一个位置。
    (3)如果j指向模式字符串的末尾,说明匹配成功,返回匹配的起始位置;否则,匹配失败,返回-1。

请添加图片描述

三、C语言实现

#include <stdio.h>
#include <string.h>
#include <stdlib.h>// 计算部分匹配表(PMT)
void computePMT(char *P, int *PMT) {int m = strlen(P); // 模式串的长度PMT[0] = -1; // PMT数组的第一个元素设为-1PMT[1] = 0; // PMT数组的第二个元素设为0int k = 0; // 初始化k为0,用于PMT的计算// 计算PMT数组for (int i = 2; i < m; i++) {// 如果当前字符不匹配,并且k不为0,则回退k的位置while (k > 0 && P[k] != P[i - 1]) {k = PMT[k];}// 如果当前字符匹配,则k增加1if (P[k] == P[i - 1]) {k++;}PMT[i] = k;}
}// KMP搜索算法
int KMP(char *S, char *P) {int n = strlen(S); // 主串的长度int m = strlen(P); // 模式串的长度int *PMT = (int *)malloc(m * sizeof(int)); // 动态分配PMT数组的空间computePMT(P, PMT); // 计算PMT数组int i = 0, j = 0; // 初始化i和j,分别用于主串和模式串的索引// 遍历主串Swhile (i < n) {// 如果j为-1或当前字符匹配,则继续匹配下一个字符if (j == -1 || S[i] == P[j]) {i++;j++;} else {// 如果字符不匹配,则根据PMT数组回退j的位置j = PMT[j];}// 如果j等于模式串的长度,则找到了匹配if (j == m) {free(PMT); // 释放PMT数组的空间return i - j; // 返回匹配的起始索引}}free(PMT); // 释放PMT数组的空间return -1; // 如果没有找到匹配,则返回-1
}int main() {char S[] = "ababcabcafgghrfthrhrthrtjtyjcbab"; // 主串char P[] = "rhrthrtj"; // 模式串int index = KMP(S, P); // 使用KMP算法搜索模式串在主串中的位置// 输出结果if (index != -1) {printf("Pattern found at index %d\n", index);} else {printf("Pattern not found\n");}return 0;
}

运行结果:

在这里插入图片描述

四、总结

KMP算法是一种高效的字符串匹配算法,通过计算模式字符串的部分匹配表(PMT),在匹配过程中利用已匹配的信息,避免了不必要的重复比较,提高了匹配效率。本文通过C语言实现KMP算法,帮助读者更好地理解KMP算法的原理和实现过程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/828609.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue-project-tree vue3 树形结构展示组件

GitHub&#xff1a;vue-project-tree by one-ccs Gitee&#xff1a;vue-project-tree by one-ccs 遵循 MIT 开源协议 文章目录 vue-project-tree一、使用二、API1、属性2、事件3、方法4、插槽 vue-project-tree 使用 Vue3 TS 实现的树形结构展示组件&#xff0c;有拖拽、排序…

服务器数据恢复—StorNext文件系统下raid5阵列数据恢复案例

服务器数据恢复环境&#xff1a; 昆腾某型号存储&#xff0c;8个存放数据的存储柜1个存放元数据的存储柜。 元数据存储&#xff1a;8组RAID1阵列1组RAID10阵列4个全局热备硬盘。 数据存储&#xff1a;32组RAID5阵列&#xff0c;划分2个存储系统。 服务器故障&#xff1a; 数据…

【c++】weak_ptr和观察者模式

weak_ptr 的使用 #include <array> #include <memory>class A {// 类A的定义 };int main() {std

《QT实用小工具·四十一》无边框窗口

1、概述 源码放在文章末尾 该项目实现了无边框窗口效果&#xff0c;项目demo如下所示&#xff1a; 项目代码如下所示&#xff1a; #include "framelesswindow.h" #include <QGuiApplication> #include <QScreen>#ifdef Q_OS_WIN #include <window…

单例设计模式c++

什么是单例模式&#xff1f; 单例模式指在整个系统生命周期里&#xff0c;保证一个类只能产生一个实例&#xff0c;确保该类的唯一性。 单例模式分类 单例模式可以分为懒汉式和饿汉式&#xff0c;两者之间的区别在于创建实例的时间不同&#xff1a; 懒汉式&#xff1a;指系…

Mac 安装Nodejs

Nodejs介绍 简单的说 Node.js 就是运行在服务端的 JavaScript。 Node.js 是一个基于 Chrome JavaScript 运行时建立的一个平台。 Node.js 是一个事件驱动 I/O 服务端 JavaScript 环境&#xff0c;基于 Google 的 V8 引擎&#xff0c;V8 引擎执行 Javascript 的速度非常快&am…

带你走进不一样的策略模式

欢迎来到我的博客&#xff0c;代码的世界里&#xff0c;每一行都是一个故事 带你走进不一样的策略模式 前言策略模式简介概念解释 策略模式的结构策略模式优点项目实践之bean策略构思业务策略实现策略接口实现策略上下文业务实现 前言 在编程的世界里&#xff0c;每一次按键都…

刷代码随想录有感(46):平衡二叉树

这道题给我的教训&#xff1a;别轻视递归。 题干&#xff1a; 代码&#xff1a; int geiHeight(TreeNode* node){if(node NULL)return 0;int leftHeight getHeight(node -> left);if(leftHeight -1) return -1;int rightHeight getHeight(node -> right);if(rightH…

计算机网络基础认识

本篇文章是我在B站上看到关于计算机网络的介绍视频收到的启发。本篇文章的内容来自【网络】半小时看懂<计算机网络>_哔哩哔哩_bilibili 一、物理层 从常理来说&#xff0c;进行连个设备之间的通讯&#xff0c;首先最容易想到的就是使用一根线连接两个设备进行通讯。但是…

redolog、undolog和binlog日志文件详解

redolog、undolog和binlog日志文件详解 前言redolog设计目标记录内容写入策略 undolog设计目标记录内容写入策略 binlog设计目标记录内容写入策略 小结 前言 当谈论MySQL数据库的日志文件时&#xff0c;通常会涉及到三种主要类型&#xff1a;redo log&#xff08;重做日志&…

java8 LocalDateTime

LocalDateTime java8使用了LocalDateTime和DateTimeFormatter。比之前的Date和Carlendar有所改进。 DateTimeFormatter是线程安全的。DateTimeFormatter中很多属性使用了final修饰。 LocalDate: 只能设置仅含年月日的格式&#xff0c;表示没有时区的日期, LocalDate是不可变并…

ansible安装教程

一、启动系统前&#xff0c;加一块光驱&#xff0c;把安装镜像文件放到光驱中 二、配置Yum文件 [rootlocalhost ~]# cd /etc/yum.repos.d/ [rootlocalhost yum.repos.d]# rm -f * [rootlocalhost yum.repos.d]# vi cdrom.repo [BaseOS] nameBaseOS baseurlfile:///media/BaseO…

【MAC】删除自带的输入法

问题描述 平常使用mac办公&#xff0c;经常会非预期切换到自带的ABC输入法&#xff0c;令人很困惑。 解决方案&#xff1a; 1、下载PlistEdit Pro 链接&#xff1a;https://www.fatcatsoftware.com/plisteditpro/ 2、执行命令 sudo open ~/Library/Preferences/com.apple.…

GEE案例——美国夏威夷火灾森林面积损毁程度分析

简介 本次案例的主要目的是通过查看两期影像间的差异来识别火灾的影像范围,所以这里用到了高清的sentinel-2影像,同时应用到了sentinel-2的QA高质量的去云后的影像进行分析。 数据 Cloud Score+ S2_HARMONIZED V1 Cloud Score+ 是一种用于中高分辨率光学卫星图像的质量评…

手把手教会你做属于自己的网站《保姆级教程》

手把手教会你做属于自己的网站《保姆级教程》 前言开始教程特别说明下期内容预报 前言 什么是个人网站&#xff1f; 个人网站是指因特网上一块固定的面向全世界发布消息的地方&#xff0c;通常由域名&#xff08;也就是网站地址&#xff09;、程序和网站空间构成&#xff0c;并…

TCP协议的状态码详解

TCP状态码是用来表示TCP连接过程中不同阶段的一种标识。以下是一些常见的TCP状态&#xff1a; 1. CLOSED&#xff1a;初始状态&#xff0c;表示TCP连接是关闭的或未打开的。 2. LISTEN&#xff1a;表示服务器端的某个套接字&#xff08;SOCKET&#xff09;处于监听状态&#…

Linux 软件包工具rpmbuild

下载工具rpm-build yum search rpm-build yum install rpm-build.x86_64制作属于自己的RPM包 1.准备打包目录 ls rpmbuild/ BUILD BUILDROOT RPMS SOURCES SPECS SRPMS 2.放入软件包 cp /root/nginx-1.18.0.tar.gz rpmbuild/SOURCES/ 3.编辑spec文件 vim rpmbuild/SPECS/n…

数字信号处理(MATLAB入门例子)

&#xff08;代码主要来源于这本书&#xff09; 1.用MATLAB产生32个正弦波样本&#xff0c;A2&#xff0c;f1000Hz&#xff0c;以及fs8000Hz % % Example 2.1 Sinewave generator % This example generate 32 sine sample, % plot it and save in sine.dat file% For the boo…

Vue js闭包

JavaScript闭包详解 在JavaScript中&#xff0c;闭包是一个非常重要的概念&#xff0c;也是JavaScript区别于其他语言的一大特色。理解闭包不仅有助于提升我们的编程技能&#xff0c;还能让我们更好地利用JavaScript的特性和优势。本文将详细解析闭包的概念、原理、应用以及相…

【AI相关】《这就是ChatGPT》读书笔记

《这就是ChatGPT》 斯蒂芬沃尔弗拉姆 这本书用了两天就一口气读完了&#xff0c;通篇读完后&#xff0c;这本书主要是介绍了ChatGPT怎么能做到生成内容的一些背后的原理逻辑&#xff0c;总结一下这本书是ChatGPT通过大量的数据&#xff08;这些数据来自网络、书籍等等类似于数据…