字符串匹配之KMP---全力解析

PS:文章是转载的 下方的微信公号不是我的 是原作者的。附上原文链接:字符串匹配之KMP jeliy王的博客

近日,一同学面试被问到字符串匹配算法,结果由于他使用了暴力法,直接就跪了(现在想想这样的面试官真的是不合格的,陈皓的一篇文章说的很好,点击阅读)。字符串匹配方法大概有:BF(暴力破解法), 简化版的BM,KMP,BM,一般情况下,大家听说最多的应该就是KMP算法了。之前学习过,由于时间间隔比较大,记不太清楚了,今天上网查了下,发现写KMP的文章是不少,但是真正清晰简洁就没有了(july的文章太繁琐),所以自己就研究了一晚上,弄清楚了kmp的计算过程,也就在此分享下。

1. 如果你现在完全不知道KMP是个神马玩意,请先阅读 阮一峰 的《字符串匹配的KMP算法》。

KMP算法最难理解的是就是next数组的计算过程,在此分享下我所理解的kmp算法以及next数组的计算过程(如果看前面理论比较头大,可以先看后面例子的计算过程,在回过头来看理论就会释怀):
1. next数组的计算过程: 
申明:next数组下标从0算起, 定义next[0]=-1, next[1]=0; 模式串记为T[ ]
假如求 T中 j+1 位的next[j+1]:
将其 前一位(模式字符)的内容与其前一位的next值(next[j])的内容(T[next[j]])进行比较:
如果它们相等(T[j]==T[next[j]]),则next[j+1] = next[j]+1;
如果他们不相等,则继续向前寻找,直到找到next值对应的内容与前一位相等为止,则在这个next值上加一;
如果直到第一位都没有与之相等,则next[j+1] = 0;           
例: 有模式串 "abaababc"
j=0时,next[0] = -1 ; j=1时,next[1] = 0;
j=2时,t1!=t0, k=next[0]=-1, next[2]=0;
j=3时,t2==t0, next[3] = next[2]+1 = 1;
j=4时,k=next[3]=1, t3!=T[1], k=next[1]=0, T[3]==T[0], next[4]=next[1]+1 = 1;
j=5时,k=next[4]=1, T[4]==T[1], next[5]=next[4]+1=2;
j=6时,k=next[5]=2, T[5]==T[2], next[6]=next[5]+1=3;
j=7时,k=next[6]=3, T[6]!=T[3], k=next[3]=1, T[6]==T[1], next[7]=next[3]+1 = 2;

      
2. 上述算法的实现:
  1. //update 2014-04-19 10:08
  2. void calNext(const char *T, int *next){
  3. int n = strlen(T);
  4. if(n<=0) return ;
  5. next[0] = -1;
  6. next[1] = 0;
  7. int j=0, k=-1;
  8. while(j<n){
  9. if(k==-1 || T[j]==T[k]){
  10. ++j;
  11. ++k;
  12. next[j] = k;
  13. }
  14. else k = next[k];
  15. }
  16. }
3. KMP主算法:
设置比较起始下标: i=0, j=0;
循环直到 i+m>n 或者 T中所有字符都以比较完毕
a. 如果 S[i]==T[j], 则继续比较S和T的下一个字符; 否则
b. 将 j=next[j], 从这位置开始继续进行比较;
c. 如果j==-1, 则将 i 和 j 分别加1, 继续比较;
如果T中所有字符均比较完毕,则返回匹配的起始下标,否则返回-1;
4. KMP算法实现:
  1. //update 2014-04-19 10:08
  2. int kmpmatch(const char *S, const char *T){
  3. if(S==NULL || T==NULL) return -1;
  4. int n = strlen(S);
  5. int m = strlen(T);
  6. int next[m];
  7. calNext(T, next);
  8. int i=0, j=0;
  9. while(i+m<=n){
  10. for( ; j<m&&i<n&&S[i]==T[j]; ++i, ++j) ;
  11. if(j==m) return i-m;
  12. j = next[j];
  13. if(j==-1){
  14. ++i;
  15. ++j;
  16. }
  17. }
  18. return -1;
  19. }
举例: 设主串 S="ababcabcacbab", 模式 T="abcac"
按照上述方法计算得next[]={-1,0,0,0,1}


本篇文章主要关注next数组的计算及kmp主算法的实现。
要了解next数组是什么?
为什么要这么计算next数组?
参见下一篇文章(字符串匹配之KMP算法(续)---还原next数组 ).

如果你觉得本篇对你有收获,请帮顶。
另外,我本人开通了微信公众号--分享技术之美,我会不定期的分享一些我学习的东西.
你可以搜索公众号:swalge或者扫描下方二维码关注我

(转载文章请注明出处: http://blog.csdn.net/swagle/article/details/23969683 )


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/549380.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VS2005中,access对只读目录的属性判断不准确

只读目录&#xff0c;C:/>attrib A S H R testdirC:/>attrib testdirA SHR C:/testdir (1)VC6.0的执行结果&#xff1a;***********test stat***********************file [c:/testdir] exists!file [c:/testdir] is directory!file [c:/testdir] can be read!file …

两种方法求解逆序对

逆序对定义&#xff1a;对于一个包含N个非负整数的数组A[1..n]&#xff0c;如果有i < j&#xff0c;且A[ i ]>A[ j ]&#xff0c;则称(A[ i] ,A[ j] )为数组A中的一个逆序对。 常见的两种方法求解逆序对&#xff1a;1.穷举法&#xff08;暴力求解&#xff09;&#xff0c…

页面延时跳转

Response.Write("<script>window.setTimeout(\"window.locationtest.aspx\",5000);</script>");实现延时5秒后跳转

电脑老是提示虚拟内存不足的原因及解决办法

首先普及一下何为虚拟内存 以及 虚拟内存的定义 Windows操作系统用虚拟内存来动态管理运行时的交换文件。为了提供比实际物理内存还多的内存容量以供使用&#xff0c;windows操作系统占用了硬盘上的一部分空间作为虚拟内存。当CPU有需求时&#xff0c;首先会读取内存中的资料。…

用Dreamweaver实现ASP动态网站建设【8】

八、制作删除数据记录页 用上述学过的方法在Index.asp上创建“删除”连接。新建网页命名为delete.asp&#xff0c;并打开它&#xff0c;在其上创建一个七行二列的表格&#xff0c;并在左边的表格上填写相应的字段名&#xff0c;然后给网页绑定一个记录集&#xff0c;并对其字段…

你的输入安全吗?

看看这个录像你就知道了&#xff0c;http://www.vimeo.com/2007855?pgembed&sec2007855至少有四种以上的方法来获取键盘的输入&#xff0c;老外就是牛逼&#xff0c;通过信号监听和对信号的反编译&#xff0c;直接还原用户的输入&#xff0c;不过离真正的应用还有一段距离…

POJ 1804 Brainman (归并排序 -- 求逆序对数)

归并排序求逆序对数&#xff1a; 和归并排序一样&#xff0c;划分和递归求解都好理解&#xff0c;关键在于合并&#xff0c;对于右边的j &#xff0c;统计出左边比j 大 的元素个数 f(j)&#xff0c;所有的f(j)家和就是我们要的逆序对数&#xff01; 在归并排序中&#xff0c;…

Online Judge System

原文&#xff1a;http://hi.baidu.com/myalgorithm/blog/item/936031105bdb5958f819b880.htmlOnline Judge System起源與由來「 Association for Computing Machinery (ACM) 」是一個致力於電腦科學教育的協會&#xff0c;出版大量專業期刊、文獻&#xff0c;舉辦重大的計算機科…

大学计算机网络复习题

模拟试题 一、填空题 1、局域网中常用的拓扑结构主要有星型、 环形 、总线型三种。 2 、在当前的网络系统中&#xff0c;由于网络覆盖面积的大小、技术条件和工作环境不同&#xff0c;通常分为广域网、 局域网 、和城域网三种。 3、常用的通信介…

Windows系统常用技巧总结

1、卸载office2003的时候会出现卸载不了的现象&#xff0c;提示“OFFICE2003不支持卸载修补程序”&#xff0c;打补丁也打不上。 解决方法&#xff1a; 在注册表HKEY_LOCAL_MACHINE\SOFTWARE\Classes \Installer\Products\找到OFFICE2003的东西&#xff0c;删除后&#xff0c;才…

计算机网络复习题(全套)

1、网络协议主要要素为_________。 【答案】语法、语义、同步。 2、一座大楼内的一个计算机网络系统&#xff0c;属于________。 【答案】LAN。 3、随着电信和信息技术的发展&#xff0c;国际上出现了所谓“三网融合”的趋势&#xff0c;下列属于三网之一的是(ABC) A.传统…

XXX管理平台系统——会议管理

XXX管理平台系统会议管理 关于项目中的会议管理&#xff0c;其实并无定数可言&#xff0c;与个人的爱好、管理风格、沟通能力、团队组织、项目规模、甚至公司的 IT 管理风格息息相关。 在 H公司 工作的时候&#xff0c;我的 department manager 喜欢把所有的员工召集起来一起进…

为什么要使用信道复用技术?常用的信道复用技术有哪些?

时分复用&#xff0c;频分复用&#xff0c;码分复用&#xff0c;空分复用。 使用复用技术是为了区分用户&#xff0c;合理利用所有的频谱资源不浪费。

【讨论】从吉日的一段话说起+寻找WinForm架构的最佳实践

这两天园子里最火的莫过于吉日的白话反射&#xff0c;导致包子的批判&#xff0c;然后引来了老赵的两篇文章&#xff0c;然后又有若干人等一堆反射技术文章出世。可谓百花齐放&#xff0c;百家争鸣啊。喜欢这种氛围&#xff0c;呵呵。 今天我不谈反射&#xff0c;但和反射有关 …

C++猜单词游戏

游戏说明 运行须知&#xff1a; 请将压缩文件中的list.txt englishi.txt people.txt answer.txt放入D盘中的game文件夹中才能正常运行游戏&#xff0c;或者更改文件途径。 输入1可以登录用户&#xff0c;输入2可以游客试玩&#xff0c;用户登录可以查看单词本&#xff0c;里面…

JavaScript工具

在线 JavaScript格式美化工具 http://jsbeautifier.org/ 在线JS调试工具 http://jsbin.com/ 脚本兼容检查 http://www.thefrontside.net/crosscheck Komodo Edit http://www.activestate.com/komodo_edit/ Venkman Development http://www.hacksrus.com/~ginda/venkman/

Oracle分析函数一——函数列表

Oracle 分析函数 Oracle 分析函数——函数列表 SUM &#xff1a; 该函数计算组中表达式的累积和 MIN &#xff1a; 在一个组中的数据窗口中查找表达式的最小值 MAX &#xff1a; 在一个组中的数据窗口中查找表达式的最大值 AVG &#xff1a;…

这次,被游戏玩了

这次&#xff0c;我被游戏玩了 &#xff0c;我的一个朋友在玩台服的未来启示录&#xff0c;看那个场景有点像天堂。他的配置为Intel p43.0, gigabyte 915, DDR400512*2牌子忘记了&#xff0c;但也不错不是杂牌的, maxsun 9500GT TC512高清版&#xff0c;WD160G SATA。玩是…

用MATLAB实现神经网络

一 BP神经网络实现不使用MATLAB神经网络工具箱问题分析MATLAB实现代码运行结果绘制的图像 二 使用MATLAB的神经网络工具箱简易实现BP网络问题分析工具箱中的相关函数一些参考了MATLAB自带的英文手册mapminmax函数newff函数新版本关于nettrainParam的常用属性train函数sim函数 M…

Follow Me:CCIE RS--使用小凡模拟器搭建的CCIE拓扑图

我用小凡模拟器搭建了CCIE LAB 拓扑图有何不对的地方请指正转载于:https://blog.51cto.com/tanfo/216831