时空权衡在模式匹配算法中的应用(JAVA)--Horspool算法(简化版BM算法)

模式匹配是数据结构中字符串的一种基本运算,给定一个子串,要求在某个字符串中找出与该子串相同的所有子串。假设P是给定的子串,T是待查找的字符串,要求从T中找出与P相同的所有子串,这个问题成为模式匹配问题。P称为模式,T称为文本

这篇文章介绍了蛮力法在字符串匹配问题中的应用(JAVA)--朴素模式匹配算法,没有基础的读者可以先参考这篇文章。

上述的蛮力法求解的思路为:从左到右比较模式和文本中的每一对相应的字符,一旦匹配失败,模式右移一格,进行下一轮尝试。这种方法的时间复杂度为O(nm),实在是不够高效。

也有一些高效的算法被实现,诸如KMP算法和BM算法,这些算法中大多采用了输入增强思想(即对模式进行预处理以得到一些信息,将信息存储到表中,以便在匹配时能够使用这些信息)。这里将介绍BM算法的一种简化版本Horspool算法。

Horspool算法每次从右往左对模式串和文本进行匹配,如果出现一对匹配失败,则将模式串按情况从左往右移动。这里注意匹配的方向和移动的方向是不一样的。而“按情况”这就是比朴素匹配要高明的地方。

朴素匹配的移动方式,一旦匹配失败,所有情况都只会右移一个重新匹配。


而对于Horspool算法来说,我们假定文本匹配窗口(指的是文本中当前与模式进行匹配的等长部分,下图方框中的内容)这里的情况有四种。

情况一:如果匹配串中不包含c(下图中就是字母S),那么需要将模式串str移动str.length个长度(如果移动的幅度小于str.lengh,那么模式中的其他元素还是会和c对齐,这是没有意义的操作过程),如下图:


情况二:如果模式串中包含c,但不是模式的最后一个字符(下图中就是字母B),需要将模式串str中最右边的c与文本中的c对齐(因为该算法的匹配方式是从右往左匹配,这样能使匹配窗口尽可能的满足)。


情况三:如果c刚好是模式中的最后一个字符,但在模式的其他m-1个字符中不包含c,移动情况类似于情况一


情况四:如果c刚好是模式中的最后一个字符,但在模式的前m-1个字符中也包含c,移动情况类似于情况二


但是,还有一个重要的问题就是,如果我们每次都要尝试检查模式中的每个字符,那该算法也就失去了意义,改进方法就是通过预处理来解决,我们要预先计算除每次移动的距离并存储在表中,以便查找使用。


Horspool算法思路:

1. 对给定的长度为m的模式和在模式及文本中用到的字母,按照上面的方法构造移动表t[ ]

2. 将模式与文本的开始处对齐

3. 当构成文本匹配窗口后(也就是至少要从开始处移动m长度之后),从模式的最后一个字符开始,比较模式与文本中的相应字符,如全部匹配成功,则终止;如果遇到不匹配的字符,按照t[ ]移动模式。

完整代码如下:

import java.util.HashMap;public class Main {public static final char[] CHAR_TABLE = { 'a', 'b', 'c', 'd', 'e', 'f','g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's','t', 'u', 'v', 'w', 'x', 'y', 'z', 'A', 'B', 'C', 'D', 'E', 'F','G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S','T', 'U', 'V', 'W', 'X', 'Y', 'Z', '0', '1', '2', '3', '4', '5','6', '7', '8', '9', '(', ')', '{', '}', '[', ']', '<', '>', ',','.', '_', '-', '+', '=', '~', '/', '?', ';', ':', '"', '|', '!','@', '#', '$', '%', '^', '&', '*' };public static HashMap<Character, Integer> ShiftTable(String p) {int m = p.length();HashMap<Character, Integer> table = new HashMap<Character, Integer>();for (int i = 0; i < CHAR_TABLE.length; i++)table.put(CHAR_TABLE[i], m);for (int i = 0; i < m - 1; i++)table.put(p.charAt(i), m - 1 - i);return table;}public static int HorspoolMatching(String p, String t) {HashMap<Character, Integer> table = ShiftTable(p);int m = p.length();int n = t.length();int i = m - 1; // 模式左右边的位置while (i <= n - 1) {int k = 0;while ((k <= m - 1) && p.charAt(m - 1 - k) == t.charAt(i - k)) {k++;}if (k == m)return i - (m - 1);elsei += table.get(t.charAt(i));}return -1;}public static void main(String[] argv) {String p="AECDE";String t="ZXYABPDEAECDE";System.out.println(HorspoolMatching(p, t));}}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/569739.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从wireshake分析http和https的通信过程

参考文章: Wireshark基本介绍和学习TCP三次握手【技术流】Wireshark对HTTPS数据的解密Wireshark/HTTPSJourney to HTTP/2以TCP/IP协议为例&#xff0c;如何通过wireshark抓包分析&#xff1f;TCP三次握手和四次挥手Https详解wireshark抓包演示前言 面试被问到有没有用过抓包工具…

Java对象的序列化和反序列化

原文&#xff1a;https://www.cnblogs.com/xdp-gacl/p/3777987.html 一、序列化和反序列化的概念 把对象转换为字节序列的过程称为对象的序列化。  把字节序列恢复为对象的过程称为对象的反序列化。 对象的序列化主要有两种用途&#xff1a; 1&#xff09; 把对象的字节序列永…

安装oracle 11g时,报启动服务出现错误,找不到OracleMTSRecoveryService的解决方法

1、打开注册表看看&#xff1a;HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services下&#xff0c;找到OracleMTSRecoveryService及OracleRemExecService&#xff0c;查看ImagePath对应路径。 2、修改ImagePath路径为xxxxxxx\dbhome_1\bin\xxxxxxxxx即可【修改为你本地真实路…

django系列5.1--ORM对数据库的操作

Django--—ORM数据库操作(图书管理系统基本实例) 一.基本知识 MVC模式&#xff08;Model–view–controller&#xff09;是软件工程中的一种软件架构模式&#xff0c;把软件系统分为三个基本部分&#xff1a;模型&#xff08;Model&#xff09;、视图&#xff08;View&#xff…

蓝桥杯第七届决赛JAVA真题----路径之谜

路径之谜小明冒充X星球的骑士&#xff0c;进入了一个奇怪的城堡。 城堡里边什么都没有&#xff0c;只有方形石头铺成的地面。 假设城堡地面是 n x n 个方格。【如图1.png】所示。按习俗&#xff0c;骑士要从西北角走到东南角。 可以横向或纵向移动&#xff0c;但不能斜着走&…

蓝桥杯第七届决赛JAVA真题----广场舞

广场舞LQ市的市民广场是一个多边形&#xff0c;广场上铺满了大理石的地板砖。 地板砖铺得方方正正&#xff0c;就像坐标轴纸一样。 以某四块砖相接的点为原点&#xff0c;地板砖的两条边为两个正方向&#xff0c;一块砖的边长为横纵坐标的单位长度&#xff0c;则所有横纵坐标都…

oracle的关键字

oracle使用管理员执行下面命令&#xff0c;就能获得oracle的关键字&#xff1a; select * from v$reserved_words order by keyword asc; 以下是oracle 11.2.0.1.0中执行的结果&#xff08;供参考&#xff09;&#xff1a; 转载于:https://www.cnblogs.com/zhaoqian49/p/104490…

poj1279

板子题&#xff0c;求多边形内核面积。 话说jls的板子返回的是边&#xff0c;然后我就在冥思苦想怎么根据割边求面积啊。。 然后发现自己果然是个傻逼&#xff0c;求一下交点存起来就好了。。。 //板子题到此为止了 1 #include <iostream>2 #include <cstdio>3 #in…

回溯法在解决八皇后问题中的应用

回溯法&#xff1a;有这样一类题目&#xff0c;它们要求在相对问题的输入规模按照指数速度增长&#xff08;或者更快&#xff09;的域中&#xff0c;找出一个具有指定特性的元素。例如&#xff1a;在图顶点的所有排列中求一个哈密顿回路&#xff0c;在背包问题的一个实例中求其…

python数据结构与算法之问题求解

懂得计算机的童鞋应该都知道&#xff0c;一条计算机程序由数据结构跟算法两大部分组成。所以&#xff0c;其实不管你使用哪种计算机语言编写程序&#xff0c;最终这两部分才是一个程序设计的核心。所以&#xff0c;一个不懂得数据结构与算法的程序员不是一个好工程师。因此&…

运用tp5上传图片,并生成缩略图

最近想做个相册&#xff0c;需要用到上传图像&#xff0c;并且考虑到性能问题&#xff0c;还要生成缩略图&#xff0c;就学习下。在网上看了很多大神写的文章&#xff0c;经过各种调试总算出来了&#xff0c;分享下。不好之处&#xff0c;多多指教 ​ ​ ps&#xff1a;运用tp5…

求解最长回文子串----Manacher 算法

最长回文子串问题&#xff1a;给定一个字符串&#xff0c;求它的最长回文子串长度。 如果一个字符串正着读和反着读是一样的&#xff0c;那么我们称之为回文串。例如&#xff1a;abba、aaaa、abvcba、123321等 暴力法&#xff1a;遍历字符串的所有子串&#xff0c;对每个字串进…

Peter's smokes -poj 2509

题意&#xff1a;彼得有n支雪茄&#xff0c;每k个烟头可以换一支新雪茄&#xff0c;问彼得最多可以吸多少支雪茄 &#xff1f; 当时自己做时&#xff0c;错在了直接在while循环开始前&#xff0c;便将雪茄的初始数量给加上了&#xff0c;然而应该是先处理后再加上最终剩余的雪茄…

模式匹配算法----KMP算法以及next数组的解法

KMP算法&#xff1a;求字符串匹配&#xff08;也叫模式匹配&#xff09;的算法&#xff0c;即给定一个字符串&#xff0c;求其某一子串在其中出现的位置。 普通模式匹配 例如&#xff1a;给定字符串为abcabaaabaabcac&#xff0c;求其子串abaabcac在其中出现的位置。 结果为…

Spring Boot使用layui的字体图标时无法正常显示 解决办法

在html文件使用字体图标并且预览时正常&#xff0c;但是启动工程后显示不正常&#xff0c;浏览器调试界面显示字体文件无法decode&#xff1a; Failed to decode downloaded font: xxxxx 如图所示&#xff1a; 显示结果&#xff1a; 原因&#xff1a;经过maven的filter&#xf…

蓝桥杯第七届国赛JAVA真题----机器人塔

机器人塔X星球的机器人表演拉拉队有两种服装&#xff0c;A和B。 他们这次表演的是搭机器人塔。 类似&#xff1a;队内的组塔规则是&#xff1a; A 只能站在 AA 或 BB 的肩上。B 只能站在 AB 或 BA 的肩上。你的任务是帮助拉拉队计算一下&#xff0c;在给定A与B的人数时&…

Python divmod() 函数

Python divmod() 函数 Python 内置函数 python divmod() 函数把除数和余数运算结果结合起来&#xff0c;返回一个包含商和余数的元组(a // b, a % b)。 在 python 2.3 版本之前不允许处理复数。 函数语法 divmod(a, b)参数说明&#xff1a; a: 数字b: 数字实例 >>>div…

蓝桥杯第六届省赛JAVA真题----垒骰子

垒骰子 赌圣atm晚年迷恋上了垒骰子&#xff0c;就是把骰子一个垒在另一个上边&#xff0c;不能歪歪扭扭&#xff0c;要垒成方柱体。 经过长期观察&#xff0c;atm 发现了稳定骰子的奥秘&#xff1a;有些数字的面贴着会互相排斥&#xff01; 我们先来规范一下骰子&#xff1a;1 …

并发队列、线程池、锁

1、CountDownLatch(计数器) CountDownLatch 类位于java.util.concurrent包下&#xff0c;利用它可以实现类似计数器的功能。比如有一个任务A&#xff0c;它要等待其他任务执行完毕之后才能执行&#xff0c;此时就可以利用CountDownLatch来实现这种功能了。CountDownLatch是…

蓝桥杯第七届省赛JAVA真题----剪邮票

剪邮票 如【图1.jpg】, 有12张连在一起的12生肖的邮票。 现在你要从中剪下5张来&#xff0c;要求必须是连着的。 &#xff08;仅仅连接一个角不算相连&#xff09; 比如&#xff0c;【图2.jpg】&#xff0c;【图3.jpg】中&#xff0c;粉红色所示部分就是合格的剪取。 请你…