nfa状态转换图正规式_0x02 从NFA到DFA

a03f2c76ec10a17a0def15f1cd209ed1.png

书接上文,上回说道NFA已经可以完全描述正则语言的全部内容。那么,我们在这一章探索一下一个比较复杂的正则表达式在用NFA做匹配的时候会有什么“不足“。

NFA匹配的"不足"

为了言之有物,不妨设要讨论的模式为d?(c(a|b)*)*(b|c+)

3ad18835b301abd090936af2bab89a20.png

图1-1

效率

从上图可以明确的看到存在大量的转换。这些转换在程序实现的时候就对应了大量的回溯入口,即决策点。那么很显然,这个时候一定存在大量的递归回溯调用,自然也就必然会需要

大量时间来执行。

转换冗余

究其原因,无非就是冗余状态太多了

冗余 ≠ 无用

这些看似冗余的转换实际上对分组捕获非常有用,因为在分组捕获时,这些回溯可以记录当前匹配的状态还有剩余输入信息等。但是,如果我们不用分组捕获,只是要求模式全称匹配,则这些转换就是冗余的,我们需要通过状态压缩来实现确定化以避免任何回溯。

状态压缩

从上可知,若要完成状态压缩,则必须消除这些ℇ转换。但是,如何完成这一算法呢?完成后的确定化的结果仍然自动机么?当然是,并且它有个与NFA对应的名字叫做DFA

DFA登场

DFA与NFA的区别

图1-1图1-2中可以明显的发现NFA和DFA在转换边上的差异,归纳为下表。

NFADFA
ℇ转换存在不存在
相同输入,不同转换存在不存在

ℇ转换

closure---克林闭包

消除ℇ转换

function cleenClosure(){//  BFSlet espilonSet = [state];let queue = [state];while(queue.length > 0){let q = queue.shift();for(const st of q.epsilonTransitions){if(espilonSet.findIndex(val => st.label === val.label) === -1){queue.push(st);espilonSet.push(st)if(st.isEnd) state.isEnd = st.isEnd}}}return espilonSet;
}

Subset-Construction(子集构造)

借助上文的消除ℇ转换函数,我们可以将能够通过ℇ转换到达的相连节点划分为新DFA的等价状态。

function toDFA(exp) {// 输入字符集let aplhabets = new Set();// 原始正则表达式for(const ch of exp){if(ch !== "(" && ch !== "." && ch !== "?" && ch !== ")" && ch !== "*" && ch !== "|") {aplhabets.add(ch)}}const transExp = insertExplicitConcatOperator(exp);// 经过后缀改写的正则表达式,后缀改写目的在于解决运算符的优先级确定const postfixExp = toPostfix(transExp);let nfa = toNFA(postfixExp);//1. 从初始状态开始,进行下一状态等价集合的构造let q0 = createDFAState(false);q0.nfaStateSet = epsilonCleen(nfa.start);q0.isEnd = nfa.start.isEnd;//2. 存储新发现等价状态的工作集let workLst = new Array();//3. 存储已经生成等价状态的集合let dfaStates = [q0];workLst.push(q0);//4. 不停增加和删除等价状态,知道workLst变为空集while(workLst.length > 0){let q = workLst.shift();for(const ch of aplhabets) {// 4.1 计算delta并合并进入新状态t = epsilonCleenDelta(q,ch);if(t != null) {if(!dfaStatesHas(dfaStates,t)){dfaStates.push(t);workLst.push(t);q.transitions[ch] = t} else {let node = dfaStatesFind(dfaStates,t);node.isEnd = t.isEnd;q.transitions[ch] = node;}}}}return q0;
}

5fff17e8c13aae46b55d79c2d207de8d.png

图1-2

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/552087.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java filter教程_Java Web Filter 过滤器学习教程(推荐)

一、Filter简介Filter也称之为过滤器,它是Servlet技术中最激动人心的技术,WEB开发人员通过Filter技术,对web服务器管理的所有web资源:例如Jsp, Servlet, 静态图片文件或静态 html 文件等进行拦截,从而实现一些特殊的功…

python解密_Python解密

我目前正在从事一项家庭作业,我们必须构建一个函数,在其中编写一个三步加密/解密程序.我们必须构建的密码之一是变位/轨道围栏,该围栏接受变量(n)作为要加密消息的“轨道”数.我已经建立了加密,但是我m失去了解密方法.这是针对python的入门级类,因此我们对下面的加密代码等基础…

vue修改计算属性的值_「Vue学习记录五」计算属性和侦听器

1&#xff1a; 计算属性&#xff1a; &#xff08;内置缓存机制&#xff09;当更改age的时候&#xff0c; fullName 函数不执行&#xff1b;当更改fristName的时候&#xff0c; fullName 函数才执行<div id "app"><span>{{fullName}}</span> <…

python把485读回来的转为位_我能用Python读取从计算机上接收到的Modbus RS485数据吗?...

modbus-tk可以编写自己的modbus从站。在下面是一个运行RTU服务器的示例&#xff0c;该服务器有100个保持寄存器&#xff0c;从地址0开始&#xff1a;import sysimport modbus_tkimport modbus_tk.defines as cstfrom modbus_tk import modbus_rtuimport serialPORT 0#PORT /d…

git为私有仓库设置密码_真香!在局域网下行云流水般使用git

最近公司要开发一个新的项目&#xff0c;开发一个新的项目就要有一个好的代码版本管理工具。对于代码开发版本控制工具&#xff0c;我们之前是使用svn这个代码版本控制工具&#xff0c;但是项目经理说统一使用git开发版本控制工具&#xff0c;来到这里我们一般会选择gitee或者g…

xss img onerror java_java后台防止XSS的脚本攻击

import java.util.regex.Pattern;//具体过滤关键字符public class XSSUtil {private static Pattern[] patterns new Pattern[]{// Script fragmentsPattern.compile("", Pattern.CASE_INSENSITIVE),// src...Pattern.compile("src[\r\n]*[\r\n]*\\\(.*?)\\\&…

网口监视报文工具_真是神器!这款网络排查工具!

常用的 ping&#xff0c;tracert&#xff0c;nslookup 一般用来判断主机的网络连通性&#xff0c;其实 Linux 下有一个更好用的网络联通性判断工具&#xff0c;它可以结合ping nslookup tracert 来判断网络的相关特性&#xff0c;这个命令就是 mtr。mtr 全称 my traceroute&…

snmp服务 2003 镜像_美国掌握全球70%根服务器,一旦对中国关闭,我们将无法上网?...

“如果在上网和男朋友(女朋友)之间只能选一个&#xff0c;你会选哪个&#xff1f;”曾经有媒体在街头做这样的调查&#xff0c;出人意料的是很多人都选择了“上网”&#xff1b;因为在现代年轻人看来&#xff0c;如果进入一个没有“不能上网”的生活实在太恐怖了&#xff0c;那…

java写入carbondata_Carbondata使用过程中遇到的几个问题及解决办法

本文总结了几个本人在使用 Carbondata 的时候遇到的几个问题及其解决办法。这里使用的环境是&#xff1a;Spark 2.1.0、Carbondata 1.2.0。必须指定 HDFS nameservices在初始化 CarbonSession 的时候&#xff0c;如果不指定 HDFS nameservices&#xff0c;在数据导入是没啥问题…

商品审核网页界面_Shopee新手指南:Shopee卖家中心用户界面介绍

1.Shopee各站点前台网页链接&#xff1a;2.Shopee各站点后台网页链接3.Shopee APP下载&#xff1a;安卓版下载链接&#xff1a;https://pan.baidu.com/s/1eSp8M1k#list/path%2Fios版&#xff1a;可在App Store中直接搜索下载使用。台湾站点ios版本请搜索关键字“虾皮”下载&…

pdf exe如何提取pdf文件_python应用:如何用python提取pdf文件中的文字

从pdf中提取文字&#xff0c;相信很多人都干过这事&#xff0c;怎么在python中实现呢&#xff0c;今天带大家看看。第一步导入库import PyPDF2第二步导入pdf文件pdf_file open(dataset/laban.1027.pdf, rb)第三步读取pdf并检查加密情况read_pdf PyPDF2.PdfFileReader(pdf_file…

python asyncio tcp server_asyncio异步IO——Streams详解

前言本文翻译自python3.7官方文档——asyncio-stream,译者马鸣谦,邮箱 1612557569qq.com。转载请注明出处。数据流(Streams)数据流(Streams)是用于处理网络连接的高阶异步/等待就绪(async/await-ready)原语,可以在不使用回调和底层传输协议的情况下发送和接收数据。以下是一个用…

java轻量分布式框架_5个强大的Java分布式缓存框架推荐

在开发中大型Java软件项目时&#xff0c;很多Java架构师都会遇到数据库读写瓶颈&#xff0c;如果你在系统架构时并没有将缓存策略考虑进去&#xff0c;或者并没有选择更优的 缓存策略&#xff0c;那么到时候重构起来将会是一个噩梦。本文主要是分享了5个常用的Java分布式缓存框…

python三次样条插值拟合的树行线_数学建模笔记——插值拟合模型(一)

啊好像距离上次写作又过了七天&#xff0c;啊好像我之前计划的一周两三篇&#xff0c;啊辣鸡小说毁我青春&#xff0c;啊我是一只可怜的鸽子。不管怎样&#xff0c;我又回来了&#xff0c;并坚定地更新着hhh。再过两三天就是我们学校数学建模选拔&#xff0c;再过八九天就是期末…

python内置函数open的解释_在python的内置open()函数中缓冲的用途是什么?

Python文档&#xff1a;http&#xff1a;/ / / 2 /图书馆/ functions.html docs.python.org #开放open(name[, mode[, buffering]])上面的文档应该提醒说"可选参数文件缓冲的缓冲所需的缓冲区大小&#xff1a;0均值&#xff0c;均值线1具有积极的价值&#xff0c;任何其他…

keep行走和计步_‎App Store 上的“Keep - 跑步健身计步瑜伽”

【Keep - App Store 年度精选 App】【App Store 官方推荐的移动健身工具】在「Keep」&#xff0c;和2亿运动爱好者共同开启健康生活&#xff01;跟随你的移动健身教练&#xff0c;随时随地练就完美身材。健身中经常遇到的问题&#xff1a;- 工作太忙没有时间去健身房&#xff0…

密度图的密度估计_不同类型的二维密度图小教程

R相关小教程链接&#xff1a;用R构建气泡图案例小教程【小教程】散点图、饼图怎么在我的文章中完美展示小教程热图在论文发表中完美呈现小教程R与密度、函数、变量的微妙关系北京市计算中心医用数据库建设解决方案更多内容&#xff0c;请关注“生信会议”公众号Different types…

python 输出纯音频_Python如何录制系统音频(扬声器的输出)?

我从上周就开始找这个了。我也尝试过pyaudio&#xff0c;当我使用它的另一个fork时&#xff0c;系统音频和麦克风音频混合在一起。我找不到任何其他模块来解决这个问题&#xff0c;因此我最终提出了这个问题。在编辑&#xff1a;import pyaudioimport waveCHUNK 1024FORMAT p…

python 读取xml获取包含指定标签的数据_用Python元素提取XML的特定行

我有点困在我正在做的一个项目上&#xff0c;它使用Python——我对它非常陌生。我被告知使用ElementTree并从传入的XML文件中获取指定的数据。听起来很简单&#xff0c;但我不擅长编程。非常低(a&#xff01;)一个传入文件的小例子以及我试图使用的代码。在我想知道下一步该怎么…

Nginx/Tomcat/SpringBoot配置自生成SSL证书

1.配置自生成证书&#xff08;方式一&#xff0c;无需密码&#xff09; 1.1.生成证书 1.下载 nginx windows 版本并解压&#xff0c;这里不过多描述 2.下载 OpenSSL windows 版本并安装&#xff0c;用于生成证书 3.添加 C:\OpenSSL-Win64,C:\nginx-1.16.1 到环境变量 PATH …