算法(6)KMP+trie

KMP:

最浅显易懂的 KMP 算法讲解_哔哩哔哩_bilibili

该视频使用python书写代码,不会python的小伙伴也可以看看了解kmp的大致思路。

问题描述:

kmp:字符串匹配算法,用来找一个长字符串中出现了几次小字符串,并找到小字符串开始的位置

1.暴力匹配:

#include<iostream>using namespace std;const int N=100010,M=1000010;int n,m;// n表示小字符串的长度,m表示长字符串的长度
char p[N],s[M];//p表示小字符串,s表示大字符串int main()
{cin>>n>>p;cin>>m>>s;for(int i=0;i<m;i++){int t=i;int flag=1;for(int j=0;j<n;j++){if(s[i++]!=p[j]){flag=0;break;}}if(flag) cout<<i-n<<' ';i=t;}return 0;
}

2.kmp基本思路:(视频01:41)

当发现某一个字符串不匹配时由于已经知道之前遍历过的字符,那么我们就利用这些信息来避免暴力算法中的“回退”步骤        =>        不希望 i 递减(i=t 操作)

3.kmp算法中next数组的功能(视频02:37)

在匹配失败时,会看最后一个与长字符串匹配的字符的数值:next [ j-1 ],比如next [ j-1 ]=2,则直接跳过子串的前2个字符        =>        2表示可以“跳过匹配”的字符个数

4.程序实现:


#include<iostream>using namespace std;const int N = 100010, M = 1000010;int n, m;//n为子长,m为母长
char p[N], s[M];//p为子串,s为母串
int ne[N];int main()
{cin >> n >> p + 1 >> m >> s + 1;//求next数组的过程//ne的第一的数为0,则i从2开始,i表示开始存哪个数的ne,j表示有多少个相同的字符,p[j+1]表示将和ne[i]匹配的字符for (int i = 2, j = 0; i <= n; i++){while (j && p[i] != p[j + 1]) j = ne[(j + 1) - 1];if (p[i] == p[j + 1]) j++;ne[i] = j;}//KMP匹配过程for (int i = 1, j = 0; i <= m; i++)//i遍历母串,j+1遍历子串,j表示要跳过几个字符{while (j && p[j + 1] != s[i]) j = ne[(j + 1) - 1];//j没有退回起点,且当前的s[ i ]不能和p[j+1]的位置匹配=》更新要跳过的字符if (p[j + 1] == s[i]) j++;//匹配,则检查下一个字符if (j == n)//匹配成功{printf("%d ", i - n);j = ne[j];}}return 0;
}

trie:

1.概念:

Trie树,又叫字典树前缀树(Prefix Tree)单词查找树键树,是一种多叉树结构。如下图:

一棵Trie树,表示了关键字集合{“a”, “to”, “tea”, “ted”, “ten”, “i”, “in”, “inn”} 。

作用:快速储存和查找字符串集合的数据结构

2.代码实现:

创建树,询问树

#include<iostream>using namespace std;const int N = 100010;int son[N][26];//每个子节点最多连26个字母
int cnt[N];//以当前字母为结点的单词有多少个
int idx;//当前用到了那个下标,下标是0的点,既是根节点,又是空节点(给整棵树的每个结点赋予一个全局唯一的编号)
char str[N];void insert(char str[])
{int p = 0;for (int i = 0; str[i]; i++){int u = str[i] - 'a';if (!son[p][u]) son[p][u] = ++idx;//头结点p的儿子中是否有26个字母中的u,没有就新建一个儿子,给他一个id(x)p = son[p][u];//更新根节点}cnt[p]++;//以该结点为结尾的字符串多了一个
}int query(char str[])
{int p = 0;for (int i = 0; str[i]; i++){int u = str[i] - 'a';if (!son[p][u]) return 0;p = son[p][u];}return cnt[p];
}int main()
{int n;cin >> n;while (n--){char op[2];cin >> op >> str;if (op[0] == 'I') insert(str);else cout << query(str) << endl;}return 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/774532.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

random模块篇

Python 的 random 模块是一个非常实用的工具&#xff0c;它提供了生成各种类型随机数的方法。无论是生成随机整数、浮点数&#xff0c;还是从序列中随机选择元素&#xff0c;random 模块都能满足你的需求。下面是一个详细的教程&#xff0c;介绍 random 模块的主要功能和用法。…

【生成对抗网络GAN】一篇文章讲透~

目录 引言 一、生成对抗网络的基本原理 1 初始化生成器和判别器 2 训练判别器 3 训练生成器 4 交替训练 5 评估和调整 二、生成对抗网络的应用领域 1 图像生成与编辑 2 语音合成与音频处理 3 文本生成与对话系统

【机器学习300问】54、如何找到有效的组合特征?

一、为什么需要去寻找有效的组合特征&#xff1f; 因为并不是所有的特征组合都会意义&#xff0c;都能带来价值。 例如在房价预测场景中&#xff0c;卧室数量和浴室数量的比值有意义&#xff0c;但房屋面积与建造年份相组合作为新的组合特征&#xff0c;可能就没有实际含义&…

【vivado】在原有工程上新建工程

一、前言 在工作中&#xff0c;我们经常需要接触到别人的工程&#xff0c;并在别人的工程上新加设计功能&#xff0c;此时我们需要以别人工程为基础新建工程。 二、在已有工程上新建工程的方法 2.1 vivado 页面file-project-save as... 该方法的优点为&#xff1a;可以直接…

【ORB-SLAM3】在 Ubuntu20.04 上编译 ORM-SLAM3 并使用 D435i、EuRoC 和 TUM-VI 运行测试

【ORB-SLAM3】在 Ubuntu20.04 上编译 ORM-SLAM3 并使用 D435i、EuRoC 和 TUM-VI 运行测试 1 Prerequisites1.1 C11 or C0x Compiler1.2 Pangolin1.3 OpenCV1.4 Eigen3 2 安装 Intel RealSense™ SDK 2.02.1 测试设备2.2 编译源码安装 (Recommend)2.3 预编译包安装 3 编译 ORB-S…

sql常用之CASE WHEN THEN

sql常用之CASE WHEN THEN SQL中的 CASE 类似编程语言里的 if-then-else 语句&#xff0c;用做逻辑判断。可以用于SELECT语句中&#xff0c;也可以用在WHERE&#xff0c;GROUP BY 和 ORDER BY 子句&#xff1b;可以单独使用&#xff0c;也可以和聚合函数结合使用。 语法&#…

PTA L2-037 包装机

一种自动包装机的结构如图 1 所示。首先机器中有 N 条轨道&#xff0c;放置了一些物品。轨道下面有一个筐。当某条轨道的按钮被按下时&#xff0c;活塞向左推动&#xff0c;将轨道尽头的一件物品推落筐中。当 0 号按钮被按下时&#xff0c;机械手将抓取筐顶部的一件物品&#x…

SSM 整合

文章目录 SSM 整合&#xff08;代码配置&#xff09;1. 基本形式2. 无 web.xml 的理论基础3. WebInitializer 替代 web.xml4. SpringWebConfig 替代 spring-web.xml5. 配置『静态资源不拦截』方案一方案二 6. 配置 URL 后缀生效/失效7. 整合 Service 层8. 整合 Dao 层9. Mybati…

07、Lua 流程控制

Lua 流程控制 Lua 流程控制控制结构语句 Lua 流程控制 Lua编程语言流程控制语句通过程序设定一个或多个条件语句来设定。在条件为 true 时执行指定程序代码&#xff0c;在条件为 false 时执行其他指定代码。 以下是典型的流程控制流程图&#xff1a; 控制结构的条件表达式结…

python面试题(1~10)

1、列表&#xff08;list&#xff09;和元组&#xff08;tuple&#xff09;有什么区别&#xff1f; ①列表是不可变的&#xff0c;创建后可以对其进行修改。元组是不可变的&#xff0c;元组一旦创建&#xff0c;就不能对其进行修改。 ②列表表示的顺序&#xff0c;它们是有序…

vscode c++环境配置

1.基础软件安装 安装Visual Studio Code. 安装C拓展。点击在vscode界面最左侧的Extensions图标&#xff08;打开快捷键&#xff1a;ctrlshiftX&#xff09;&#xff0c;搜索“C/C”&#xff0c;点击进行安装。 确保已安装gcc. 一般ubuntu系统会预装gcc.在终端窗口中输入如下…

查立得源码如何去除版权

最近发现很多人百度&#xff1a;查立得源码如何去除版权。 每个源代码/软件都是有版权的&#xff0c;无法去除&#xff0c;我们也得尊重知识产权/劳动成果。 可以去除/修改的是&#xff1a;页面显示的版权信息,查立得底部信息均可自定义(一般conn.php可修改)。 另&#xff1…

Linux-2 Linux的权限

目录 1.什么是权限&#xff1f; 2.权限的本质 3.Linux中的用户 普通用户与root用户相互转换 普通用户不变root&#xff0c;以root身份执行一个命令 LInux中的角色 4.Linux文件的权限 5.快速掌握修改权限的做法 修改权限 6.对比权限有无表现 对于普通用户&#xf…

五分钟,零基础也能入门 Python 图像文字识别

一. 前言 最近在研究 Python 的一些功能 &#xff0c; 也尝试了一些有趣实现&#xff0c; 这一篇就从实践的角度来研究一下 Python 如何实现图片识别。 众所周知 &#xff0c; Python 的库真的老多了&#xff0c;其中在图像识别上比较突出的就是 OpenCV. 那么基于这个库我们…

基于RAG的大模型知识库搭建

什么是RAG RAG(Retrieval Augmented Generation)&#xff0c;即检索增强生成技术。 RAG优势 部分解决了幻觉问题。由于我们可以控制检索内容的可靠性&#xff0c;也算是部分解决了幻觉问题。可以更实时。同理&#xff0c;可以控制输入给大模型上下文内容的时效性&#xff0c…

什么是高阶组件,有哪些场景?

高阶函数是接收一个或者多个函数作为入参,返回一个新的函数。 高阶组件,则是接收一个或者多个组价作为入参,并且返回一个组件。高阶组件的实现方式,本质上是一个装饰者设计模式。 最基本的高阶组件模版如下: import React form react;export default (WrappedComponent…

Day50:WEB攻防-PHP应用文件包含LFIRFI伪协议编码算法无文件利用黑白盒

目录 文件包含-原理&分类&利用&修复 文件读取 文件写入 代码执行 远程利用思路 黑盒利用-VULWEB 白盒利用-CTFSHOW-伪协议玩法 78-php&http协议 79-data&http协议 80-81-日志包含 87-php://filter/write&加密编码 88-data&base64协议 …

17、GateWay和Sentinel继承实现服务限流

注&#xff1a;本篇文章主要参考周阳老师讲解的cloud进行整理的&#xff01; 1、需求说明 cloudalibaba-sentinel-gateway9528 保护 cloudalibaba-provider-payment9001 2、启动nacos服务器8848 startup.cmd -m standalone 3、启动sentinel服务器8080 java -jar sentinel-dash…

Linux系列之统计某个字符串出现次数并排序

业务场景 最近遇到一个流量异常调用的接口&#xff0c;所以需要通过后台日志查看接口调用情况&#xff0c;先统计今天内接口的调用次数&#xff0c;再具体到对应的设备号&#xff0c;就知道哪台设备有问题了&#xff0c;初步想到wc和awk命令来筛选统计&#xff0c;但是真正去写…

企业微信变更主体公证怎么弄?

企业微信变更主体有什么作用&#xff1f;现在很多公司都用企业微信来加客户&#xff0c;有时候辛辛苦苦积累了很多客户&#xff0c;但是公司却因为各种各样的原因需要注销&#xff0c;那么就需要通过企业微信变更主体的方法&#xff0c;把企业微信绑定的公司更改为最新的。企业…