【董晓算法】竞赛常用知识之字符串2

前言:

本系列是学习了董晓老师所讲的知识点做的笔记

董晓算法的个人空间-董晓算法个人主页-哔哩哔哩视频 (bilibili.com)

 动态规划系列(还没学完)

【董晓算法】动态规划之线性DP问题-CSDN博客

【董晓算法】动态规划之背包DP问题(2024.5.11)-CSDN博客

【董晓算法】动态规划之背包DP与树形DP-CSDN博客

字符串系列

【董晓算法】竞赛常用知识之字符串1-CSDN博客

字典树

作用:

快速插入和查询字符串

插入

儿子数组 ch[p][j] 存储从节点 p沿着j这条边走到的子节点。
边为26个小写字母(a-z)对应的映射值0-25.
每个节点最多可以有26个分叉。例如,ch[0][2]=1,ch[1][0]=2.ch[2][19]=3。

计数数组 cnt[p]存储以节点 p结尾的单词的插入次数

节点编号 idx 用来给节点编号

 1.空 Trie 仅有一个根节点,编号为0。
枚举字符串的每个字符2,从根开始插,

如果有儿子,则p指针走到儿子.
如果没儿子,则 先创建儿子,p指针再走到儿子

3、在单词结束点记录插入次数。

char s[N];
int ch[N][26], cnt[N], idx;
void insert(char* s)
{int p = 0;for (int i = 0; s[i]; i++) {int j = s[i] - 'a';if (!ch[p][j]) ch[p][j] = ++idx;p = ch[p][j];}cnt[p]++;
}
int query(char* s) {int p = 0;for (int i = 0; s[i]; i++) {int j = s[i] - 'a';if (!ch[p][j]) return 0;p = ch[p][j];}return cnt[p];
}

查询和插入最主要的就是if (!ch[p][j]) 后不一样,和查询会返回值

最大异或对

任选两个进行异或运算,得到的结果最大是多少

思路:尽可能走相反位,结果最优(从根到叶的每一条路径都表示一个整数)

const int N = 100010;
int n, a[N];
int ch[N * 31][2], idx;//题目是2的23次void insert(int x) {int p = 0;for (int i = 30; i >= 0; i--) {int j = x >> i & 1; //取出第i位if (!ch[p][j])ch[p][j] = ++idx;p = ch[p][j];}
}
int query(int x) {int p = 0, res = 0;for (int i = 30; i >= 0; i--) {int j = x >> i & 1; //取出第i位if (ch[p][!j]) {res += 1 << i; //累加位权p = ch[p][!j];}else p = ch[p][j];}return res;
}
int main() {cin >> n;for (int i = 1; i <= n; i++)cin >> a[i], insert(a[i]);int ans = 0;for (int i = 1; i <= n; i++)ans = max(ans, query(a[i]));cout << ans;return 0;
}


int query(int x) {
    int p = 0, res = 0;
    for (int i = 30; i >= 0; i--) {
        int j = x >> i & 1; //取出第i位
        if (ch[p][!j]) {
            res += 1 << i; //累加位权
            p = ch[p][!j];
        }
        else p = ch[p][j];
    }
    return res;
}

AC自动机 

AC 自动机(简单版) - 洛谷 (luogu.com.cn)

AC自动机是多模式匹配算法。给定 n个模式串和一个主串,查找有多少个模式串在主串中出现过 

步骤

1.构造 Trie 树
先用n个模式串构造一颗Trie 。
Trie 中的一个节点表示一个从根到当前节点的字符串。
根节点表示空串,节点(5表示“s”,节点6表示“sh",节点7表示“she”。
如果节点是个模式串,则打个标记。例如,cnt[7]=1。
2.构造 AC自动机在 Trie 上构建两类边:回跳边和转移边

3.扫描主串匹配

回跳边指向父节点的回跳边所指节点的儿子,从一个节点指向其最长后缀匹配节点

转移边指向当前节点的回跳边所指节点的儿子,从一个节点指向其直接子节点的链接 

 

构树代码就是上面字典树的代码 

构造 AC自动机

void build() {//建AC自动机queue<int> q;for (int i = 0; i < 26; i++)if (ch[0][i])q.push(ch[0][i]);while (q.size()) {int u = q.front(); q.pop();for (int i = 0; i < 26; i++) {int v = ch[u][i];if (v)ne[v] = ch[ne[u]][i], q.push(v);else ch[u][i] = ch[ne[u]][i];}}
}

 查找单词出现次数

 扫描主串,依次取出字符 s[k].
1.i指针走主串对应的节点,沿着树边或转移边走保证不回退。
2.j指针沿着回跳边搜索模式串,每次从当前节点走到根节点,把当前节点中的所有后缀模式串一网打尽,保证不漏解。
3.扫描完主串,返回答案。

int query(char *s){int ans=0;for(int k=0,i=0;s[k];k++){i=ch[i][s[k]-'a'];for(int j=i;j&&~cnt[j];j=ne[j])//~cnt[i]检查cnt是不是-1ans+=cnt[j], cnt[j]=-1;}return ans;
}

KMP和AC自动机对比

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/837230.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用Rust打印杨辉三角

一、杨辉三角是什么&#xff1f; 杨辉三角是一个著名的数学图形&#xff0c;它展示了二项式系数的排列方式。 杨辉三角是一种将二项式系数以三角形阵列排列的数学图形&#xff0c;具有丰富的历史和数学意义。 杨辉三角的历史起源可以追溯到中国南宋时期&#xff0c;由数学家杨辉…

极端天气对气膜建筑有什么影响吗—轻空间

气膜建筑在近年来的发展迅速&#xff0c;逐渐替代了一部分传统建筑&#xff0c;展现了良好的市场前景。然而&#xff0c;面对自然环境中的极端天气&#xff0c;如暴风、暴雨和暴雪&#xff0c;气膜建筑是否能够经受住考验是大家关注的焦点。轻空间带您探讨一下这些极端天气对气…

springboot 开启缓存 @EnableCaching(使用redis)

添加依赖 pom.xml <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId> </dependency>application.yml 配置redis连参数 spring:# redis 配置redis:# 地址host: 127.0.0.…

649. Dota2 参议院

649. Dota2 参议院 题目链接&#xff1a;649. Dota2 参议院 代码如下&#xff1a; //贪心算法 class Solution { public:string predictPartyVictory(string senate) {bool Rtrue,Dtrue;// 当flag大于0时&#xff0c;R在D前出现&#xff0c;R可以消灭D。当flag小于0时&#…

JVM 加载 Class 文件的原理机制

Class 文件 Java中的Class文件是编译后的Java源代码文件&#xff0c;它包含了Java程序的字节码指令&#xff0c;也就是实际的执行代码。Class文件是Java程序的中间文件&#xff0c;可以被Java虚拟机&#xff08;JVM&#xff09;加载和执行。在编译Java源代码时&#xff0c;Java…

探究NVMe SSD HMB应用场景与影响-<续>

如果需要采用HMB功能&#xff0c;需要SSD支持NVME协议且NVMe 1.2及以上版本。NVME协议中对HMB对应有2个关键参数&#xff1a; HMB建议值&#xff08;HMPRE&#xff09;&#xff1a;设定实际分配给HMB使用的主机内存容量&#xff0c;为设备提供最优性能的内存分配量。 HMB最小值…

双星号(**)和单星号(*)在Python参数传递中的妙用

在Python中&#xff0c;参数传递是一个非常重要的概念&#xff0c;它允许函数接收任意数量的参数。而双星号(**)和单星号(*)在参数传递中扮演着关键角色。本文将详细讲解这两个符号的用法&#xff0c;并通过示例代码帮助初学者理解它们的工作原理。 单星号(*) 单星号(*)用于函…

EPS软件标注点坐标值

1、如下&#xff0c;点击右侧&#xff08;尺寸标注&#xff09;按钮&#xff1a; 2、弹出一个对话框&#xff0c;如下&#xff1a; 3、在上图对话框中设置好箭头样式和小数位数&#xff0c;然后点击图上一点&#xff0c;右击结束再鼠标指定位置&#xff0c;如下&#xff1a; 如…

CV每日论文--2024.5.10

1、Attention-Driven Training-Free Efficiency Enhancement of Diffusion Models 中文标题&#xff1a;扩散模型的注意力驱动的训练免费效率增强 简介&#xff1a;扩散模型在生成高质量和多样化图像方面取得了出色的表现,但其卓越性能是以昂贵的架构设计为代价的,特别是广泛使…

数据库——SQL SERVER(先学删库跑路)

目录 一&#xff1a;什么是数据库 二&#xff1a;为什么需要数据库 三&#xff1a;数据库的安装 四&#xff1a;学前必备知识 1. 数据库原理 2. 数据库与编程语言 3. 数据库与数据结构的区别 4. 连接 5. 有了编程语言为啥还要数据库 6. 初学者学习数据库的三个方面 …

mplab ide中使用c语言编程,PIC单片机的C语言使用——在MPLAB-IDE中使用HitechC编译器.doc...

mplab ide中使用c语言编程,PIC单片机的C语言使用——在MPLAB-IDE中使用HitechC编译器.doc...-CSDN博客

高校推免报名|基于SSM+vue的高校推免报名系统的设计与实现(源码+数据库+文档)

高校推免报名 目录 基于SSM&#xff0b;vue的高校推免报名的设计与实现 一、前言 二、系统设计 三、系统功能设计 1系统功能模块 2后台登录模块 5.2.1管理员功能模块 5.2.2考生功能模版 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八…

放大招:NLP-探索深度学习在自然语言处理中的应用:构建标题生成器

引言 在深度学习的领域中&#xff0c;自然语言处理&#xff08;NLP&#xff09;是一个令人兴奋且快速发展的分支。它使得机器能够理解、解释和生成人类语言。在本博客中&#xff0c;我们将通过构建一个简单的标题生成器来探索NLP的基础知识&#xff0c;了解如何使用深度学习模…

【学习笔记】人群归因分数 PAF 以及combined PAF(更新)

在此推荐2篇发表在lancet以及jama子刊上的paf文章&#xff0c;这两篇文章套路是一样的&#xff0c;只是在不同国家进行。 在计算combined PAF或者说weighted PAF的时候&#xff0c;先建立了相关矩阵&#xff0c;再做主成分分析&#xff0c;得到communality。详细信息大家可翻阅…

【Pytest官方文档翻译及学习】1.1 安装和入门

目录 1.1 安装和入门 1.1.1 安装pytest 1.1.2 创建第一个测试 1.1.3 运行多个测试 1.1.4 断言引发了某个异常 1.1.5 将多个测试分组在一个类中 1.1.6 请求功能测试的唯一临时目录 1.1.7 继续阅读 Pytest是一个成熟的全功能的Python测试框架&#xff0c;它可以满足大多数…

huffman编码【python】【算法】

哈夫曼编码(Huffman Coding)&#xff0c;又称霍夫曼编码&#xff0c;是一种编码方式&#xff0c;哈夫曼编码是可变字长编码(VLC)的一种。该方法完全依据字符出现概率来构造整体平均长度最短的码字&#xff0c;有时称之为最佳编码&#xff0c;一般就叫做Huffman编码&#xff08;…

MFC/QT利用COM组件接口从字体名称、粗体、斜体获取到字体文件路径的方法

MFC/QT利用COM组件接口从字体名称、粗体、斜体获取到字体文件路径的方法 这个是目前唯一能准确从字体名称加粗斜体三个属性定位到ttf/ttc字体路径的方法&#xff0c;其他的方式是没有办法区分后两个属性而且会出现不准确的问题 之前无意间在MSDN找到的资料&#xff1a; IDWr…

el-calendar自定义日程,显示文字内容,el-date-picker和el-calendar互动互联

Vue实现 el-calendar自定义日程,显示文字内容,el-date-picker和el-calendar互动互联 效果展示 首先el-calendar需要自定义日程内容的话,其格式一般必须满足如下结构 dataList = [{date: 2024-05-08, content: "数学模拟试卷(3)"},{date: 2024-05-08, content: …

【STM32 |程序实例】按键控制、光敏传感器控制蜂鸣器

目录 前言 按键控制LED 光敏传感器控制蜂鸣器 前言 上拉输入&#xff1a;若GPIO引脚配置为上拉输入模式&#xff0c;在默认情况下&#xff08;GPIO引脚无输入&#xff09;&#xff0c;读取的GPIO引脚数据为1&#xff0c;即高电平。 下拉输入&#xff1a;若GPIO引脚配置为下…

C语言(指针)6

Hi~&#xff01;这里是奋斗的小羊&#xff0c;很荣幸各位能阅读我的文章&#xff0c;诚请评论指点&#xff0c;关注收藏&#xff0c;欢迎欢迎~~ &#x1f4a5;个人主页&#xff1a;小羊在奋斗 &#x1f4a5;所属专栏&#xff1a;C语言 本系列文章为个人学习笔记&#x…