数据结构:Trie(前缀树/字典树)

文章目录

  • 一、介绍Trie
    • 1.1、Trie的结点结构
    • 1.2、Trie的整体结构
  • 二、Trie的操作
    • 2.1、Trie插入操作
    • 2.2、Trie查找操作
    • 2.3、Trie前缀匹配操作
    • 2.4、Trie删除操作
  • 三、实战
    • 3.1、实现Trie(前缀树)

一、介绍Trie

  Trie 又称字典树、前缀树和单词查找树,如果关键词是数字序列,则称数字查找树,是一颗非典型的多叉树模型,即每个结点的分支数量可能为多个。Trie这个名字取自“retrieval”,检索,读音和 try 相同。
  百度百科:Trie

1.1、Trie的结点结构

Trie的结点结构是这样的:

strcut TrieNode{bool isEnd;//该结点是否是一个串的结束。TrieNode * next[26];//字母映射表,结点个数跟一个串中包含的字符种树有关TrieNode(){//默认为空isEnd=false;//默认不是一个串的结束for(auto & i:next) i=nullptr;}
};

  需要注意的是,一个节点即使标记为某个串的结束(isEnd=true),也可以是其他更长串的前缀。这意味着,该节点可以有子节点,它们代表着以当前串为前缀的其他串。这个特性使得Trie成为一种极其有效的数据结构,用于处理具有共同前缀的字符串集合。

1.2、Trie的整体结构

在这个结点结构下,包含三个单词 “sea”,“sells”,“she” 的 Trie 会长啥样呢?
在这里插入图片描述
为了方便理解我们可以画成这样(也是实际树结构):
在这里插入图片描述
  根据整体结构,我们可以理解Trie实际上用边表示字符,每次选择一个子节点就可以选定一个字符,如果某结点对应位置为空,则说明Trie不包含 从根到该结点的边连接成的串加上该位置对应的字符 构成的 前缀。

二、Trie的操作

首先创建根结点,初始时根结点为空。

TrieNode * root=new TrieNode();

2.1、Trie插入操作

向字典树Trie中插入一个单词word,它保证使用了已有字典树的最长单词前缀:

  1. 初始化:从Trie的根节点开始。
  2. 遍历单词中的每个字符:对于单词 word 中的每个字符 c:
    • 检查当前节点是否存在字符 c 对应的子节点。
    • 如果存在,移动到该子节点,继续查找下一个字符。
    • 如果不存在,查找则创建该子节点,并移动到该子节点。
  3. 检查单词完全匹配:在成功遍历单词 word 中的所有字符后,将最后一个节点标记isEnd=true
void insert(string word){TrieNode * node=root;for(char c:word){if(node->next[c-'a']==nullptr){node->next[c-'a']=new TrieNode();}node=node->next[c-'a'];}node->isEnd=true;//串的结束只跟插入时的串有关。return;
}

2.2、Trie查找操作

判断字典树Trie中是否包含单词word:

  1. 初始化:从Trie的根节点开始。
  2. 遍历单词中的每个字符:对于单词 word 中的每个字符 c:
    • 检查当前节点是否存在字符 c 对应的子节点。
    • 如果存在,移动到该子节点,继续查找下一个字符。
    • 如果不存在,查找失败,返回 false(表示Trie中不存在单词 word)。
  3. 检查单词完全匹配:在成功遍历单词 word 中的所有字符后,需要检查当前节点是否标记为某个单词的结尾。
    • 如果当前节点标记为单词的结尾,则查找成功,返回 true。
    • 如果当前节点未标记为单词的结尾,则意味着Trie中没有完全匹配的单词,返回 false。
bool search(string word){TrieNode * node=root;for(char c:word){if(node->next[c-'a']==nullptr)return false;node=node->next[c-'a'];}return node->isEnd;//if(node->isEnd) return true;
}

2.3、Trie前缀匹配操作

判断字典树Trie中是否有以prefix为前缀的单词,由于Trie是通过插入结点生成的,因此只要一颗Trie能遍历完所有prefix中的字符,那么它必然是含有以prefix为前缀的单词的。它的实现和search操作类似:

  1. 初始化:从Trie的根节点开始。
  2. 遍历单词中的每个字符:对于单词 prefix 中的每个字符 c:
    • 检查当前节点是否存在字符 c 对应的子节点。
    • 如果存在,移动到该子节点,继续查找下一个字符。
    • 如果不存在,查找失败,返回 false。
  3. 检查单词完全匹配:在成功遍历单词 prefix 中的所有字符后,即所有字符均匹配,因此存在这样的前缀,返回true。
bool startsWith(string prefix){TrieNode * node=root;for(char c:prefix){if(node->next[c-'a']==nullptr)return false;node=node->next[c-'a'];}return true;
}

2.4、Trie删除操作

从Trie中删除一个串word时,我们应当从根结点把该路径上的结点依次删除,直至某结点的儿子不为空 或者 为根结点时,则不再删除。如果采用删除操作可以在树结点中记录儿子个数,这样可以快速判断是否还有儿子。可以通过在Trie结构中加入char ch,表示当前结点的字符应当是什么,可以快速找到儿子位置。这里采用整个文章的结构,所以不记录。

  1. 初始化节点数组:为了存储删除路径上的每个节点,函数首先创建了一个指针数组 path,大小为待删除字符串 str 的长度。
  2. 遍历Trie以找到字符串:函数遍历Trie以寻找与 str 匹配的字符串,同时在 path 数组中记录遍历过程中访问的每个节点。
  3. 检查并删除字符串
    • 如果未找到完全匹配的字符串(即在Trie中不存在该字符串),函数返回 false。
      找到后,标记其isEnd=true。从字符串的末尾开始向上回溯,检查每个节点是否有其他子节点。
    • 如果有其他子节点或该节点为根,说明当前节点是其他字符串的前缀,函数结束,返回 true。
    • 如果没有其他子节点,并且isEnd==true,则函数结束,返回true。
    • 如果没有其他子节点,并且isEnd!=true,删除当前节点,并将其父节点中对应的指针设置为 nullptr。
bool delete(string word){vector<TrieNode *> path;TrieNode * node=root;path.push_back(node);for(auto &c:word){if(node->next[c-'a']==nullptr)return false;node=node->next[c-'a'];path.push_back(node);}if(path.back()->isEnd==false) return false;path.back()->isEnd=false;//可能非叶子结点,不能直接删除,先标记为不是串的结尾bool flag=true;while(flag&&path.size()>1){//回溯向上,判断是否删除结点if(path.back()->isEnd) break;//如果是串的结尾 那么也不能再删除了TrieNode * child=path.back();for(auto &i=child->next){//查看其是否有儿子,可以通过为每一个Trie结点维护一个儿子数量,来快速判断。if(i!=nullptr) {flag=false;break;}//不可删除}if(flag){//没儿子path.pop_back();TrieNode * fa=path.back();for(auto & i=fa->next)//找到儿子,并删除,可以通过在Trie结构中加入char ch,表示当前结点的字符应当是什么,可以快速找到儿子位置。if(i==child) {delete child;i=nullptr;break;}//删了之后break;不break会访问野指针。~}}return true;
}

这里需要注意指针 和 指针指向的内容 的区别:

  • i==child:指的是i和child的值相同,指针类型 相当于i和child指向的地址相同。
  • delete child:指的是回收child指向的内容。
  • i=nullptr:i是引用,实际上是修改i引用的fa->next[x]=nullptr。

三、实战

3.1、实现Trie(前缀树)

题目链接:LeetCode:208.实现Trie(前缀树)

class Trie {
public:Trie() {isEnd=false;for(auto &i:next) i=nullptr;}void insert(string word) {Trie * node=this;//this指针表示被插入的字典树的根结点。for(char c:word){if(node->next[c-'a']==nullptr)node->next[c-'a']=new Trie();node=node->next[c-'a'];}node->isEnd=true;return;}bool search(string word) {Trie * node=this;for(char c:word){if(node->next[c-'a']==nullptr)  return false;node=node->next[c-'a'];}return node->isEnd;}bool startsWith(string prefix) {Trie * node=this;for(char c:prefix){if(node->next[c-'a']==nullptr)  return false;node=node->next[c-'a'];}return true;}
private:bool isEnd;Trie * next[26];
};
/*使用样例:始终对root进行插入、查找、前缀匹配查找操作
Trie * root=new Trie;
root->insert(val);
root->insert(val2);
root->insert(val3);
if(root->search(val4)) cout<<true<<endl;
if(root->startsWith(val4)) cout<<true<<endl;
*/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/781730.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++11 shared_from_this学习

最近学习网络变成发现一些C源码库中封装对象时会公有继承enable_shared_from_this&#xff1b; 用一个案例进行说明&#xff0c;案例代码如下&#xff1a; #include <iostream> #include <memory> #include <stdio.h>using namespace std;class C : public…

RPC(Remote Procedure Call)远程过程调用

定义 RPC&#xff08;Remote Procedure Call&#xff09;即远程过程调用&#xff0c;是一种计算机通信协议&#xff0c;它允许程序在不同的计算机之间进行通信和交互&#xff0c;就像本地调用一样。 为什么需要 RPC&#xff1f; 回到 RPC 的概念&#xff0c;RPC 允许一个程序…

快速上手Spring Cloud 十七:深入浅出的学习之旅

快速上手Spring Cloud 一&#xff1a;Spring Cloud 简介 快速上手Spring Cloud 二&#xff1a;核心组件解析 快速上手Spring Cloud 三&#xff1a;API网关深入探索与实战应用 快速上手Spring Cloud 四&#xff1a;微服务治理与安全 快速上手Spring Cloud 五&#xff1a;Spring …

2000-2021年各省人口密度数据(原始数据+结果)

2000-2021年各省人口密度数据&#xff08;原始数据结果&#xff09; 1、时间&#xff1a;2000-2021年 2、指标&#xff1a;年末常住人口、行政区划面积、人口密度 3、来源&#xff1a;国家统计局、统计年鉴 4、范围&#xff1a;31省 5、计算说明&#xff1a;人口密度年末常…

基于重写ribbon负载实现灰度发布

项目结构如下 代码如下&#xff1a; pom&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocat…

Python 妙用运算符重载——玩出“点”花样来

目录 运算符重载 主角点类 魔法方法 __getitem__ __setitem__ __iter__ __next__ __len__ __neg__ __pos__ __abs__ __bool__ __call__ 重载运算符 比较运算符 相等 不等 ! 大于和小于 >、< 大于等于和小于等于 >、< 位运算符 位与 & 位…

git最常用的命令与快捷操作说明

git最常用的命令与快捷操作说明 最常用的git三条命令1、git add .2、git commit -m "推送注释"3、git push origin 远程分支名:本地分支名 其他常用命令本地创建仓库分支删除本地指定分支切换本地分支合并本地分支拉取远程仓库指定分支代码过来合并推送代码到远程分支…

Android客户端自动化UI自动化airtest从0到1搭建macos+脚本设计demo演示+全网最全最详细保姆级有步骤有图

iOS客户端自动化UI自动化airtest从0到1搭建macosdemo演示-CSDN博客 一、基础环境 1. 安装jdk 选择jdk8 如果下载高版本 可能不匹配会失败 下载.dmg文件 苹果电脑 &#xff5c; macOS &#xff5c; jdk1.8 &#xff5c; 环境变量配置_jdk1.8 mac-CSDN博客 Java Downloads …

【面试题】数据底层原理:Elasticsearch写入流程解析

前言&#xff1a;本篇博客将介绍Elasticsearch的数据底层原理&#xff0c;涉及数据写入的过程以及相关概念。我们将深入探讨buffer、translog、refresh、commit、flush和merge等核心概念&#xff0c;帮助您更好地理解Elasticsearch的数据存储机制。 写入数据的基本过程 Elast…

vue 内嵌第三方网页

需要将另一个系统嵌套到当前网页中 一、frame 方法一就是通过html的标签 iframe 实现网页中嵌入其他网站 标签属性 属性含义src嵌套的网页地址width设置嵌套网页的宽度&#xff0c;单位为像素height设置嵌套网页的高度&#xff0c;单位为像素frameborder控制嵌套的网页是否…

<QT基础(2)>QScrollArea使用笔记

项目需要设置单个检查的序列图像预览窗口&#xff0c;采用QScrollArea中加入QWidget窗口&#xff0c;每个窗口里面用Qlabel实现图像预览。 过程涉及两部分内容 引入QWidget 引入label插入图像&#xff08;resize&#xff09; 引入布局 组织 scrollArea内部自带Qwidget&#…

[项目实践]---RSTP生成树

[项目实践] 目录 [项目实践] 一、项目环境 二、项目规划 三、项目实施 四、项目测试 |验证 ---RSTP生成树 一、项目环境 Jan16 公司为提高网络的可靠性&#xff0c;使用了两台高性能交换机作为核心交换机&#xff0c;接入层交 换机与核心层交换机互联&#xff0c;形成冗…

MATLAB 统计滤波(去除点云噪声)(55)

MATLAB 统计滤波法(去除点云噪声)(55) 一、算法介绍二、算法实现1.原理2.代码一、算法介绍 点云统计滤波,是一种常用的去噪点方法,原始的点云数据中包含多种噪点,无法直接使用,往往需要通过一些方法去除噪点,而统计滤波在这方面的使用非常广泛常见,下面是去噪点后的…

P21:public class和class的区别

在一个Java源文件中&#xff0c;可以定义多个class 每个class类会生成对应的xxx.class字节码文件 在Java源文件中&#xff0c;public class不是必须的 当Java源文件中有public class类时&#xff0c;public class类只能有一个&#xff0c;并且该源文件的名字必须与公开类名…

STM32CubeIDE基础学习-USART串口通信实验(中断方式)

STM32CubeIDE基础学习-USART串口通信实验&#xff08;中断方式&#xff09; 文章目录 STM32CubeIDE基础学习-USART串口通信实验&#xff08;中断方式&#xff09;前言第1章 硬件介绍第2章 工程配置2.1 工程外设配置部分2.2 生成工程代码部分 第3章 代码编写第4章 实验现象总结 …

vue3封装Element分页

配置当前页 配置每页条数 页面改变、每页条数改变都触发回调 封装分页 Pagination.vue <template><el-paginationbackgroundv-bind"$attrs":page-sizes"pageSizes"v-model:current-page"page"v-model:page-size"pageSize":t…

AP5199S LED平均电流型恒流驱动IC 0.01调光 景观舞台汽车灯驱动照明

说明 AP5199S 是一款外围电路简单的多功能平均电流型 LED 恒流驱动器&#xff0c;适用于宽电压范围的非隔离式大功率恒流 LED 驱动领域。芯片 PWM 端口支持超小占空比的 PWM 调光&#xff0c;可响应 60ns 脉宽。为客户提供解决方案&#xff0c;限度地发挥灯具优势&#xff0c;…

商品说明书的制作工具来啦,用这几个就够了!

商品说明书是用户了解产品特性、性能、使用方法的重要途径。一个明确、易懂的商品说明书&#xff0c;可以显著提升用户体验&#xff0c;进而提升产品的销量。但我们都知道&#xff0c;制作一份高质量的说明书并不容易&#xff0c;需要仔细设计、计划和撰写。幸运的是&#xff0…

rabbitMQ的基础操作与可视化界面

当你安装好RabbitMq时&#xff0c;可以 尝试一下&#xff0c;这些命令 启动rabbitMQ服务 #启动服务 systemctl start rabbitmq-server #查看服务状态 systemctl status rabbitmq-server #停止服务 systemctl stop rabbitmq-server #开机启动服务 systemctl enable rabbitmq-…

在Arduino IDE中使用文件夹组织源文件和头文件

在Arduino IDE中使用文件夹组织源文件和头文件 如果你是一名Arduino爱好者&#xff0c;你可能会发现随着项目的复杂度增加&#xff0c;代码的管理变得越来越困难。在Arduino IDE中&#xff0c;你可以通过使用文件夹来更好地组织你的源文件和头文件&#xff0c;使得代码更加清晰…