算法 - 符号表-下

img

😀前言
推荐从上看到下
算法 - 符号表-上

🏠个人主页:尘觉主页

文章目录

  • 算法 - 符号表
    • 查找树
      • 1. 插入操作
      • 2. 性质
    • 红黑树
      • 1. 左旋转
      • 2. 右旋转
      • 3. 颜色转换
      • 4. 插入
      • 5. 分析
    • 散列表
      • 1. 散列函数
      • 2. 拉链法
      • 3. 线性探测法
          • 3.1 查找
          • 3.2 插入
          • 3.3 删除
          • 3.5 调整数组大小
    • 小结
      • 1. 符号表算法比较
      • 2. Java 的符号表实现
      • 3. 稀疏向量乘法

算法 - 符号表

查找树

2-3 查找树引入了 2- 节点和 3- 节点,目的是为了让树平衡。一颗完美平衡的 2-3 查找树的所有空链接到根节点的距离应该是相同的。

image-20240404153723183

1. 插入操作

插入操作和 BST 的插入操作有很大区别,BST 的插入操作是先进行一a次未命中的查找,然后再将节点插入到对应的空链接上。但是 2-3 查找树如果也这么做的话,那么就会破坏了平衡性。它是将新节点插入到叶子节点上。

根据叶子节点的类型不同,有不同的处理方式:

  • 如果插入到 2- 节点上,那么直接将新节点和原来的节点组成 3- 节点即可。

image-20240404153844810

  • 如果是插入到 3- 节点上,就会产生一个临时 4- 节点时,需要将 4- 节点分裂成 3 个 2- 节点,并将中间的 2- 节点移到上层节点中。如果上移操作继续产生临时 4- 节点则一直进行分裂上移,直到不存在临时 4- 节点。

image-20240404155153885

2. 性质

2-3 查找树插入操作的变换都是局部的,除了相关的节点和链接之外不必修改或者检查树的其它部分,而这些局部变换不会影响树的全局有序性和平衡性。

2-3 查找树的查找和插入操作复杂度和插入顺序无关,在最坏的情况下查找和插入操作访问的节点必然不超过 logN 个,含有 10 亿个节点的 2-3 查找树最多只需要访问 30 个节点就能进行任意的查找和插入操作。

红黑树

红黑树是 2-3 查找树,但它不需要分别定义 2- 节点和 3- 节点,而是在普通的二叉查找树之上,为节点添加颜色。指向一个节点的链接颜色如果为红色,那么这个节点和上层节点表示的是一个 3- 节点,而黑色则是普通链接。

image-20240404155232485

红黑树具有以下性质:

  • 红链接都为左链接;
  • 完美黑色平衡,即任意空链接到根节点的路径上的黑链接数量相同。

画红黑树时可以将红链接画平。

image-20240404155325951

public class RedBlackBST<Key extends Comparable<Key>, Value> extends BST<Key, Value> {private static final boolean RED = true;private static final boolean BLACK = false;private boolean isRed(Node x) {if (x == null)return false;return x.color == RED;}
}

1. 左旋转

因为合法的红链接都为左链接,如果出现右链接为红链接,那么就需要进行左旋转操作。

image-20240404155344455

public Node rotateLeft(Node h) {Node x = h.right;h.right = x.left;x.left = h;x.color = h.color;h.color = RED;x.N = h.N;recalculateSize(h);return x;
}

2. 右旋转

进行右旋转是为了转换两个连续的左红链接,这会在之后的插入过程中探讨。

image-20240404155400885

public Node rotateRight(Node h) {Node x = h.left;h.left = x.right;x.right = h;x.color = h.color;h.color = RED;x.N = h.N;recalculateSize(h);return x;
}

3. 颜色转换

一个 4- 节点在红黑树中表现为一个节点的左右子节点都是红色的。分裂 4- 节点除了需要将子节点的颜色由红变黑之外,同时需要将父节点的颜色由黑变红,从 2-3 树的角度看就是将中间节点移到上层节点。

image-20240404155431732

void flipColors(Node h) {h.color = RED;h.left.color = BLACK;h.right.color = BLACK;
}

4. 插入

先将一个节点按二叉查找树的方法插入到正确位置,然后再进行如下颜色操作:

  • 如果右子节点是红色的而左子节点是黑色的,进行左旋转;
  • 如果左子节点是红色的,而且左子节点的左子节点也是红色的,进行右旋转;
  • 如果左右子节点均为红色的,进行颜色转换。

image-20240404155517106

@Override
public void put(Key key, Value value) {root = put(root, key, value);root.color = BLACK;
}private Node put(Node x, Key key, Value value) {if (x == null) {Node node = new Node(key, value, 1);node.color = RED;return node;}int cmp = key.compareTo(x.key);if (cmp == 0)x.val = value;else if (cmp < 0)x.left = put(x.left, key, value);elsex.right = put(x.right, key, value);if (isRed(x.right) && !isRed(x.left))x = rotateLeft(x);if (isRed(x.left) && isRed(x.left.left))x = rotateRight(x);if (isRed(x.left) && isRed(x.right))flipColors(x);recalculateSize(x);return x;
}

可以看到该插入操作和二叉查找树的插入操作类似,只是在最后加入了旋转和颜色变换操作即可。

根节点一定为黑色,因为根节点没有上层节点,也就没有上层节点的左链接指向根节点。flipColors() 有可能会使得根节点的颜色变为红色,每当根节点由红色变成黑色时树的黑链接高度加 1.

5. 分析

一颗大小为 N 的红黑树的高度不会超过 2logN。最坏的情况下是它所对应的 2-3 树,构成最左边的路径节点全部都是 3- 节点而其余都是 2- 节点。

红黑树大多数的操作所需要的时间都是对数级别的。

散列表

散列表类似于数组,可以把散列表的散列值看成数组的索引值。访问散列表和访问数组元素一样快速,它可以在常数时间内实现查找和插入操作。

由于无法通过散列值知道键的大小关系,因此散列表无法实现有序性操作。

1. 散列函数

对于一个大小为 M 的散列表,散列函数能够把任意键转换为 [0, M-1] 内的正整数,该正整数即为 hash 值。

散列表存在冲突,也就是两个不同的键可能有相同的 hash 值。

散列函数应该满足以下三个条件:

  • 一致性:相等的键应当有相等的 hash 值,两个键相等表示调用 equals() 返回的值相等。
  • 高效性:计算应当简便,有必要的话可以把 hash 值缓存起来,在调用 hash 函数时直接返回。
  • 均匀性:所有键的 hash 值应当均匀地分布到 [0, M-1] 之间,如果不能满足这个条件,有可能产生很多冲突,从而导致散列表的性能下降。

除留余数法可以将整数散列到 [0, M-1] 之间,例如一个正整数 k,计算 k%M 既可得到一个 [0, M-1] 之间的 hash 值。注意 M 最好是一个素数,否则无法利用键包含的所有信息。例如 M 为 10k,那么只能利用键的后 k 位。

对于其它数,可以将其转换成整数的形式,然后利用除留余数法。例如对于浮点数,可以将其的二进制形式转换成整数。

对于多部分组合的类型,每个部分都需要计算 hash 值,这些 hash 值都具有同等重要的地位。为了达到这个目的,可以将该类型看成 R 进制的整数,每个部分都具有不同的权值。

例如,字符串的散列函数实现如下:

int hash = 0;
for (int i = 0; i < s.length(); i++)hash = (R * hash + s.charAt(i)) % M;

再比如,拥有多个成员的自定义类的哈希函数如下:

int hash = (((day * R + month) % M) * R + year) % M;

R 通常取 31。

Java 中的 hashCode() 实现了哈希函数,但是默认使用对象的内存地址值。在使用 hashCode() 时,应当结合除留余数法来使用。因为内存地址是 32 位整数,我们只需要 31 位的非负整数,因此应当屏蔽符号位之后再使用除留余数法。

int hash = (x.hashCode() & 0x7fffffff) % M;

使用 Java 的 HashMap 等自带的哈希表实现时,只需要去实现 Key 类型的 hashCode() 函数即可。Java 规定 hashCode() 能够将键均匀分布于所有的 32 位整数,Java 中的 String、Integer 等对象的 hashCode() 都能实现这一点。以下展示了自定义类型如何实现 hashCode():

public class Transaction {private final String who;private final Date when;private final double amount;public Transaction(String who, Date when, double amount) {this.who = who;this.when = when;this.amount = amount;}public int hashCode() {int hash = 17;int R = 31;hash = R * hash + who.hashCode();hash = R * hash + when.hashCode();hash = R * hash + ((Double) amount).hashCode();return hash;}
}

2. 拉链法

拉链法使用链表来存储 hash 值相同的键,从而解决冲突。

查找需要分两步,首先查找 Key 所在的链表,然后在链表中顺序查找。

对于 N 个键,M 条链表 (N>M),如果哈希函数能够满足均匀性的条件,每条链表的大小趋向于 N/M,因此未命中的查找和插入操作所需要的比较次数为 ~N/M。

image-20240404155607671

3. 线性探测法

线性探测法使用空位来解决冲突,当冲突发生时,向前探测一个空位来存储冲突的键。

使用线性探测法,数组的大小 M 应当大于键的个数 N(M>N)。

0dbc4f7d-05c9-4aae-8065-7b7ea7e9709e

public class LinearProbingHashST<Key, Value> implements UnorderedST<Key, Value> {private int N = 0;private int M = 16;private Key[] keys;private Value[] values;public LinearProbingHashST() {init();}public LinearProbingHashST(int M) {this.M = M;init();}private void init() {keys = (Key[]) new Object[M];values = (Value[]) new Object[M];}private int hash(Key key) {return (key.hashCode() & 0x7fffffff) % M;}
}
3.1 查找
public Value get(Key key) {for (int i = hash(key); keys[i] != null; i = (i + 1) % M)if (keys[i].equals(key))return values[i];return null;
}
3.2 插入
public void put(Key key, Value value) {resize();putInternal(key, value);
}private void putInternal(Key key, Value value) {int i;for (i = hash(key); keys[i] != null; i = (i + 1) % M)if (keys[i].equals(key)) {values[i] = value;return;}keys[i] = key;values[i] = value;N++;
}
3.3 删除

删除操作应当将右侧所有相邻的键值对重新插入散列表中。

public void delete(Key key) {int i = hash(key);while (keys[i] != null && !key.equals(keys[i]))i = (i + 1) % M;// 不存在,直接返回if (keys[i] == null)return;keys[i] = null;values[i] = null;// 将之后相连的键值对重新插入i = (i + 1) % M;while (keys[i] != null) {Key keyToRedo = keys[i];Value valToRedo = values[i];keys[i] = null;values[i] = null;N--;putInternal(keyToRedo, valToRedo);i = (i + 1) % M;}N--;resize();
}
3.5 调整数组大小

线性探测法的成本取决于连续条目的长度,连续条目也叫聚簇。当聚簇很长时,在查找和插入时也需要进行很多次探测。例如下图中 2~4 位置就是一个聚簇。

image-20240404162019782

α = N/M,把 α 称为使用率。理论证明,当 α 小于 1/2 时探测的预计次数只在 1.5 到 2.5 之间。为了保证散列表的性能,应当调整数组的大小,使得 α 在 [1/4, 1/2] 之间。

private void resize() {if (N >= M / 2)resize(2 * M);else if (N <= M / 8)resize(M / 2);
}private void resize(int cap) {LinearProbingHashST<Key, Value> t = new LinearProbingHashST<Key, Value>(cap);for (int i = 0; i < M; i++)if (keys[i] != null)t.putInternal(keys[i], values[i]);keys = t.keys;values = t.values;M = t.M;
}

小结

1. 符号表算法比较

算法插入查找是否有序
链表实现的无序符号表NNyes
二分查找实现的有序符号表NlogNyes
二叉查找树logNlogNyes
2-3 查找树logNlogNyes
拉链法实现的散列表N/MN/Mno
线性探测法实现的散列表11no

应当优先考虑散列表,当需要有序性操作时使用红黑树。

2. Java 的符号表实现

  • java.util.TreeMap:红黑树
  • java.util.HashMap:拉链法的散列表

3. 稀疏向量乘法

当向量为稀疏向量时,可以使用符号表来存储向量中的非 0 索引和值,使得乘法运算只需要对那些非 0 元素进行即可。

public class SparseVector {private HashMap<Integer, Double> hashMap;public SparseVector(double[] vector) {hashMap = new HashMap<>();for (int i = 0; i < vector.length; i++)if (vector[i] != 0)hashMap.put(i, vector[i]);}public double get(int i) {return hashMap.getOrDefault(i, 0.0);}public double dot(SparseVector other) {double sum = 0;for (int i : hashMap.keySet())sum += this.get(i) * other.get(i);return sum;}
}

算法 - 符号表-上

😁热门专栏推荐
想学习vue的可以看看这个

java基础合集

数据库合集

redis合集

nginx合集

linux合集

手写机制

微服务组件

spring_尘觉

springMVC

mybits

等等等还有许多优秀的合集在主页等着大家的光顾感谢大家的支持

🤔欢迎大家加入我的社区 尘觉社区

文章到这里就结束了,如果有什么疑问的地方请指出,诸佬们一起来评论区一起讨论😁
希望能和诸佬们一起努力,今后我们一起观看感谢您的阅读🍻
如果帮助到您不妨3连支持一下,创造不易您们的支持是我的动力🤞

img

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/792000.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

外卖配送时间预测项目

注意&#xff1a;本文引用自专业人工智能社区Venus AI 更多AI知识请参考原站 &#xff08;[www.aideeplearning.cn]&#xff09; 项目背景 外卖服务的兴起: 随着互联网技术和移动应用的发展&#xff0c;外卖成为一种日益普及的餐饮服务方式。顾客通过餐厅、杂货店的网站或移…

查询SQL server数据库在后台执行过的语句

查询SQL server数据库在后台执行过的语句 SELECT TOP 30000total_worker_time/1000 AS [总消耗CPU 时间(ms)],execution_count [运行次数],qs.total_worker_time/qs.execution_count/1000 AS [平均消耗CPU 时间(ms)],last_execution_time AS [最后一次执行时间],min_worker_ti…

LInux脚本学习

1.注释 #单行注释 以 # 字符开头就是单行注释 当然第一行除外&#xff0c;比较特殊 2.多行注释 3.Shell文件的作用 Shell文件就是linux命令集 4.sh脚本的执行方式 bash xxx.sh 5.新建的文件会没有执行权限 #为文件赋予执行权限 chmod ux xxx.sh 6.编写规范 #!/bin/bash #…

2024.4.1 系统移植

TF-A移植 TF-A是基于 Arm 的可信固件 Trusted Firmware-A&#xff0c;简称 TF-A。它是一个开源软件&#xff0c;运行在一个硬件隔离的安全环境中并提供安全服务。 分析README文档 Compilation of TF-A (Trusted Firmware-A): > tf-a目录 1. Pre-requisite > 准备工作 …

paddlepaddle模型转换onnx指导文档

一、检查本机cuda版本 1、右键找到invdia控制面板 2、找到系统信息 3、点开“组件”选项卡&#xff0c; 可以看到cuda版本&#xff0c;我们这里是cuda11.7 cuda驱动版本为516.94 二、安装paddlepaddle环境 1、获取pip安装命令 &#xff0c;我们到paddlepaddle官网&#xff…

医院云HIS系统源码,二级医院、专科医院his系统源码,经扩展后能够应用于医联体/医共体

基于云计算技术的B/S架构的HIS系统&#xff0c;为医疗机构提供标准化的、信息化的、可共享的医疗信息管理系统&#xff0c;实现医患事务管理和临床诊疗管理等标准医疗管理信息系统的功能。 系统利用云计算平台的技术优势&#xff0c;建立统一的云HIS、云病历、云LIS&#xff0…

【OSTEP】并发:线程与多线程

" A flow of control within a process that consists of a PC, a register set and a stack space" 本章将介绍为单个运行进程提供的新抽象 —— 线程 (thread) 线程是 调度的一个基本单位&#xff08;basic unit of CPU scheduling&#xff09;一个单独的线程至…

MySQL 索引底层探索:为什么是B+树?

MySQL 索引底层探索&#xff1a;为什么是B树&#xff1f; 1. 由一个例子总结索引的特点2. 基于哈希表实现的哈希索引3. 高效的查找方式&#xff1a;二分查找4. 基于二分查找思想的二叉查找树5. 升级版的BST树&#xff1a;AVL 树6. 更加符合磁盘特征的B树7. 不断优化的B树&#…

rabbitMQ版本问题与下载

都到现在了&#xff0c;大家不会安装东西还是不看版本吧 云服务器买的是centos7&#xff0c;而erlang在24版本后不支持centos7了 所以需要找24版本以下的erlang&#xff0c;而不同erlang对应不同rabbitmq所以需要对应 下载erlang 说实话&#xff0c;自己安装&#xff0c;还是…

RIP协议(路由信息协议)

一、RIP协议概述 RIP协议&#xff08;Routing Information Protocol&#xff0c;路由信息协议&#xff09;是一种基于距离矢量的内部网关协议&#xff0c;即根据跳数来度量路由开销&#xff0c;进行路由选择。 相比于其它路由协议&#xff08;如OSPF、ISIS等&#xff09;&#…

C++ | string类学习 | string的常见接口使用方式

目录 为什么要学习string类&#xff1f; C语言中的字符串 OOP面向对象编程 两个面试题 标准库中的string类 string类了解 string类的文档介绍 总结 string类的常用接口说明 string类对象的常见构造 string类对象的容量操作 size()和length() clear() resize(size…

【JVM】关于JVM垃圾回收

文章目录 &#x1f334;死亡对象的判断算法&#x1f338;引用计数算法&#x1f338;可达性分析算法 &#x1f333;垃圾回收算法&#x1f338;标记-清除算法&#x1f338;复制算法&#x1f338;标记-整理算法&#x1f338;分代算法&#x1f338;哪些对象会进入新生代&#xff1f…

idea2023.2.1 java项目-web项目创建-servlet类得创建

如何创建Java项目 1.1 方式1&#xff1a; 1.2 方式&#xff1a; 1.3 方式 如何创建web项目 方式 ----- 推荐 如何创建servlet类 复制6 中得代码 给servlet 配置一个路径 启动tomcat 成功了

Netty进阶

三. Netty 进阶 1. 粘包与半包 1.1 粘包现象 服务端代码 public class HelloWorldServer {static final Logger log LoggerFactory.getLogger(HelloWorldServer.class);void start() {NioEventLoopGroup boss new NioEventLoopGroup(1);NioEventLoopGroup worker new Ni…

时序预测 | Python实现VMD-CNN-LSTM时间序列预测

时序预测 | Python实现VMD-CNN-LSTM时间序列预测 目录 时序预测 | Python实现VMD-CNN-LSTM时间序列预测预测效果基本介绍模型描述代码设计预测效果 基本介绍 VMD-CNN-LSTM 是一种混合深度学习模型,结合了变分模态分解(VMD)、卷积神经网络(CNN)和长短期记忆网络(LSTM)的…

C#,简单,精巧,实用的按类型删除指定文件的工具软件

点击下载本文软件&#xff08;积分&#xff09;&#xff1a; https://download.csdn.net/download/beijinghorn/89059141https://download.csdn.net/download/beijinghorn/89059141 下载审核通过之前&#xff0c;请从百度网盘下载&#xff08;无积分&#xff09;&#xff1a;…

7 X 24h智能安全运维再升级!Fortinet 全面集成全新 FortiGuard SOCaaS

数字化时代网络安全威胁层出不穷&#xff0c;网络犯罪分子的狡诈攻击手段不断翻新&#xff0c;传统安全防御手段亟需进化。更为棘手的是&#xff0c;网络安全专业人才的匮乏&#xff0c;让众多企业陷入安全运营的困境。为了有效应对这一挑战&#xff0c;Fortinet全新推出FortiG…

【Python如何使用requests+re库进行简单爬虫实例应用】

1、安装requests库 (1)直接winR输入cmd进入命令行界面&#xff0c;执行命令&#xff1a;pip install requests (2)再Pycharm中&#xff0c;’File’-’Settings’-’Python interpreter’-’’-搜索’requests’-’install package’下载&#xff0c;如下图所示 2、实例&…

UE4几个常用节点链接

UE4几个常用节点链接 2017-12-02 12:54 1. 流光材质(及uv平铺次数) 2. 跑九宫格 3.闪光3。1 粒子闪烁效果 4.图案重复5.平移扭曲 6.溶解 刀光的uv滚动图片源或采样节点属性里改成clamp无后期发光光晕anistropic 各向异性高光法线图 法线图叠加 blendangle orrectedNo…

ChatGPT 之百万富翁

原文&#xff1a;The ChatGPT Millionaire 译者&#xff1a;飞龙 协议&#xff1a;CC BY-NC-SA 4.0 介绍 当我写下这些文字时&#xff0c;ChatGPT 已经成为有史以来增长最快的技术平台 - 仅用 5 天就达到了一百万用户。相比之下&#xff0c;Netflix 用了 3 年&#xff0c;Twit…