数据结构与算法之(赫夫曼树,哈夫曼树,压缩软件)

一:思考

        1.电报发送:二战的时候大家都知道那时候普遍会应用电报,如果让你来设计一个电报的发送编码你该如何设计呢?

        2.压缩算法:给你10000个字符(每个字符1btye,也就是8bit)的文件,你怎么存储可以尽可能的节省空间呢?

        我相信大家肯定能想到的一个思路就是用某个字符来代替(映射)。比如在压缩算法里面我们可以用二进制来代替 假设字符是 a b c d 4种 那我们假定 a=000 b=001 c=010 d=100,这样我们每个字符就变成了3bit的二进制,那么10000个字符就是30000bit,比起原来的80000bit是不是缩小了很多的存储空间?

        缩小了将近3倍。

        100000001:dab Abcdaaaaaaaaa:n*3个bit位

        A:0

        B:101

        C:110

        D:100

Abcdaaaaaaaaa:010111010000000000=>abcdaaaaaa Aaa,前缀。 但是这样做的话会有一个什么问题呢?是不是还有更优的方法呢?

        问题:是否会出现解码失败?如何判断是否是某个解码字符。

        解决:哈夫曼编码,也叫前缀编码 

  二:引入最优二叉树(二叉树的带权路径长度总和最小)

        满二叉树:除了叶子节点,其他的都有两个子节点,1 2 4 8这样的节点 2^n个点

        完全二叉树:除了最底层都有两个子节点,而且叶子节点是靠左连续的

        2.1 计算下面三颗二叉树的带权路径长度总和:

        其中每个点的权重为: a:7 b:5 c:2 d:4

        WPL(a):7*2+5*2+2*2+4*2=36()

        WPL(b):7*3+5*3+2*1+4*2=46()

        WPL(c):7*1+5*2+2*3+4*3=35()

        给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。 那么这个赫夫曼树和压缩又有什么关系呢?

        二叉树:二叉,这时候你要想到二进制,二叉分左右嘛。

        左节点的边设置为0,右节点的边设置为1

 三:如何实现?(贪心算法:最优解(就是排序))

        核心思想:贪心算法:利用局部最优推出全局最优,把频率出现多的用短码表示,频率出现小的就用长一点。而且,任何一个字符的编码都不是另一个的前缀,在解压缩的时候,我们每次会读取尽可能长的可解压的二进制串,所以在解压缩的时候也不会产生歧义。

        具体实现思路:

                1.每次取数值最小的两个节点,将之组成为一颗子树。

                2.移除原来的两个点

                3.然后将组成的子树放入原来的序列中

                4.重复执行1 2 3 直到只剩最后一个点

        例子: a:3 b:24 c:6 d:20 e:34 f:4 g:12 根据以上权重来实现哈夫曼树(代码实现)

        结点数据结构:

package tree.哈夫曼;public class HfmNode implements Comparable<HfmNode>{		//优先队列,小的我把你优先级调高String chars;		//节点里面的字符int fre;		//表示是频率,也是权重HfmNode left;HfmNode right;HfmNode parent;	//用来找上层的/*** 用于在优先队列中比较节点的权重。* @param o the object to be compared.* @return*/@Overridepublic int compareTo(HfmNode o) {return this.fre - o.fre;}}

        哈夫曼:(实现编码,解码,生成哈夫曼)

                这里使用了一个JDK的PriorityQueue,在 Java 中,该类是 Java 集合框架的一部分,用于创建优先级队列数据结构。优先级队列是一个专用队列,其中元素根据其优先级进行排序。具有最高优先级的元素始终位于队列的前面,并且是第一个要删除的元素。

package tree.哈夫曼;import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.PriorityQueue;public class HuffmenTree {HfmNode root;List<HfmNode> leafs; // 叶子节点Map<Character, Integer> weights; // 叶子节点的权重, a,b,c,d,epublic HuffmenTree(Map<Character, Integer> weights) {this.weights = weights;leafs = new ArrayList<HfmNode>();}public String decode(Map<Character, String> code, String encodedStr) { // 解码 不会给你们写的,留给课后作业StringBuilder decodedStr = new StringBuilder();HfmNode currentNode = root;for (int i = 0; i < encodedStr.length(); i++) {char c = encodedStr.charAt(i);if (c == '0') {currentNode = currentNode.left;} else if (c == '1') {currentNode = currentNode.right;}if (currentNode.left == null && currentNode.right == null) {decodedStr.append(currentNode.chars);currentNode = root;}}return decodedStr.toString();}public void encode() { // 解码 不会给你们写的,留给课后作业}// 叶子节点进行编码public Map<Character, String> code() {Map<Character, String> map = new HashMap<Character, String>();for (HfmNode node : leafs) {String code = "";Character c = new Character(node.chars.charAt(0)); // 叶子节点肯定只有一个字符HfmNode current = node; // 只有一个点do {if (current.parent != null && current == current.parent.left) { // 说明当前点是左边code = "0" + code;} else {code = "1" + code;}current = current.parent;} while (current.parent != null); // parent == null就表示到了根节点map.put(c, code);System.out.println(c + ":" + code);}return map;}public void creatTree() {Character keys[] = weights.keySet().toArray(new Character[0]); // 拿出所有的点PriorityQueue<HfmNode> priorityQueue = new PriorityQueue<HfmNode>(); // jdk底层的优先队列for (Character c : keys) {HfmNode hfmNode = new HfmNode();hfmNode.chars = c.toString();hfmNode.fre = weights.get(c); // 权重priorityQueue.add(hfmNode); // 首先把我们的优先队列初始化进去leafs.add(hfmNode);}int len = priorityQueue.size();for (int i = 1; i <= len - 1; i++) { // 每次找最小的两个点合并HfmNode n1 = priorityQueue.poll(); //HfmNode n2 = priorityQueue.poll(); // 每次取优先队列的前面两个 就一定是两个最小的HfmNode newNode = new HfmNode();newNode.chars = n1.chars + n2.chars; // 我们把值赋值一下,也可以不复制newNode.fre = n1.fre + n2.fre; // 把权重相加// 维护出树的结构newNode.left = n1;newNode.right = n2;n1.parent = newNode;n2.parent = newNode;priorityQueue.add(newNode);}root = priorityQueue.poll(); // 最后这个点就是我们的根节点System.out.println("构建完成");}public static void main(String[] args) {// a:3 b:24 c:6 d:20 e:34 f:4 g:12Map<Character, Integer> weights = new HashMap<Character, Integer>();//一般来说:动态的加密,最开始是不知道里面有什么内容的。我们需要一个密码本,往往就是某个字典。如果是英文就用英文字典,统计次数。//换密码本//静态的文件。针对性的做编码.图像加密,没有特性的。hash加密(MD5)weights.put('a', 3);weights.put('b', 24);weights.put('c', 6);weights.put('d', 1);weights.put('e', 34);weights.put('f', 4);weights.put('g', 12);HuffmenTree huffmenTree = new HuffmenTree(weights);huffmenTree.creatTree();Map<Character, String> code = huffmenTree.code();String str = "aceg";System.out.println("编码后的:");String decode = huffmenTree.decode(code,"00");System.out.println(decode);char s[] = str.toCharArray();}
/*a:10110
b:01
c:1010
d:00
e:11
f:10111
g:100* **/
}

        四:小结

        学完赫夫曼树,现在可以回到我们的思考题,这两个问题是不是就迎刃而解了。

        电报的设计:

                1.电报加密后越短越好,发送快。

                2.破解难

                3.解码容易

                4.换加密树也要快 、

                5.可逆的。 什么叫不可逆:MD5这样的Hash加密,简单的MD5已经破解了,穷举:很大的库。Md5(paswd)=-> 接口的密码加密 从前端传到后端我要加密这个密码,Hash函数的了。后面讲 ,数据传输的时候回来怎么办?

        所以我们现在的很多数字通信里面很多都采用了哈夫曼编码。 压缩我相信大家就更能理解了,只要你明白了哈夫曼编码这个压缩算法其实就很容易了,相信你也可以很快就能实现出来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/75457.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GitHub星标超70K,阿里大佬的架构总结“分布式全解”笔记霸榜

分布式架构与微服务平台是当今IT界的关键技术&#xff0c;也是资深软件工程师和系统架构师必须掌握的核心技术。 因此小编为各位粉丝朋友带来这份阿里大佬的分布式笔记&#xff1a;从传统分布式架构迁移到基于容器技术的微服务架构为主线&#xff0c;全面、透彻地介绍了与分布…

华为回击:制裁无法阻挡中国科技创新 | 百能云芯

华为最新推出的Mate 60 Pro手机引发了中国市场的抢购热潮&#xff0c;这一成功的举措为华为带来了信心。华为在这个背景下再度推出两款新机&#xff0c;其中包括高阶版的Mate 60 Pro和折叠式手机Mate X5。这两款手机在首批预购开始后迅速售罄&#xff0c;不仅取得了市场的热烈欢…

JavaScript基础

1 JavaScript概述 1.1 什么是JavaScript 1.1.1 概念 JavaScript 是脚本语言&#xff0c;是一种解释性脚本语言&#xff08;代码不进行预编译&#xff09; JavaScript 是一种轻量级的编程语言。 JavaScript 是可插入 HTML 页面的编程代码。 JavaScript 插入 HTML 页面后&a…

CANoe中的工作模式之争:由一段简单的代码引出的问题

1、引子 有网友问我一个CAPL中timer定时器的代码问题。他在CANoe工程中写了一段代码:每5秒循环触发一次定时器事件程序,输出一句文本信息到Write窗口。但是执行后发现并不是每5秒触发一次定时器事件程序,而是非常快的触发定时器事件程序。当他把这段代码复制到一个新的CANo…

【开发】安防监控/视频汇聚/云存储/AI智能视频融合平台页面新增地图模式

AI智能分析网关包含有20多种算法&#xff0c;包括人脸、人体、车辆、车牌、行为分析、烟火、入侵、聚集、安全帽、反光衣等等&#xff0c;可应用在安全生产、通用园区、智慧食安、智慧城管、智慧煤矿等场景中。将网关硬件结合我们的视频汇聚/安防监控/视频融合平台EasyCVR一起使…

2023-简单点-怎么知道树莓派是什么cpu架构?

树莓派是几位&#xff1f; getconf LONG_BIT https://qengineering.eu/install-ncnn-on-raspberry-pi-4.html

【C#】C#调用进程打开一个exe程序

文章目录 一、过程二、效果总结 一、过程 新建WinForm程序&#xff0c;并写入代码&#xff0c;明确要调用的程序的绝对路径&#xff08;或相对路径&#xff09;下的exe文件。 调用代码&#xff1a; 这里我调用的另一个程序的路径是&#xff1a; F:\WindowsFormsApplication2…

uni-app--》基于小程序开发的电商平台项目实战(一)

&#x1f3cd;️作者简介&#xff1a;大家好&#xff0c;我是亦世凡华、渴望知识储备自己的一名在校大学生 &#x1f6f5;个人主页&#xff1a;亦世凡华、 &#x1f6fa;系列专栏&#xff1a;uni-app &#x1f6b2;座右铭&#xff1a;人生亦可燃烧&#xff0c;亦可腐败&#xf…

ES6之 变量的解构赋值 ➕ 扩展运算符(…)

ES6之 变量的解构赋值 ➕ 扩展运算符 1. 变量的解构赋值1.1 直接解构赋值1.2 解构赋值——修改属性名1.3 连续解构赋值 2. 扩展运算符2.1 简介&#xff08;官网&#xff09;2.2 应用例子2.2.1 简单例子12.2.2 数组拷贝2.2.3 连接多个数组2.2.4 拷贝对象&#xff08;多层和多维数…

可以用Python实现RPC协议的接口自动化测试

基于RPC协议的接口自动化测试可以用Python语言实现。下面是实现步骤&#xff1a; 1、安装依赖库&#xff0c;如protobuf、grpc。 2、编写.proto文件定义接口参数和返回值。 3、使用protoc编译.proto文件生成Python代码。 4、编写客户端代码调用远程接口进行测试。 具体实现…

数据结构-堆的实现及应用(堆排序和TOP-K问题)

数据结构-堆的实现及应用[堆排序和TOP-K问题] 一.堆的基本知识点1.知识点 二.堆的实现1.堆的结构2.向上调整算法与堆的插入2.向下调整算法与堆的删除 三.整体代码四.利用回调函数避免对向上和向下调整算法的修改1.向上调整算法的修改2.向下调整算法的修改3.插入元素和删除元素函…

操作系统——复习笔记

主要是按照王道考研408的ppt进行复习。 概述 操作系统概览 操作系统&#xff08;Operating System&#xff0c; OS&#xff09;是指控制和管理整个计算机系统的硬件和软件资源&#xff0c;并合理地组织调度计算机的工作和资源的分配&#xff1b;以提供给用户和其他软件方便的…

Unity Shader 溶解效果

一、效果图 二、原理分析 实现原理就是在片元着色器中&#xff0c;对像素点进行丢弃不显示。借助美术做的噪点图(利用噪点图中rgb中r值来做计算)。比如噪点图r值从0-1。我们从小到大让r值逐渐丢弃&#xff0c;比如刚开始r < 0.1丢弃&#xff0c;然后t < 0.2丢弃...知道t…

OpenCV(二十二):均值滤波、方框滤波和高斯滤波

目录 1.均值滤波 2.方框滤波 3.高斯滤波 1.均值滤波 OpenCV中的均值滤波&#xff08;Mean Filter&#xff09;是一种简单的滤波技术&#xff0c;用于平滑图像并减少噪声。它的原理非常简单&#xff1a;对于每个像素&#xff0c;将其与其周围邻域内像素的平均值作为新的像素值…

数据库基础——数据库、数据表和SQL语句

数据库、数据表和SQL语句 数据库、数据表和SQL语句是什么&#xff1f;数据库安装数据库登录及退出创建、查看数据库及修改名字查看及修改数据库编码删除数据库使用或查看当前正在使用的数据库创建、查看数据表及修改名字查看及修改数据表编码查看及修改数据表结构增加约束删除约…

Postman接口测试流程

一、工具安装 ● 安装Postman有中文版和英文版&#xff0c;可以选择自己喜欢的版本即可。安装时重新选择一下安装路径&#xff08;也可以默认路径&#xff09;&#xff0c;一直下一步安装完成即可。&#xff08;本文档采用英文版本&#xff09;安装文件网盘路径链接&#xff1…

【分享】golang windows 运行报错 undefined: syscall.SIGUSR1

在跟着煎鱼大佬学习 Golang-gin的时候&#xff0c;"在优雅的重启服务篇" ,为了gin服务的热更新&#xff0c;采用了 endlessfresh的方案&#xff0c;安装endless后无法在windows本地调试,然后报错。 (优雅的重启服务-地鼠文档优雅的重启服务-我不怎么喜欢左写写&#…

蓝桥杯官网填空题(振兴中华)

题目描述 本题为填空题&#xff0c;只需要算出结果后&#xff0c;在代码中使用输出语句将所填结果输出即可。 小明参加了学校的趣味运动会&#xff0c;其中的一个项目是&#xff1a;跳格子。 地上画着一些格子&#xff0c;每个格子里写一个字&#xff0c;如下所示&#xff1…

dnmp运行时404报错

dnmp运行时404报错 问题截图&#xff1a; dnmp简介 M1芯片&#xff08;Arm CPU&#xff09; 环境中搭建PHPNGINXMYSQL的利器&#xff0c;docker容器管理当前使用的软件&#xff0c;可以简单安装软件和扩展。 localhost.conf 原始文件如下&#xff1a; server {listen 8…

海康NVR(Network Video Recorder)启用SSH过程摸索

文章目录 海康NVR具备的特点启用SSH模式优劣比较启用SSH模式的优势启用SSH模式的坏处 Hik NVR启用SSH功能1&#xff0c;Web登录NVR2&#xff0c;SSH登录NVR SSH shell模式特点SSH shell模式指令作用1&#xff0c;简要帮助“help”可以列出常用的shell指令部分可用shell指令输出…