数据结构—哈夫曼树及其应用

5.6哈夫曼树及其应用

5.6.1哈夫曼树的基本概念

路径:从树中一个结点到另一个结点之间的分支构成这两个结点间的路径。

结点的路径长度:两结点间路径上的分支数

树的路径长度:从树根到每一个结点的路径长度之和。记作 TL

结点数目相同的二叉树中,完全二叉树是路径长度最短的二叉树

权(weight):将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。

结点的带权路径长度:从结点到该结点之间的路径长度与该结点的乘积

树的带权路径长度:树中所有叶子结点的带权路径长度之和

哈夫曼树 - 知乎

哈夫曼树最优树 带权路径长度(WPL)最短的树

注意:“带权路径长度最短”是在“度相同”的树中比较而得的结果,因此有最优二叉树、最优三叉树之称等等。

哈夫曼树最优二叉树 带权路径长度(WPL)最短的二叉树

因为构造这种树的算法是由哈夫曼教授于1952年提出的,所以被称为哈夫曼树,相应的算法称为哈夫曼算法。

哈夫曼树的特点:

满二叉树不一定是哈夫曼树

哈夫曼树中权越大的叶子离根越近

具有相同带权结点的哈夫曼树不唯一

5.6.2哈夫曼树的构造算法

数据结构与算法 - 哈夫曼树 - 极客分享

哈夫曼树中权越大的叶子离根越近

贪心算法:构造哈夫曼树时首先选择权值小的。

哈夫曼算法(构造哈夫曼树的方法)

  1. 根据 n 个给定的权值{W1,W2,…,Wn}构成 n 棵二叉树的森林F={T1,T2,…,Tn},其中Ti只有一个带权为Wi的根结点。
    • 构造森林全是根
  2. 在F中选取两棵根结点的权值最小的树作为左右子树,构造一棵新的二叉树,且设置新的二叉树的根结点的权值为其左右子树上根结点的权值之和。
    • 选用两小造新树
  3. 在F中删除这两棵树,同时将新得到的二叉树加入森林中。
    • 删除两小添新人
  4. 重复(2)和(3),直到森林中只有一棵树为止,这棵树即为哈夫曼树。
    • 重复2、3剩单根

哈夫曼树 深入剖析 - 知乎

哈夫曼树的结点的度数为0或2,没有度为1的结点。

包含 n 个叶子结点的哈夫曼树中共有 2n-1 个结点。

包含 n 棵树的森林要经过 n-1 次合并才能形成哈夫曼树,共产生 n-1 个新结点。

img

总结:

  1. 在哈夫曼算法中,初始时有 n 棵二叉树,要经过 n-1 次合并最终形成哈夫曼树。
  2. 经过 n-1 次合并产生 n-1 个新结点,且这 n-1 个新结点都是具有两个孩子的分支结点。
  3. 哈夫曼树中共有 n+n-1=2n-1 个结点,且其所有的分支结点的度均不为1。

5.6.3哈夫曼树构造算法的实现

采用顺序存储结构——一维结构数组

结点类型定义:

typedef struct{int weight;int parent,lch,rch;
}HTNode,*HuffmanTree;

哈夫曼树的构造(二),哈夫曼树,构造

哈夫曼树及哈夫曼编码_fireflylane的博客-CSDN博客_不等长哈夫曼编码是什么意思

  1. 初始化HT[1…2n-1]:lch = rch = parent = 0;

  2. 输入初始 n 个叶子结点:置HT[1…n]的weight值;

  3. 进行一下n-1次合并,依次产生n-1个结点HT[i],i=n+1…2n-1:

    a)在HT[1…i-1]中选两个未被选中(从parent==0的结点中选)的weight最小的两个结点HT[s1]和HT[s2],s1,s2为两个最小结点下标;

    b)修改HT[s1]和HT[s2]的parent值:HT[s1].parent=i;HT[s2].parent=i;

    c)修改新产生的HT[i]:

    • HT[i].weight=HT[s1].weight + HT[s2].weight;
    • HT[i].lch=s1;HT[i].rch=s2
void CreatHuffmanTree (HuffmanTree HT,int n){if(n<=1)return;m=2*n-1;//数组共有2n-1个元素HT=new HTNode[m+1];//0号单元未用,HT[m]表示根结点for(i=0;i<=m;++i){//将2n-1个元素的lch,rch,parent置为0HT[i].lch=0;HT[i].rch=0;HT[i].parent=0;}for(i=1;i<=n;++i)//输入前n个元素的weightcin>>HT[i].weight;for(i=n+1;i<=m;i++){Select(HT,i-1;s1,s2);//在HT[k]中选择两个其双亲域为0,且权值最小的结点,并返回他们在HT中的序号s1和s2HT[s1].parent=i;//表示从F中删除s1,s2HT[s2].parent=i;HT[i].lch=s1;HT[i].rch=s2;HT[i].weigth=HT[s1].weigth+HT[s2].weigth;}
}

5.6.4哈夫曼编码

在远程通讯中,要将待传字符转换成由二进制表示的字符串:

学习笔记--霍夫曼树与霍夫曼编码解码_余生相_的博客-CSDN博客_霍夫曼解码

若将编码设计为长度不等的二进制编码,即让待传字符串中出现次数较多的字符采用尽可能短的编码,则转换的二进制字符串便可能减少。

关键:要设计长度不等的编码,则必须使任一字符的编码都不是另一个字符的编码的前缀。——这种编码称做前缀编码。

问题:什么样的前缀码能使得电文总长最短?——哈夫曼编码

  1. 统计字符集中每个字符在电文中出现的平均概率(概率越大,要求编码越短)。
  2. 利用哈夫曼树的特点:权越大的叶子离根越近;将每个字符的概率值作为权值,构造哈夫曼树。则概率越大的结点,路径越短。
  3. 在哈夫曼树的每个分支上标上0或1:
    • 结点的左分支标0,右分支标1
    • 把从根到每个叶子的路径上的标号连接起来,作为该叶子代表的字符的编码。

哈夫曼树 深入剖析 - 知乎

两个问题:

  1. 为什么哈夫曼编码能够保证是前缀编码?

    因为没有一片树叶是另一片树叶的祖先,所以每个叶节点的编码就不可能是其他叶节点编码的前缀。

  2. 为什么哈夫曼编码能够保证字符编码总长最短?

    因为哈夫曼树的带权路径长度最短,故字符编码的总长最短。

哈夫曼编码的性质

  • 性质1:哈夫曼编码是前缀码
  • 性质2:哈夫曼编码是最优前缀码

5.6.5哈夫曼编码的算法实现

C++哈夫曼树+哈夫曼编码的实现(双完整版)_Ac君的博客-CSDN博客_哈夫曼树c++实现

void CreatHuffmanCode(HuffmanTree HT,HuffmanCode &HC,int n){//从叶子到根逆向求每个字符的哈夫曼编码,存储在编码表HC中HC=new char*[n+1];//分配n个字符编码的头指针矢量cd=new char [n];//分配临时存放编码的动态数组空间cd[n-1]='\0';//编码结束符for(i=1;i<=n;i++){//逐个字符求哈夫曼编码start=n-1;c=i;f=HT[i].parent;while(f!=0){//从叶子结点开始向上回溯,直到根结点--start;//回溯一次start向前指一个位置if(HT[f].lchild==c)cd[start]='0';//结点c是f的左孩子,则生成代码0else cd[start]='1';//结点c是f的右孩子,则生成代码1c=f;//继续向上回溯f=HT[f].parent;}HC[i]=new char[n-start];//为第i个字符串编码分配空间strcpy(HC[i],&cd[start]);//将求得的编码从临时空间cd复制到HC的当前行中}delete cd;
}

5.6.6文件的编码和解码

1、编码

① 输入各字符及其权值

② 构造哈夫曼树——HT[i]

③ 进行哈夫曼编码——HC[i]

④ 查HC[i],得到各字符的哈夫曼编码

2、解码

① 构造哈夫曼树

② 依次读入二进制码

③ 读入0,则走向左孩子;读入1,则走向右孩子

④ 一旦到达某叶子时,即可译出字符

⑤ 然后再从根出发继续译码,直到结束。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/26706.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【jvm】jvm整体结构(hotspot)

目录 一、说明二、java代码的执行流程三、jvm的架构模型3.1 基于栈式架构的特点3.2 基于寄存器架构的特点 一、说明 1.hotspot vm是目前市场上高性能虚拟机的代表作之一 2.hotspot采用解释器与即时编译器并存的架构 3.java虚拟机是用来解释运行字节码文件的&#xff0c;入口是字…

混合云环境实现K8S可观测的6大策略

2023年&#xff0c;原生云应用及平台发展迅猛。大量企业都在努力发挥其应用程序的最大潜力&#xff0c;以确保极致的用户体验并推动业务增长。 混合云环境的兴起和容器化技术(如Kubernetes)的采用彻底改变了现代应用程序的开发、部署和扩展方式。 在这个数字舞台上&#xff0c;…

命令模式 Command Pattern 《游戏设计模式》学习笔记

对于一般的按键输入&#xff0c;我们通常这么做&#xff0c;直接if按了什么键&#xff0c;就执行相应的操作 在这里我们是将用户的输入和程序行为硬编码在一起&#xff0c;这是我们很自然就想到的最快的做法。 但是如果这是一个大型游戏&#xff0c;往往我们需要实现一个按键…

研发工程师玩转Kubernetes——hostPath

有别于《研发工程师玩转Kubernetes——emptyDir》一文中介绍的emptyDir&#xff0c;hostPath可以在同一个Node的不同Pod间共享卷。 下面的清单文件利用了Pod亲和性&#xff0c;让Pod集中到一个Node上。 apiVersion: apps/v1 kind: Deployment metadata:name: hostpath-deploy…

中间人攻击

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、启动 Kali Linux准备 Apache 服务器使用Ettercap插件进行欺骗使用 Wireshark 捕获 Https 流量总结 前言 您可能已经熟悉中间人攻击&#xff1a;攻击者通过…

网络安全(秋招)如何拿到offer?(含面试题)

以下为网络安全各个方向涉及的面试题&#xff0c;星数越多代表问题出现的几率越大&#xff0c;祝各位都能找到满意的工作。 注&#xff1a;本套面试题&#xff0c;已整理成pdf文档&#xff0c;但内容还在持续更新中&#xff0c;因为无论如何都不可能覆盖所有的面试问题&#xf…

C语言预处理命令 #error 学习

#error命令是C/C语言的预处理命令之一&#xff0c;当预处理器预处理到#error命令时将停止编译并输出用户自定义的错误消息。 如下代码输出数字1000&#xff0c;如果加了 #error&#xff0c;构建时不会通过&#xff0c;提示出错如下&#xff1b; 这可能在大型项目中比较有用&am…

8.4一日总结

1.远程仓库的提交方式(免密提交) a.ssh:隧道加密传输协议,一般用来登录远程服务器 b.使用 git clone 仓库名 配置(生成公私钥对) ssh-Keygen [-t rsa -C 邮箱地址] 通过执行上述命令,全程回车,就会在~/.ssh/id_rsa(私钥)和id_rsa.pub(公钥),私钥是必须要保存好的,并不能…

TeeChart NET for MAUI Crack

TeeChart NET for MAUI Crack 跨平台图表-移动或桌面应用程序的核心图表代码相同。 图表集合-60多种图表类型和50多种财务和统计指标。 图表类型 60多种2D和3D图表类型以及多种组合&#xff0c;包括&#xff1a; 标准&#xff1a;线条(条形)、条形、区域、饼图、快线、点(散点…

【Java可执行命令】(十七)JVM运行时信息动态维护工具 jinfo:一个维护 JVM 相关的配置参数和系统属性的工具,辅助故障排除、诊断和优化 ~

Java可执行命令之jinfo 1️⃣ 概念2️⃣ 优势和缺点3️⃣ 使用3.1 语法格式3.2 -flags&#xff1a;查看进程的启动参数3.3 -sysprops&#xff1a;查看进程的系统属性3.4 -flag < name>&#xff1a;查看特定虚拟机参数的值3.5 -flag [/-]< name>&#xff1a;启用或禁…

2023年8月份华为H12-811更新了

801、[单选题]178/832、在系统视图下键入什么命令可以切换到用户视图? A quit B souter C system-view D user-view 试题答案&#xff1a;A 试题解析&#xff1a;在系统视图下键入quit命令退出到用户视图。因此答案选A。 802、[单选题]“网络管理员在三层交换机上创建了V…

【CSS】CSS 选择器

CSS 选择器 1.基础选择器 1.1 元素选择器 语法&#xff1a;标签名{...} 元素选择器会选中对应标签名的HTML元素&#xff0c;例如&#xff1a;p{...}&#xff0c;div{...}&#xff0c;span{...}等 1.2 类选择器 语法&#xff1a;.类名{...} 类选择器会选中class属性为指定…

配置两台数据库为主从数据库模式

一、主库配置 1、修改配置文件 /etc/my3306.cnf #mysql服务ID&#xff0c;保证整个集群环境中唯一&#xff0c;默认为1server-id1#是否只读&#xff0c;1代表只读&#xff0c;0代表读写read-only0#忽略的数据&#xff0c;指不需要同步的数据库#binlog-ignore-dbmysql#指定同步…

OSPF作业3

题目 地址配置 R1&#xff1a; R2&#xff1a; R3&#xff1a; R4&#xff1a; R5&#xff1a; R6&#xff1a; R7&#xff1a; R8&#xff1a; R9&#xff1a; R10&#xff1a; R11&#xff1a; R12&#xff1a; 私网通及LSDB优化 R1&#xff1a; ospf 1 router-id 1.1.1.1 …

【图论】强连通分量进阶

一.作用 强连通分量可以判断环和进行缩点。还有一系列作用.... 这篇文章介绍缩点 二.题目 https://www.luogu.com.cn/problem/P2341 三.思路 我们分析可以知道当一个点没有出度时&#xff0c;则为最受欢迎的牛。但如果有多个出度&#xff0c;则没有最受欢迎的牛。 这是只有…

AcWing 93:递归实现组合型枚举 ← DFS

【题目来源】https://www.acwing.com/problem/content/95/【题目描述】 从 1∼n 这 n 个整数中随机选出 m 个&#xff0c;输出所有可能的选择方案。【输入格式】 两个整数 n&#xff0c;m&#xff0c;在同一行用空格隔开。【输出格式】 按照从小到大的顺序输出所有方案&#xf…

【TypeScript】交叉类型联合类型(四)

【TypeScript】交叉类型&联合类型&#xff08;四&#xff09; 【TypeScript】交叉类型&联合类型&#xff08;四&#xff09;一、简介二、交叉类型2.1 交叉类型使用的注意点2.2 基本数据类型交叉2.3 对象类型交叉 三、联合类型四、类型缩减 一、简介 TypeScript 中的交…

用于实体对齐的联合学习实体和关系表示2019 AAAI 8.7

用于实体对齐的联合学习实体和关系表示 摘要介绍相关工作实体对齐图卷积网络 问题公式我们的方法整体架构初步实体对齐图卷积层近似关系表示联合实体和关系对齐 实验总结 摘要 实体对齐是在不同知识图之间集成异构知识的一种可行方法。该领域的最新发展通常采用基于嵌入的方法…

Neo4j笔记-数据迁移(导出/导入)

这里先说明以下几点&#xff1a; Neo4j在4.0下版本默认的库名是&#xff1a;graph.db Neo4j在4.0上版本默认的库名是&#xff1a;neo4j.db 不管是Neo4j&#xff0c;还是Neo4j Desktop&#xff0c;都会在bin目录下有neo4j、neo4j-admin软件。在conf目录下&#xff0c;有neo4j.…

【状态估计】一维粒子滤波研究(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…