数据结构:哈夫曼树

1.概念

哈夫曼树(Huffman Tree)是一种用于数据压缩的二叉树,由大卫·哈夫曼(David A. Huffman)于1952年提出。它通过构建最优二叉树来实现数据的高效压缩,广泛应用于文件压缩、图像压缩等领域。

哈夫曼树的核心思想

哈夫曼树的核心思想是用较短的编码表示出现频率较高的字符,用较长的编码表示出现频率较低的字符,从而减少整体的编码长度。

2.构建哈夫曼树的步骤

  1. 统计字符频率

    • 统计待压缩数据中每个字符出现的频率。

  2. 创建节点

    • 为每个字符创建一个节点,节点的权重为字符的频率。

  3. 构建优先队列

    • 将所有节点放入一个优先队列(最小堆),按权重从小到大排序。

  4. 合并节点

    • 从优先队列中取出权重最小的两个节点,合并成一个新节点,新节点的权重为这两个节点的权重之和。

    • 将新节点放回优先队列。

  5. 重复合并

    • 重复上述步骤,直到优先队列中只剩一个节点,这个节点就是哈夫曼树的根节点。

  6. 生成编码

    • 从根节点开始,向左子树走标记为0,向右子树走标记为1,直到叶子节点,得到每个字符的哈夫曼编码。

3.哈夫曼树的特点

  • 最优前缀编码:哈夫曼编码是一种前缀编码,没有任何一个编码是另一个编码的前缀。

  • 最小加权路径长度:哈夫曼树的带权路径长度(WPL)最小,即压缩效率最高。

示例

假设有以下字符及其频率:

  • A: 5

  • B: 9

  • C: 12

  • D: 13

  • E: 16

  • F: 45

构建哈夫曼树的过程:

  1. 将所有字符节点放入优先队列。

  2. 取出A(5)和B(9),合并为新节点(14),放回队列。

  3. 取出C(12)和D(13),合并为新节点(25),放回队列。

  4. 取出E(16)和新节点(14),合并为新节点(30),放回队列。

  5. 取出新节点(25)和F(45),合并为新节点(70),放回队列。

  6. 取出新节点(30)和新节点(70),合并为根节点(100)。

根据哈夫曼树的构建规则和正确的路径长度过程:

        (100)/     \(30)    (70)/   \    /   \
(14)  E(16) (25) F(45)/  \      /  \
A(5) B(9) C(12) D(13)

  路径长度:

  1. A:根 → 30 → 14 → A,路径长度 3

  2. B:根 → 30 → 14 → B,路径长度 3

  3. C:根 → 70 → 25 → C,路径长度 3

  4. D:根 → 70 → 25 → D,路径长度 3

  5. E:根 → 30 → E,路径长度 2

  6. F:根 → 70 → F,路径长度 2


计算 WPL

字符权重(频率)路径长度权重 × 路径长度
A535×3=15
B939×3=27
C12312×3=36
D13313×3=39
E16216×2=32
F45245×2=90

WPL 总和

15+27+36+39+32+90=239

总结

路径长度是哈夫曼树中一个重要的概念,它直接决定了每个字符的编码长度。通过最小化带权路径长度(WPL),哈夫曼树能够实现数据的高效压缩。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/895544.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UE5.2后 Bake Out Materials失效

这个问题出现在5.3,5.4,5.5没有测试 烘焙贴图后会找不到贴图位置, 这个是5.2的正常状态 默认是生成在模型当前目录里,包括新的材质 但是这个bug会让材质和贴图都消失,无法定位 暂时没有办法解决,等官方 …

ADC 的音频实验,无线收发模块( nRF24L01)

nRF24L01 采用 QFN20 封装,有 20 个引脚,以下是各引脚的详细介绍: 1. 电源引脚 ◦ VDD:电源输入端,一般接 3V 电源,为芯片提供工作电压,供电电压范围为 1.9V~3.6V。 ◦ VSS&#xf…

基于HTML5 Canvas 和 JavaScript 实现的烟花动画效果

以下是一个使用 HTML5 Canvas 和 JavaScript 实现的烟花动画效果代码盒子: <!DOCTYPE html> <html> <head><title>烟花效果

C++课程设计 运动会分数统计(含源码)

C++课程设计 运动会分数统计 一、题目描述(一)问题描述(二)基本要求二、程序设计文档1. 项目概述1.1 项目背景1.2 功能需求1.3 非功能需求2. 系统设计2.1 数据结构设计2.1.1 `School` 结构体2.1.2 `Project` 结构体2.2 功能模块设计2.2.1 主菜单2.2.2 输入/修改项目成绩2.2…

【音视频】RTSP拉流: RTP负载AAC详解(三)

此文为系列文章&#xff0c;此系列主要讲解RTSP客户端的拉流及播放&#xff0c;文章持续更新&#xff0c;会从rtsp的基本协议讲起&#xff0c;如何一步步实现音视频的拉流过程&#xff0c;包括一系列涉及到的协议&#xff0c;rtsp&#xff0c;sdp&#xff0c; rtp&#xff08;本…

Dockerfiles 的 Top 10 常见 DevOps/SRE 面试问题及答案

1. RUN 和 CMD 之间有什么区别&#xff1f; RUN : 在镜像构建过程中执行命令&#xff0c;创建一个新的层。通常用于安装软件包。 示例: RUN apt-get update && apt-get install -y curlCMD : 指定容器启动时默认运行的命令。它在运行时执行&#xff0c;而不是在构建过程…

【ARM】JTAG接口介绍

1、 文档目标 对 JTAG 接口有更多的认识&#xff0c;在遇到关于 JTAG 接口问题时有一些排查的思路。 2、 问题场景 在使用调试器过程时&#xff0c;免不了要接触到 JTAG 接口&#xff0c;当出现连接不上时&#xff0c;就不知道从哪来进行排查。 3、软硬件环境 1 软件版本&am…

opencascade 获取edge起始点 会出现终点与实际不同的情况

在使用 OpenCASCADE 获取 TopoDS_Edge 的起始点和终点时&#xff0c;可能会出现终点与实际不一致的情况。这通常是由于以下原因导致的&#xff1a; 几何曲线的方向问题&#xff1a;在某些情况下&#xff0c;几何曲线的方向可能与拓扑边的方向不一致&#xff0c;导致通过几何曲线…

【电脑】u盘重装win7

u盘必须8GB以上 1. CPU型号 首先查看CPU的型号看看到底能不能装win7 2. 下载光盘映像文件 网址 看电脑是多少位的机器(32位下载x86 64位下载x64) 一共是这么多个版本按需下载对应的版本 电脑小白推荐无脑下载旗舰版 将链接复制到迅雷进行下载 3. 下载软碟通 网址 下…

C++-AVL树

一、AVL树的概念 1.二叉搜索树 二叉搜索树&#xff08;BST&#xff0c;Binary Search Tree&#xff09;&#xff0c;也称二叉排序树或二叉查找树。 二叉搜索树&#xff1a;一棵二叉树&#xff0c;可以为空&#xff1b;如果不为空&#xff0c;满足以下性质&#xff1a; 非空左子…

【网络安全 | 漏洞挖掘】后端接受非预期参数的故事

未经许可,不得转载。 文章目录 正文正文 在对某项目进行测试时,我遵循了一套系统化的方法论,以确保全面理解其安全性。 首先,我创建了一个账户,并从用户的角度探索主域及其各项功能。此阶段,我避免使用 Burp Suite 或其他工具,而是尝试真正理解该应用的设计逻辑与交互…

01.01、判定字符是否唯一

01.01、[简单] 判定字符是否唯一 1、题目描述 实现一个算法&#xff0c;确定一个字符串 s 的所有字符是否全都不同。 在这一题中&#xff0c;我们的任务是判断一个字符串 s 中的所有字符是否全都不同。我们将讨论两种不同的方法来解决这个问题&#xff0c;并详细解释每种方法…

w208基于spring boot物流管理系统设计与实现

&#x1f64a;作者简介&#xff1a;多年一线开发工作经验&#xff0c;原创团队&#xff0c;分享技术代码帮助学生学习&#xff0c;独立完成自己的网站项目。 代码可以查看文章末尾⬇️联系方式获取&#xff0c;记得注明来意哦~&#x1f339;赠送计算机毕业设计600个选题excel文…

《刚刚问世》系列初窥篇-Java+Playwright自动化测试-22- 操作鼠标拖拽 - 下篇(详细教程)

1.简介 上一篇中&#xff0c;宏哥说的宏哥在最后提到网站的反爬虫机制&#xff0c;那么宏哥在自己本地做一个网页&#xff0c;没有那个反爬虫的机制&#xff0c;谷歌浏览器是不是就可以验证成功了&#xff0c;宏哥就想验证一下自己想法&#xff0c;其次有人私信宏哥说是有那种…

神经网络常见激活函数 8-SELU函数

SELU 缩放指数线性单元&#xff1a;SELU&#xff08;Scaled Exponential Linear Unit&#xff09; 函数导函数 SELU函数 S E L U ( x ) { λ x x > 0 λ α ( e x − 1 ) x ≤ 0 \rm SELU(x) \left\{ \begin{array}{} \lambda x \quad & x > 0 \\ \lambda \alph…

【Elasticsearch】多字段查询方式汇总

在 Elasticsearch 中&#xff0c;实现多字段查询的常见方式有以下几种&#xff0c;每种方式适用于不同的场景&#xff1a; --- ### 1. **multi_match 查询** - **用途**&#xff1a;在多个字段中执行同一查询&#xff0c;支持多种匹配策略。 - **关键参数**&#xff1a…

多线之旅:wait 与 notify

今天小编继续来分享下多线程中的一些内容。 在多线程环境下&#xff0c;由于线程调度的不确定性&#xff0c;所以我们有时候无法很好的去保证其线程的执行顺序。 但是呢&#xff0c;我们又要实现这个顺序执行&#xff0c;所以我们可以使用到这两个方法&#xff0c;wait 和 no…

批量修改mysql字符串字段子字符串

替换子字符串 使用 REPLACE 函数替换字段中的特定子字符串。 示例&#xff1a; 将 table_name 表中 column_name 字段的所有 old_value 替换为 new_value。 UPDATE table_name SET column_name REPLACE(column_name, old_value, new_value) WHERE column_name LIKE %old_val…

达梦:AWR 生成

目录标题 AWR 性能诊断与报告生成1. 检查 AWR 系统状态2. 查看数据库中的所有表空间3. 查看现有的 AWR 快照4. 设置 AWR 快照的时间间隔5. 创建 AWR 快照6. 查看最新的 AWR 快照7. 生成 AWR HTML 报告8. 将 AWR 报告保存到指定文件链接总结 自动工作集负载信息库 AWR 报告解析指…

股票数据接口API实例代码python、JAVA等多种语言演示免费获取实时数据、历史数据、CDMA、KDJ等指标数据配有API说明文档

​ 本文中所有接口均可直接在浏览器打开获取数据&#xff0c;为了便于大家验证有效性&#xff0c;已经做好了超链接&#xff0c;直接点击即可&#xff01; 沪深两市股票列表 API接口链接&#xff08;可点击验证&#xff09;&#xff1a;https://api.mairui.club/hslt/list/b…