Python算法——霍夫曼编码树

Python中的霍夫曼编码树

霍夫曼编码是一种用于数据压缩的技术,通过构建霍夫曼编码树(Huffman Tree)来实现。这篇博客将详细讲解霍夫曼编码树的原理、构建方法和使用方式,并提供相应的Python代码实现。

霍夫曼编码原理

霍夫曼编码是一种变长编码,通过给不同的符号分配不同长度的编码,来实现对数据的高效压缩。编码树是一棵二叉树,其中每个叶子节点代表一个符号,而从根到叶子的路径上的每一步都对应一个二进制编码。

霍夫曼编码树的构建过程基于数据中各符号的出现频率,频率越高的符号,其对应的编码路径越短。

霍夫曼编码树的构建

构建霍夫曼编码树的基本步骤如下:

  1. 创建一个优先队列(最小堆),用于存储各个节点。
  2. 将每个符号及其频率作为一个节点插入队列中。
  3. 从队列中选择两个频率最低的节点,合并为一个新节点,其频率为两者之和,然后将新节点插入队列。
  4. 重复步骤 3,直到队列中只剩下一个节点,即霍夫曼编码树的根节点。
    Python代码实现
import heapq
from collections import defaultdictclass HuffmanNode:def __init__(self, symbol, frequency):self.symbol = symbolself.frequency = frequencyself.left = Noneself.right = Nonedef __lt__(self, other):return self.frequency < other.frequencydef build_huffman_tree(data):# 统计每个符号的频率frequency_map = defaultdict(int)for symbol in data:frequency_map[symbol] += 1# 初始化优先队列priority_queue = [HuffmanNode(symbol, frequency) for symbol, frequency in frequency_map.items()]heapq.heapify(priority_queue)# 构建霍夫曼编码树while len(priority_queue) > 1:left_node = heapq.heappop(priority_queue)right_node = heapq.heappop(priority_queue)merged_node = HuffmanNode(None, left_node.frequency + right_node.frequency)merged_node.left, merged_node.right = left_node, right_nodeheapq.heappush(priority_queue, merged_node)return priority_queue[0]def huffman_codes(node, current_code="", code_map=None):if code_map is None:code_map = {}if node is not None:if node.symbol is not None:code_map[node.symbol] = current_codehuffman_codes(node.left, current_code + "0", code_map)huffman_codes(node.right, current_code + "1", code_map)return code_map# 示例
data_to_compress = "hello world"
huffman_tree_root = build_huffman_tree(data_to_compress)
huffman_code_map = huffman_codes(huffman_tree_root)print("Huffman Codes:")
for symbol, code in huffman_code_map.items():print(f"{symbol}: {code}")

示例说明

以上示例中,我们使用字符串 “hello world” 来演示霍夫曼编码的构建过程。在示例中,每个字符都被看作一个符号,并计算其频率。然后,根据频率构建霍夫曼编码树,最终得到每个符号对应的霍夫曼编码。

输出结果:

Huffman Codes:
h: 110
e: 01
o: 111
d: 001
l: 000
r: 10
w: 0011

这表示字符 “h” 对应的霍夫曼编码为 “110”,字符 “e” 对应的编码为 “01”,以此类推。通过理解霍夫曼编码树的构建和编码方式,我们可以在数据压缩中应用这一技术。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/171424.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ubuntu 安装 jetbrains-toolbox

ubuntu 安装 jetbrains-toolbox 官网下载 jetbrains-toolbox jetbrains 官网 jetbrains 官网&#xff1a;https://www.jetbrains.com/ jetbrains-toolbox 官网下载页面 在下载页面点击 Download 安装 jetbrains-toolbox 解压 jetbrains-toolbox 安装包 到指定目录 本案例将…

STM32 默认时钟更改 +debug调试

STM32时钟 文章目录 STM32时钟前言一、修改系统时钟二、DEBUG 前言 为什么我们要改STM32的时钟呢&#xff0c;打个比方在做SPI驱动的时候&#xff0c;需要16M的时钟&#xff0c;但是stm32默认是72的分频分不出来&#xff0c;这个时候我们就要改系统时钟了&#xff0c;那么怎么…

[科普] 无刷直流电机驱动控制原理图解

Title: [科普] 无刷直流电机驱动控制原理图解 文章目录 I. 引言II. 直流电机的原理1. 有刷直流电机和无刷直流电机的区别2. 有刷直流电机的运行原理3. 既是电动机又是发电机 III. 无刷直流电机的原理1. 无刷直流电机与永磁同步电机的区别2. 无刷直流电机的换向控制原理3. 无刷直…

python 笔记 根据用户轨迹+基站位置,估计基站轨迹+RSRP

1 问题描述 已知用户实际的轨迹&#xff0c;和基站的位置&#xff0c;能不能得到用户所连接的基站&#xff0c;以及基站的信号强度RSRP&#xff1f; 1.1 几个假设 这里我们做几个假设&#xff1a; 每个用户有80%的概率连接最近的基站&#xff0c;有20%的概率选择其他的基站连…

4/5G互操作 EPSFB讲解

今天我们来讲一下4/5G之间之间互操作&#xff0c;以及5G的EPSFB是基于什么实现的~ 目录 4/5G互操作 重选 切换 基于覆盖的切换 基于业务的切换 两个面试问题 想要加快4G切换5G的速度&#xff0c;调哪个参数怎么调高效&#xff1f; 想要减慢5G切换4G的速度调哪个参数怎…

2018年5月23日 Go生态洞察:更新Go行为准则

&#x1f337;&#x1f341; 博主猫头虎&#xff08;&#x1f405;&#x1f43e;&#xff09;带您 Go to New World✨&#x1f341; &#x1f984; 博客首页——&#x1f405;&#x1f43e;猫头虎的博客&#x1f390; &#x1f433; 《面试题大全专栏》 &#x1f995; 文章图文…

knime 中没有column expressions,怎么下载

knime 中没有column expressions&#xff0c;怎么下载 1、打开view&#xff0c;然后找到knime hub&#xff0c;column expression 2、往里面拖动&#xff0c;就可以安装了 3、然后会出现重启&#xff0c;搜索就可以出现啦

【SpringCloud】从单体架构到微服务架构

今天来看看架构的演变过程 一、单体架构 从图中可以看到&#xff0c;所有服务耦合在一起&#xff0c;数据库存在单点&#xff0c;一旦其中一个服务出现问题时&#xff0c;整个工程都需要重新发布&#xff0c;从而导致整个业务不能提供响应 这种架构对于小项目而言是没有什么…

OSG编程指南<十二>:OSG二三维文字创建及文字特效

1、字体基础知识 适当的文字信息对于显示场景信息是非常重要的。在 OSG 中&#xff0c;osgText提供了向场景中添加文字的强大功能&#xff0c;由于有第三方插件 FreeType 的支持&#xff0c;它完全支持TrueType 字体。很多人可能对 FreeType 和 TrueType 还不太了解&#xff0c…

【AUTOSAR】【通信栈】ComXf

AUTOSAR专栏——总目录_嵌入式知行合一的博客-CSDN博客文章浏览阅读292次。本文主要汇总该专栏文章,以方便各位读者阅读。https://xianfan.blog.csdn.net/article/details/132072415 目录 一、概述 二、限制说明

深度学习第3天:CNN卷积神经网络

☁️主页 Nowl &#x1f525;专栏《机器学习实战》 《机器学习》 &#x1f4d1;君子坐而论道&#xff0c;少年起而行之 ​ 文章目录 介绍 CNN的主要结构 卷积层 激励层 池化层 Kears搭建CNN 搭建代码 直观感受卷积的作用 结语 介绍 卷积神经网络&#xff08;Convol…

vs2019中出现Debug Error的原因

一般出现这种错误表示你的某个变量没有正确赋值&#xff0c;或者说本身在你的C程序中加了assert断言&#xff0c;assert的作用是先计算表达式expression,如果其值为假&#xff0c;那么它会打印一条错误信息 #include<assert.h> void assert(int expression); 例子&…

皮尔逊相关性分析的matlab实现,简介和实例

皮尔逊相关性分析&#xff08;Pearson correlation analysis&#xff09;是一种常用的统计方法&#xff0c;用于衡量两个变量之间的线性关系强度和方向。它通过计算两个变量之间的协方差和标准差来衡量它们之间的相关性。皮尔逊相关系数的取值范围为 -1 到 1&#xff0c;其中 -…

【nlp】4.1 fasttext工具介绍(文本分类、训练词向量、词向量迁移)

fasttext工具介绍与文本分类 1 fasttext介绍1.1 fasttext作用1.2 fasttext工具包的优势1.3 fasttext的安装1.4 验证安装2 fasttext文本分类2.1 文本分类概念2.2 文本分类种类2.3 文本分类的过程2.4 文本分类代码实现2.4.1 获取数据2.4.2 训练集与验证集的划分2.4.3 训练模型2.4…

安全设备的监控与运维的全面解决方案

随着信息技术的快速发展和广泛应用&#xff0c;网络安全问题日益凸显。如何有效监控和管理各类安全设备&#xff0c;确保其稳定运行&#xff0c;并及时发现和解决潜在的安全风险&#xff0c;成为当前亟待解决的问题。在此背景下&#xff0c;监控易应运而生&#xff0c;为安全设…

新手如何对一个web网页进行一次渗透测试

新手如何对一个web网页进行一次渗透测试 文章目录 新手如何对一个web网页进行一次渗透测试什么是渗透测试?渗透测试和红蓝对抗的区别那么拿到一个网站后如何进行一次优雅的渗透测试呢 什么是渗透测试? 在获得web服务运营的公司书面授权的情况下&#xff0c;模拟攻击者的行为…

JAVA - 阻塞队列

一、什么是堵塞队列 堵塞队列&#xff08;Blocking Queue&#xff09;是一种特殊类型的队列&#xff0c;它具有一些特定的行为和限制。在堵塞队列中&#xff0c;当队列为空时&#xff0c;尝试从队列中取出元素的操作将会被阻塞&#xff0c;直到队列中有可用元素&#xff1b;当…

windows运行Pangolin应用填坑心得——如何在window应用轻量级opengl软件Pangolin库显示3D界面及窗口

目录 0、前言1、最有效的安装打开方式准备工作安装git安装vcpkg&#xff08;1&#xff09;下载&#xff08;2&#xff09;安装&#xff08;3&#xff09;集成至vs 安装cmake 安装pangolin 2、应用实例c工程&#xff08;1&#xff09;vs创建新工程&#xff08;2&#xff09;新工…

PYTHON+CH347读写25系列flash

受下文启发: 参考&#xff1a;https://www.elektroda.com/rtvforum/topic3931424.html BK7231 programming via SPI in flash memory mode - Python and Banana Pi BK7231 is usually programmed via UART - this is allowed by the bootloader uploaded by the manufacture…

哈希思想的应用

目录 1.位图 位图的实现 题目变形一 题目变形二 题目变形三 总结&#xff1a; 2.布隆过滤器 概念 布隆过滤器的实现 3.哈希切割的思想 1.位图 哈希表和位图是数据结构中常用的两种技术。哈希表是一种数据结构&#xff0c;通过哈希函数把数据和位置进行映射&#xff0c…