【数据结构】哈夫曼树(Huffman Tree)和哈夫曼编码(Huffman Coding)

在这里插入图片描述

哈夫曼树(Huffman Tree)和哈夫曼编码(Huffman Coding)是数据压缩领域常用的技术。哈夫曼树是一种特殊的二叉树,用于构造哈夫曼编码,而哈夫曼编码则是一种变长编码,用于压缩数据。

在解释哈夫曼树和哈夫曼编码之前,我们先来了解一下如何构建哈夫曼树。

  1. 频率统计:首先,需要对待压缩的数据进行频率统计,统计每个字符出现的频率。频率越高的字符,其在哈夫曼编码中的表示越短。

  2. 构建节点:根据统计结果,将每个字符及其对应的频率作为节点。每个节点初始时作为一个独立的子树。

  3. 构建哈夫曼树:重复以下步骤,直到只剩下一个节点:
    a. 选择两个频率最低的节点,合并它们,生成一个新的节点,该节点的频率为两个节点的频率之和。
    b. 将新生成的节点作为子树,再次进行排序。

  4. 哈夫曼树生成:最终,生成的树的根节点即为哈夫曼树的根节点。

一旦构建了哈夫曼树,就可以根据树的结构来生成对应的哈夫曼编码。

  1. 从根节点开始,沿着左子树路径到达叶子节点时,添加一个"0"到编码中;沿着右子树路径到达叶子节点时,添加一个"1"到编码中。

  2. 遍历整棵哈夫曼树,生成每个字符的哈夫曼编码。注意,由于每个字符都能找到唯一的路径,哈夫曼编码是没有前缀的,也就是说,一个字符的哈夫曼编码不是另一个字符的前缀。

通过上述方法,我们就成功地构建了哈夫曼树和哈夫曼编码。接下来,我们可以利用生成的哈夫曼编码来压缩数据。

压缩数据的过程就是将原始数据中的每个字符替换为对应的哈夫曼编码,并将所有替换后的二进制串按位存储。这样,在传输或存储数据时,可以大大减少原始数据的大小。

解压数据的过程相对简单,只需要根据哈夫曼编码和哈夫曼树的对应关系,将编码逐位地进行解码,还原出原始的字符序列。

总结一下,哈夫曼树和哈夫曼编码通过统计字符频率来构建一种具有最优编码的树结构,用于数据压缩和解压缩。通过构建哈夫曼树和生成哈夫曼编码,我们可以将数据压缩到更小的空间,提高数据传输和存储的效率。
以下是一个使用C++面向过程编写的示例代码,展示了如何构建哈夫曼树和生成哈夫曼编码。

#include <iostream>
#include <queue>
#include <map>
using namespace std;// 定义节点结构体
struct Node {char data;int frequency;Node* left;Node* right;
};// 创建节点
Node* createNode(char data, int frequency, Node* left, Node* right) {Node* newNode = new Node();newNode->data = data;newNode->frequency = frequency;newNode->left = left;newNode->right = right;return newNode;
}// 释放节点及其子树的内存
void releaseNode(Node* node) {if (node) {releaseNode(node->left);releaseNode(node->right);delete node;}
}// 定义比较函数用于优先队列排序
struct Compare {bool operator()(const Node* a, const Node* b) {return a->frequency > b->frequency;}
};// 构建哈夫曼树
Node* buildHuffmanTree(map<char, int> frequencies) {priority_queue<Node*, vector<Node*>, Compare> pq;// 将每个字符的频率作为独立节点加入优先队列for (auto pair : frequencies) {Node* newNode = createNode(pair.first, pair.second, nullptr, nullptr);pq.push(newNode);}// 构建哈夫曼树while (pq.size() > 1) {Node* left = pq.top();pq.pop();Node* right = pq.top();pq.pop();int totalFrequency = left->frequency + right->frequency;Node* newNode = createNode('\0', totalFrequency, left, right);pq.push(newNode);}return pq.top();
}// 生成哈夫曼编码
void generateHuffmanCode(Node* root, string code, map<char, string>& huffmanCodes) {if (root == nullptr) {return;}if (root->left == nullptr && root->right == nullptr) {huffmanCodes[root->data] = code;}generateHuffmanCode(root->left, code + "0", huffmanCodes);generateHuffmanCode(root->right, code + "1", huffmanCodes);
}int main() {string input = "hello world";map<char, int> frequencies;// 统计每个字符的频率for (char c : input) {frequencies[c]++;}// 构建哈夫曼树Node* root = buildHuffmanTree(frequencies);// 生成哈夫曼编码map<char, string> huffmanCodes;generateHuffmanCode(root, "", huffmanCodes);// 输出每个字符及其对应的哈夫曼编码for (auto pair : huffmanCodes) {cout << pair.first << " : " << pair.second << endl;}// 释放节点内存releaseNode(root);return 0;
}

以上代码展示了如何通过构建哈夫曼树和生成哈夫曼编码来实现数据的压缩。代码利用优先队列(Priority Queue)来构建哈夫曼树,并使用递归方式生成哈夫曼编码。最后,输出每个字符和其对应的哈夫曼编码。一定要注意在使用完节点后释放相关的内存以避免内存泄漏。

如果你想更深入地了解人工智能的其他方面,比如机器学习、深度学习、自然语言处理等等,也可以点击这个链接,我按照如下图所示的学习路线为大家整理了100多G的学习资源,基本涵盖了人工智能学习的所有内容,包括了目前人工智能领域最新顶会论文合集和丰富详细的项目实战资料,可以帮助你入门和进阶。

链接:

人工智能交流群(大量资料)

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/188485.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

文心一言 VS 讯飞星火 VS chatgpt (147)-- 算法导论12.2 2题

二、用go语言&#xff0c;写出 TREE-MINIMUM 和 TREE-MAXIMUM 的递归版本。 灵捷3.5 。 文心一言&#xff1a; 以下是用 Go 语言编写的树的最大值和最小值的递归版本代码&#xff1a; package main import ( "fmt" ) type TreeNode struct { Val int Le…

【tower-boot 系列】MybatisPlus 集成

Mybatis、MybatisPlus 简单介绍 MybatisPlus 集成 一、pom 依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-jdbc</artifactId><exclusions><exclusion><groupId>com.zaxxer…

docker-compose命令

&#xff08;1&#xff09;定义 compose是用于定义和运行多容器docker应用程序的工具。 通过compose&#xff0c;使用yml文件来配置应用程序需要的所有服务。然后&#xff0c;使用一个命令&#xff0c;就可以从yml文件配置中创建并启动所有服务。 &#xff08;2&#xff09;模板…

将Linux 标准输出,错误输出重定向到文件

将Linux 标准输出&#xff0c;错误输出重定 1.想要把make输出的全部信息&#xff0c;输出到某个文件中&#xff0c;最常见的办法就是&#xff1a; make xxx > build_output.txt 此时默认情况是没有改变2stderr的输出方式&#xff0c;还是屏幕&#xff0c;所以&#xff0c…

opencv学习一:namedWindow()创建和显示窗口

文章目录 opencv图像视频的加载和显示一、namedWindow()创建和显示窗口&#xff08;一&#xff09;函数1.namedWindow()创建命名窗口2.imshow() 显示窗口3.destroyAllwindws()摧毁窗口4.resizeWindow() 改变窗口大小5.waitKey() 等待用户输入 &#xff08;二&#xff09;代码 o…

python简单进阶之web框架:fastapi使用教程

原文&#xff1a;python简单进阶之web框架&#xff1a;fastapi使用教程 - 知乎 这是简单进阶教程系列第四篇&#xff0c;本系列文章主要介绍那些可以很快上手的进阶库。 我其实学过一段时间Django框架&#xff0c;但是半途而废了&#xff0c;我觉得可能还是简单一点的框架比较适…

智能优化算法应用:基于象群算法无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用&#xff1a;基于象群算法无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用&#xff1a;基于象群算法无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.象群算法4.实验参数设定5.算法结果6.参考文献7.MATLAB…

JavaScript 一只青蛙想要过河

一只青蛙想要过河。 假定河流被等分为若干个单元格&#xff0c;并且在每一个单元格内都有可能放有一块石子&#xff08;也有可能没有&#xff09;。 青蛙可以跳上石子&#xff0c;但是不可以跳入水中。 给你石子的位置列表 stones&#xff08;用单元格序号 升序 表示&#xf…

什么是堆内存?参数如何设置?

文章目录 什么是堆内存&#xff1f;参数如何设置&#xff1f; 栈和队列&#xff0c;举个使用场景例子&#xff1f; 什么是堆内存&#xff1f;参数如何设置&#xff1f; 堆内存是指由程序代码自由分配的内存&#xff0c;与栈内存作区分。 在 Java 中&#xff0c;堆内存主要用于…

网络类型解析(基础):探索通信世界的多样面貌

在当今数字化时代&#xff0c;网络已经成为人们生活和工作中不可或缺的一部分。从个人设备之间的直接通信到全球范围的数据传输&#xff0c;不同类型的网络为我们提供了多种连接方式和通信选择。透过对这些网络类型的解析&#xff0c;我们将更好地理解它们的特点、优势和适用场…

JMX的使用

1. 定义和意义 JMX是Java Management Extention的缩写&#xff0c;出发点是让外部通过属性/方法来读取或设置程序状态。对于提供对外服务的程序来说&#xff0c;天生就有这样的能力&#xff0c;Web程序通过HTTP接口对外暴露&#xff0c;RPC应用通过RPC接口暴露。不过带来的问…

ESP32-Web-Server编程- 使用表格(Table)实时显示设备信息

ESP32-Web-Server编程- 使用表格&#xff08;Table&#xff09;实时显示设备信息 概述 上节讲述了通过 Server-Sent Events&#xff08;以下简称 SSE&#xff09; 实现在网页实时更新 ESP32 Web 服务器的传感器数据。 本节书接上会&#xff0c;继续使用 SSE 机制在网页实时显…

如何优化 Elasticsearch 以获得更好的搜索性能

当今世界&#xff0c;数据大量生成&#xff0c;为了利用数据进行生产&#xff0c;需要对提取的数据进行转换、存储、维护、管理和分析。这些过程只有通过大数据工具所基于的分布式架构和并行处理机制才能实现。Elasticsearch 是最流行的开源数据存储之一&#xff0c;可以满足大…

邻接表表示图进行深度优先搜索,广度优先搜索,最小生成树

图的邻接表定义 下面用邻接表实现图的深度优先搜索和广度优先搜索&#xff0c;用邻接矩阵来实现最小生成树。 图的邻接表&#xff1a;首先定义一个图的邻接表的类&#xff0c;里面包括图的顶点数&#xff0c;图的边数&#xff0c;顶点表数组。由于顶点表数组里存放的都是图的…

P2880 [USACO07JAN] Balanced Lineup G 题解

文章目录 题目描述输入格式输出格式样例样例输入样例输出 数据范围与提示完整代码 题目描述 For the daily milking, Farmer John’s N cows (1 ≤ N ≤ 50,000) always line up in the same order. One day Farmer John decides to organize a game of Ultimate Frisbee with…

从兔子说起:了解RabbitMQ消息的多样化【RabbitMQ 二】

&#x1f38f;&#xff1a;你只管努力&#xff0c;剩下的交给时间 &#x1f3e0; &#xff1a;小破站 从兔子说起&#xff1a;了解RabbitMQ消息的多样化 第一&#xff1a;消息的可靠性与持久性第二&#xff1a;消息交换机与队列第三&#xff1a;消息确认与拒绝第四&#xff1a;…

深度学习手势识别 - yolo python opencv cnn 机器视觉 计算机竞赛

文章目录 0 前言1 课题背景2 卷积神经网络2.1卷积层2.2 池化层2.3 激活函数2.4 全连接层2.5 使用tensorflow中keras模块实现卷积神经网络 3 YOLOV53.1 网络架构图3.2 输入端3.3 基准网络3.4 Neck网络3.5 Head输出层 4 数据集准备4.1 数据标注简介4.2 数据保存 5 模型训练5.1 修…

2023年全国职业院校技能大赛“ 信息安全管理与评估” 测试题2

一.单选题 1、下列不属于口令安全威胁的是&#xff1f;&#xff08; &#xff09; A、 弱口令 B、 明文传输 C、 MD5 加密 D、 多账户共用一个密码 2、在学校或单位如果发现自己的计算机感染了病毒,应首先采取什么措施 ( )。 A、断开网络 B、告知领导 C、杀毒 D、重…

C++模板—函数模板、类模板

目录 一、函数模板 1、概念 2、格式 3、实例化 4、模板参数的匹配 二、类模板 1、定义格式 2、实例化 交换两个变量的值&#xff0c;针对不同类型&#xff0c;我们可以使用函数重载实现。 void Swap(double& left, double& right) {double tmp left;left ri…

黑马一站制造数仓实战1

1. 项目目标 一站制造 企业中项目开发的落地&#xff1a;代码开发 代码开发&#xff1a;SQL【DSL SQL】 SparkCore SparkSQL 数仓的一些实际应用&#xff1a;分层体系、建模实现 2. 内容目标 项目业务介绍&#xff1a;背景、需求 项目技术架构&#xff1a;选型、架构 项目环境…