哈夫曼算法证明+哈夫曼编码译码程序实现

哈夫曼算法证明

哈夫曼算法是一种贪心算法,我们考虑证明其最优子结构和贪心选择性质:

  • 最优子结构:假设一个树是哈夫曼树,则以其任意节点为根节点的最大子树也是哈夫曼树。

    证明:子树的根节点的值是其所有叶子节点出现权值之和,因此无论子树是什么形式,对子树上方的节点计算WPL2都没有影响。

    根据哈夫曼树的定义:WPL最小的二叉树。如果子树不是哈夫曼树,其WPL1就不会是最小,那么整个树的WPL=WPL1+WPL2就不会是最小,这与哈夫曼树的定义相悖,因此子树是哈夫曼树。

  • 贪心选择性质(哈夫曼算法):每次去掉权值最低的两个节点作为叶子节点形成一颗二叉树,并将其父亲节点放入待选节点中。

    证明:对于哈夫曼树我们总可以通过取出两个节点作为叶子节点并将其父亲节点重新作为叶子节点的方式构造,需要证明的是是否每次选择权值最低的节点可以构造成功。

    当含有2个及以下的叶子节点的时候,显然正确。

    假设当含有小于k个叶子节点的时候哈夫曼算法可以形成哈夫曼树

    对于含有k个叶子节点形成的树,设其中权重最小的叶子节点为a,其中深度最深的叶子节点为b,h表示节点的深度,w表示节点的权值。则:
    WPL1=∑+wa∗ha+wb∗hbWPL_1=\sum+w_a*h_a+w_b*h_b WPL1=+waha+wbhb
    交换这两个节点:
    WPL2=∑+wb∗ha+wa∗hbWPL_2=\sum+w_b*h_a+w_a*h_b WPL2=+wbha+wahb

WPL1−WPL2=(wa−wb)∗ha+(wb−wa)∗hb=(hb−ha)∗(wb−wa)WPL_1-WPL_2=(w_a-w_b)*h_a+(w_b-w_a)*h_b=(h_b-h_a)*(w_b-w_a) WPL1WPL2=(wawb)ha+(wbwa)hb=(hbha)(wbwa)

hb−hah_b-h_ahbhawb−waw_b-w_awbwa都为正(由a,b节点的性质),所以我们得到结论:对于任何一棵树,将权值小的节点尽可能移动到较深层的节点会使整个树的WPL比较小。

对于k个节点,我们首先取出两个节点,将其合并成一个节点以后我们有k-1个节点,可以使用哈夫曼算法构造。

如果这两个节点不是所有节点中权值最小的两个,则我们总可以通过交换使得构造的树的WPL减小,因此不是哈夫曼树。只有两个节点是所有节点中权值最小的两个时我们无法再降低树的WPL。因为我们总可以构造成功,所以选择权值最小的节点构造的树就是哈夫曼树。证毕。

哈夫曼编码译码程序

#pragma once
#include<iostream>
#include<fstream>
#include<vector>
#include<queue>
#include<cstdio>
#include<string>using namespace std;static const int MAXN = 1005;struct times
{double weight;//字符的权值int num;//字符的序号,同时也是他的ASCALL值times(int _num=0,double _weight=0) :num(_num),weight(_weight){}friend bool operator < (const times & a,const times & b){return a.weight > b.weight;}
}p,q;struct Chara:times
{int father;//父亲的序号int lson, rson;//左右儿子的序号string code;Chara(int _num = 0, double _weight = 0, int _lson = 0, int _rson = 0, int _father = 0) :times(_num,_weight), lson(_lson), rson(_rson), father(_father){code = "";//没有编码}void operator = (const Chara& x){weight = x.weight; num = x.num; father = x.father; lson = x.lson; rson = x.rson;}
};struct txt
{string t;double weight;txt(string _t,double _weight):t(_t),weight(_weight){}
};class HuffmanCode
{
public:int n=0;//字符的个数int cur;//当前所在位置int root;//哈夫曼树根节点Chara A[MAXN];//顺序表保存哈夫曼树priority_queue<times> T;//用来构建哈夫曼树void CreatHuffmanCode(int x, string now){if (A[x].lson != 0){CreatHuffmanCode(A[x].lson, now + "0");}if (A[x].rson != 0){CreatHuffmanCode(A[x].rson, now + "1");}if (A[x].lson == 0 && A[x].rson == 0)//说明是字符{A[x].code = now;}}void _HuffmanCode(int _n,vector<txt>& input){string tmp;n = _n;for (int i = 0; i < n; i++){tmp = input[i].t;A[tmp[0]].num = tmp[0];A[tmp[0]].weight = input[i].weight;T.push(times(tmp[0], A[tmp[0]].weight));}cur = 500;//构建哈夫曼树while (T.size() > 1){p = T.top(); T.pop(); q = T.top(); T.pop();A[cur] = Chara(cur, p.weight + q.weight, p.num, q.num, 0); A[p.num].father = A[q.num].father = cur;T.push(times(A[cur])); cur++;}T.pop(); root = cur-1;CreatHuffmanCode(root, "");}
};class Huffman
{int n;vector<txt> input;HuffmanCode x;
public:void _Huffman(){string t; double weight; n = 0;FILE* stream;freopen_s(&stream,"hfmTree.txt","r",stdin);while (1){cin >> t;if (t == "Esc") break;n++;cin >> weight;input.push_back(txt(t, weight));}freopen_s(&stream, "CON", "r", stdin);input.push_back(txt(" ", 10000.0));//给空格很大的权值n++;x._HuffmanCode(n, input);}Huffman(){string t; double weight; n = 0;cout << "请输入字符集 \n[Delete撤销输入,Esc退出输入]\n[直接输入Default按照默认文件组成哈夫曼编码]\n[空格已经编码]"<< endl;while(1){cout << "请输入字符:";cin >> t;if (n == 0 && t == "Default")//按照默认文件构造哈夫曼树{_Huffman();return;}else if (t == "Delete"){input.erase(input.end()-1);//删除最后一个输入的字符n--;continue;}else if (t == "Esc"){break;}n++;cout << "请输入" << t[0] << "的权重:";cin >> weight;input.push_back(txt(t, weight));}FILE* stream;freopen_s(&stream, "hfmTree.txt", "w", stdout);for (int i = 0; i < n; i++){cout << input[i].t << " " << input[i].weight << endl;}cout << "Esc" << endl;freopen_s(&stream, "CON", "w", stdout);input.push_back(txt(" ", 10000.0));//给空格很大的权值n++;x._HuffmanCode(n, input);}void HuffmanDisplay(){cout << "哈夫曼编码:" << endl;for (int i = 0; i < n; i++){cout << input[i].t[0] << ":" << x.A[input[i].t[0]].code << endl;}}void GenerateCode()//压缩文件{cout << "请输入需要压缩文件的路径[输入Default将打开默认文件ToBeTran.txt]" << endl;string in;cin >> in;if (in == "Default"){in = "ToBeTran.txt";}cout << "请输入保存压缩后文件的路径[输入Default将打开默认文件CodeFile.txt]" << endl;string out;cin >> out;if (out == "Default"){out = "CodeFile.txt";}ifstream infile(in, ios::in);ofstream outfile(out, ios::out);char c;bool flag = true;while ((c = infile.get()) != EOF){if (x.A[c].code == ""){flag = false;break;}outfile << x.A[c].code;}infile.close();outfile.close();if (!flag){cout << "压缩失败,文件中出现了字符集中未包含的字符" << endl;return;}//展示压缩的结果:infile.open(out, ios::in);string tmp;infile >> tmp;infile.close();cout << "编码后的文件为:" << endl;for (int i = 0; i < tmp.size(); i++){if (i && i % 50 == 0) cout << endl;cout << tmp[i];}cout << endl;//将结果放入文件中outfile.open("CodePrint.txt", ios::out);for (int i = 0; i < tmp.size(); i++){if (i % 50 == 0) outfile << endl;outfile << tmp[i];}outfile.close();}void Decode(){cout << "请输入需要解码文件的路径[输入Default将打开默认文件CodeFile.txt]" << endl;string in;cin >> in;if (in == "Default"){in = "CodeFile.txt";}cout << "请输入保存压缩后文件的路径[输入Default将打开默认文件TextFile.txt]" << endl;string out;cin >> out;if (out == "Default"){out = "TextFile.txt";}ifstream infile(in, ios::in);string ss;infile >> ss;//cout << "test:" << ss << endl;int i = 0;string sss;while (i < ss.size()){int t = x.root;while ((x.A[t].lson != 0 || x.A[t].rson != 0) && i < ss.size()){if (ss[i] == '0') t = x.A[t].lson;else t = x.A[t].rson;i++;}if (x.A[t].lson == 0 || x.A[t].rson == 0){sss = sss + (char)t;}}infile.close();cout << "解码后为:" << endl;cout << sss << endl;ofstream outfile(out,ios::out);outfile << sss << endl;outfile.close();}
};

测试代码

#include"Huffman.h"#include<iostream>using namespace std;int main()
{Huffman x;x.HuffmanDisplay();x.GenerateCode();x.Decode();}

测试结果

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/383651.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python3小知识

对于迭代器对象&#xff0c;Python默认赋值是将引用赋值&#xff0c;即指向同一片内存空间。为了实现对内存空间的赋值&#xff0c;我们可以使用分片进行深复制。例如&#xff1a; 当定义元组的时候&#xff0c;我们一般使用小括号将元素包围起来&#xff0c;也可以不使用括号…

汇编:实现日历星期数查询工具

编制一个简单日历查询工具&#xff0c;输入年、月、日&#xff0c;能够判断当日的星期数&#xff0c;并进行输出&#xff0c;数据的输入和结果的输出要有必要的提示&#xff0c;且提示独占一行。 查阅资料 ​ 经过查阅资料&#xff0c;发现有两个相关的算法可以解决这个问题&…

Linux C 实现一个简单的线程池

https://www.cnblogs.com/GyForever1004/p/9185240.html 线程池的定义 线程池是一种多线程处理形式&#xff0c;处理过程中将任务添加到队列&#xff0c;然后在创建线程后自动启动这些任务。线程池线程都是后台线程。每个线程都使用默认的堆栈大小&#xff0c;以默认的优先级…

斐波那契数列求解+尾递归

1.普通递归 这里观察f[4]的递归树代替f[10]的递归树&#xff08;后者比较大&#xff0c;画不下&#xff09;。 使用递归求解的时候复杂度为T(n)T(n−1)T(n−2)T(n)T(n-1)T(n-2)T(n)T(n−1)T(n−2)&#xff0c;观察递归树&#xff0c;发现降速最快的是最右边每次减2&#xff0c…

LCS最长公共子串

问题介绍 LCS问题(longest common subsequence problem)指的是求解两个字符串最长公共子序列问题。这里的子序列是可以不连续的。LCS问题广泛地出现在计算生物学中&#xff08;DNA序列、系统生成树等等&#xff09;。这里介绍如何解决LCS问题&#xff0c;以及算法的正确性证明…

操作系统【六】虚拟内存

传统存储管理方式的不足 一次性&#xff1a;作业必须一次性全部装入内存后才能开始运行。这会造成&#xff1a;当作也很大时不能全部装入内存&#xff1b;当大量作业要求运行时&#xff0c;由于内存无法容纳所有作业&#xff0c;因此只有少量作业能够运行&#xff0c;导致多道…

SQL Server【一】简介和基本概念和命令

数据结构和数据库的区别 数据库是应用软件级别研究数据的存储和操作&#xff08;主要针对磁盘上的数据&#xff09; 数据结构是在系统软件级别研究数据的存储和操作&#xff08;主要是针对内存中的数据&#xff09; 对硬盘数操作是数据库的强项&#xff0c;是数据库研究的核心…

Linux下网络socket编程——实现服务器(select)与多个客户端通信

一、关于socket通信 服务器端工作流程&#xff1a; 调用 socket() 函数创建套接字 用 bind() 函数将创建的套接字与服务端IP地址绑定调用listen()函数监听socket() 函数创建的套接字&#xff0c;等待客户端连接 当客户端请求到来之后调用 accept()函数接受连接请求&#xff0c…

SQL Server【四】

identity 主键自动增长&#xff0c;用户不需要为identity修饰的主键赋值 create table student (std_id int primary key identity(10,5),--(10,5)可以省略&#xff0c;默认为(1,1)std_name nvarchar(200) not null ) select * from student insert into student values (张三…

计算机网络【4】传输层

概述 传输层是只有主机才有的层次 传输层的功能&#xff1a; 传输层提供进程和进程之间的逻辑通信&#xff08;网络层提供主机与主机之间的逻辑通信&#xff09;复用和分用传输层对收到的报文进行差错检测 传输层有两个协议&#xff1a; 面向连接的传输层控制协议TCP&…

计算机网络【0】概述

计算机网络概念和功能 概念 是一个将分散的、具有独立功能的计算机系统&#xff0c;通过通信设备与线路连接起来&#xff0c;由功能完善的软件实现资源共享和信息传递的系统。 计算机网络是互连的、自治&#xff08;无主从关系&#xff09;的计算机集合。 功能 数据通信&am…

计算机网络【1】物理层

物理层解决如何在连接各种计算机的传输媒体上传输数据比特流&#xff0c;而不是指具体的传输媒体。 确定与传输媒体接口有关的特性 机械特性&#xff1a;定义物理连接的特性&#xff0c;如规格、接口形状、引线数目、引脚数目、排列电气特性&#xff1a;规定传输二进制位时的电…

计算机网路【2】数据链路层

结点&#xff1a;主机、路由器 链路&#xff1a;两个节点的物理通道 数据链路&#xff1a;逻辑通道&#xff0c;把实现 控制数据传输协议的硬件和软件加到链路上就构成数据链路 帧&#xff1a;链路层的协议数据单元&#xff0c;封装网络层数据报 数据链路层在物理层提供服务的…

计算机网络【5】应用层

应用层对应用程序的通信提供服务 应用层协议定义&#xff1a; 应用层的功能&#xff1a; 文件传输、访问和管理电子邮件虚拟终端查询服务和远程作业登录 重要协议&#xff1a;FTP、SMTP、POP3、HTTP、DNS 网络应用模型 客户/服务器模型&#xff08;Client/Server&#x…

操作系统【八】文件管理

文件&#xff1a;一组有意义的信息/数据集合 文件的属性&#xff1a; 文件名&#xff1a;由创建文件的用户决定文件名&#xff0c;主要是为了方便用户找到文件。同一个目录下不允许有重名文件标识符&#xff1a;一个系统内的个文件标识符唯一&#xff0c;对用户来说毫无可读性…

数据库原理及应用【六】数据库设计

数据依赖 函数依赖FD&#xff1a;一个属性或者一组属性的值可以决定另一个属性的值 多值依赖MVD&#xff1a;一个属性或者一组属性的值可以决定另一个属性的值的集合。FD是MVD的特例 符号表示&#xff1a;Name->->Course&#xff0c;课程多值依赖于姓名 连接依赖&#x…

数据库原理及应用【二】数据模型

层次模型 tree Record and fieldParent-Child relationship(PCR) 每个记录类型只有一个父节点 无法表达多对多信息 采用虚记录解决多对多 网状数据模型 系&#xff1a;主记录->属记录 主记录和属记录都可以有好多个 关系模型 表&#xff1a;table/relation 拥有更高的…

数据可视化【二】HTML+CSS+SVG+D3

HTML、CSS和SVG学习实现代码&#xff1a;https://vizhub.com/Edward-Elric233/89185eb96bc64a9d81777873a0ccd0b9 index.html <!DOCTYPE html> <html><head><title>Shapes with SVG and CSS</title><link rel"stylesheet" href&qu…

数据可视化【三】基本概念

Visualization is suitable when there is a need to augment human capabilities rather than replace people with computational decision-making methods. 当可以信赖的智能化的解决方案存在的时候&#xff0c;可视化是不必要的。 当不知道需要分析的问题是什么的时候&…

数据可视化【四】Bar Chart

Make a Bar Chart Representing a data table in JavaScriptCreating rectangles for each rowUsing linear and band scalesThe margin conventionAdding axes 以下学习内容参考博客&#xff1a;传送门 select()选择所有指定元素的第一个 selectAll()选择指定元素的全部 上…