利用赫夫曼编码进行数据解压

基本概念

在这里插入图片描述

代码实现

package com.atguigu.huffmancode;import com.sun.org.glassfish.external.statistics.CountStatistic;
import com.sun.org.glassfish.external.statistics.StringStatistic;import java.security.AlgorithmConstraints;
import java.util.*;/*** @创建人 wdl* @创建时间 2021/3/27* @描述*/
public class HuffmanCode {public static void main(String[] args) {String content="i like like like java do you like a java";byte[] contentBytes = content.getBytes();System.out.println(contentBytes.length);//40byte[] huffmanCodesBytes = huffmanZip(contentBytes);System.out.println("压缩后的结果"+Arrays.toString(huffmanCodesBytes)+huffmanCodesBytes.length);//测试一把byteToBitString方法byte[] sourceBytes = decode(huffmanCodes, huffmanCodesBytes);System.out.println(new String(sourceBytes));//
//        List<Node> nodes = getNodes(contentBytes);
//        System.out.println(nodes);
//
//        //测试一把,创建的二叉树
//        System.out.println("赫夫曼树");
//        Node huffmanTreeRoot = createHuffmanTree(nodes);
//        System.out.println("前序遍历");
//        huffmanTreeRoot.preOrder();
//
//        //测试一把是否生成了对应的赫夫曼编码
//        Map<Byte, String> huffmanCodes = getCodes(huffmanTreeRoot);
//        System.out.println("生成的赫夫曼编码表"+huffmanCodes);
//
//        //测试
//        byte[] huffmanCodeBytes = zip(contentBytes, huffmanCodes);
//        System.out.println(Arrays.toString(huffmanCodeBytes));//17//发送huffmanCodeBytes数组}//完成数据的解压//思路//1.将huffmanCodeBytes//重现先转成赫夫曼编码对应的二进制的字符串“0100000//2.、将“111"对照赫夫曼编码=》i like/**** @param huffmanCodes 哈夫曼编码表map* @param huffmanBytes 赫夫曼编码的到的字节数组* @return 原来的字符串对应的数组*///编写一个方法,完成对压缩数据的解码private static byte[] decode(Map<Byte,String> huffmanCodes,byte[] huffmanBytes){//1.先得到huffmanBytes 对应的二进制字符串StringBuilder stringBuilder = new StringBuilder();//将byte数组转成二进制的字符串编码for (int i = 0; i < huffmanBytes.length; i++) {byte b = huffmanBytes[i];//判断是不是最后一个字节boolean flag=(i==huffmanBytes.length-1);stringBuilder.append( byteToBitString(!flag,b));}//吧字符串按照指定的赫夫曼编码进行解码//把赫夫曼编码表进行调换,因为要反向查询Map<String, Byte> map = new HashMap<>();for(Map.Entry<Byte, String> entry:huffmanCodes.entrySet()){map.put(entry.getValue(),entry.getKey());}
//        System.out.println(map);//创建一个集合,存放byteArrayList<Byte> list = new ArrayList<>();for (int i = 0; i < stringBuilder.length();) {//i可以理解成就是一个索引,扫描stringBuilderint count=1;//小的计数器boolean flag=true;Byte b=null;while (flag){//递增的取出key 1//取出一个字符'1' '0'String key = stringBuilder.substring(i, i + count);//i不动,让count移动,直到匹配到一个字符b=map.get(key);if(b==null){//说明没有匹配到count++;}else {//匹配到flag=false;}}list.add(b);i+=count;//i直接移动到count}//for循环结束后,我们list中就存放了所有的字符"i like"//吧list中的数据放入到byte数组并返回byte[] b = new byte[list.size()];for (int i = 0; i < b.length; i++) {b[i]=list.get(i);}return b;}/*** 将一个byte转成一个二进制的字符串* @param b* @param flag 表示是否需要补高位,如果是true,表示需要补高位,如果是false表示不补,如果是最后一个字节,无需补高位* @return 是该b 对应的二进制的字符串,(注意是按补码返回)*/private static String byteToBitString(boolean flag,byte b){//使用变量保存bint temp=b;//b转成int//如果是正数我们还存在补高位的问题if(flag){temp|=256;}String str = Integer.toBinaryString(temp);//返回的是temp对应的二进制补码if(flag){return str.substring(str.length()-8);}else {return str;}}//使用一个方法,将前面的方法封装起来,便于我们的调用/**** @param bytes 原始的字符串对应的字节数组* @return 是经过赫夫曼编码处理后的子节数组(压缩后的数组)*/private static byte[] huffmanZip(byte[] bytes){List<Node> nodes = getNodes(bytes);//根据nodes创建赫夫曼树Node huffmanTreeRoot = createHuffmanTree(nodes);//生成了对应的赫夫曼编码Map<Byte, String> huffmanCodes = getCodes(huffmanTreeRoot);//根据生成的赫夫曼编码,压缩的到压缩后的赫夫曼编码字节数组byte[] huffmanCodeBytes = zip(bytes, huffmanCodes);return huffmanCodeBytes;}/**** @param bytes 这时原始的字符串对应的byte[]* @param huffmanCodes 生成的赫夫曼编码map* @return 返回赫夫曼编码表处理后的byte[]*///编写一个方法,将字符串对应的byte[]数组,通过生成的赫夫曼编码表,返回一个赫夫曼编码压缩有的byte[]private static byte[] zip(byte[] bytes,Map<Byte,String> huffmanCodes){//1.先利用huffmanCodes将bytes转成赫夫曼编码对应的字符串StringBuilder stringBuilder = new StringBuilder();//遍历bytes数组for(byte b:bytes){stringBuilder.append(huffmanCodes.get(b));}System.out.println("测试stringBuilder="+stringBuilder.toString());//将1010111011 转成byte数组//统计返回byte[] huffmanCodeBytes 长度//一句话 int len=(stringBuilder.length()+7)/8int len;if(stringBuilder.length()%8==0){len=stringBuilder.length()/8;}else {len=stringBuilder.length()/8+1;}//创建存储压缩有的byte[]byte[] huffmanCodeBytes=new byte[len];int index=0;//记录是第几个bytefor (int i = 0; i < stringBuilder.length(); i+=8) {//因为每8位对应一个byte,所以步长+8String strByte;if(i+8>stringBuilder.length()){//不够8位strByte = stringBuilder.substring(i);}else {strByte = stringBuilder.substring(i, i + 8);}//将strByte转成一个byte,放入到huffmanCodeByteshuffmanCodeBytes[index]= (byte) Integer.parseInt(strByte,2);index++;}return huffmanCodeBytes;}//生成赫夫曼树对应的赫夫曼编码//思路://1.将赫夫曼编码表存放在Map<Byte,String>形式static Map<Byte,String> huffmanCodes= new HashMap<Byte,String>();// 32->01 97->100...//2.在生成赫夫曼编码表示,需要去拼接璐姐,定义一个StringBuilder存储某个叶子结点的路径static  StringBuilder stringBuilder=new StringBuilder();//这里为了调用方便,我们重载getCodesprivate static Map<Byte,String> getCodes(Node root){if(root==null){return null;}//处理root的左子树getCodes(root.left,"0",stringBuilder);//处理root的右子树getCodes(root.right,"1",stringBuilder);return huffmanCodes;}/*** 功能:将传入的node节点的所有叶子节点的赫夫曼编码的到,并放入到huffmanCodes集合* @param node  传入节点* @param code 路径:左子节点是0,右子节点是1* @param stringBuilder 是用于拼接路径*/private static void getCodes(Node node,String code,StringBuilder stringBuilder){StringBuilder stringBuilder2 = new StringBuilder(stringBuilder);//将code加入到stringBuild2stringBuilder2.append(code);if(node!=null){//如果node==null不处理//判断当前node是叶子结点还是非叶子节点if(node.data==null){//非叶子节点//递归处理//向左getCodes(node.left,"0",stringBuilder2);//向右getCodes(node.right,"1",stringBuilder2);}else {//说明是一个叶子结点//表示找到了某个叶子节点的最后huffmanCodes.put(node.data,stringBuilder2.toString());}}}//前序遍历的方法private static void preOrder(Node root){if(root!=null){root.preOrder();}else {System.out.println("赫夫曼树为空");}}/**** @param bytes 接收字节数组* @return 返回的就是List形式*/private static List<Node> getNodes(byte[] bytes){//1.创建一个ArrayListArrayList<Node> nodes = new ArrayList<>();//遍历bytes 统计每一个byte出现的次数->map[key,value]HashMap<Byte, Integer> counts = new HashMap<>();for(byte b:bytes){Integer count=counts.get(b);if (count==null){//map中还没有这个字符数据,第一次counts.put(b,1);}else {counts.put(b,count+1);}}//把每一个键值对转成Node对象,并加入到nodes集合//遍历mapfor(Map.Entry<Byte,Integer> entry:counts.entrySet()){nodes.add(new Node(entry.getKey(),entry.getValue()));}return nodes;}//可以通过List创建对应的赫夫曼树private static Node createHuffmanTree(List<Node> nodes){while (nodes.size()>1){//排序,从小到大Collections.sort(nodes);//取出第一颗最小的二叉树Node leftNode = nodes.get(0);//取出第二颗最小的二叉树Node rightNode = nodes.get(1);//创建一颗新的二叉树,它的根节点没有data,只有权值Node parent=new Node(null,leftNode.weight+rightNode.weight);parent.left=leftNode;parent.right=rightNode;//将已经处理的两颗二叉树从nodes删除nodes.remove(leftNode);nodes.remove(rightNode);//将新的二叉树,加入到nodesnodes.add(parent);}//nodes最后的节点,就是哈夫曼树的根节点return nodes.get(0);}}//创建Node,待数据和权值
class Node implements Comparable<Node>{Byte data;//存放数据(字符)本身,比如'a'=>97 ' '=>32int weight;//权值,表示字符出现的次数Node left;Node right;public Node(Byte data, int weight) {this.data = data;this.weight = weight;}@Overridepublic int compareTo(Node o) {//从小到大排序return this.weight-o.weight;}@Overridepublic String toString() {return "Node{" +"data=" + data +", weight=" + weight +'}';}//前序遍历public void preOrder(){System.out.println(this);if(this.left!=null){this.left.preOrder();}if (this.right!=null){this.right.preOrder();}}}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/326718.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

检测窥屏_开挂、狙击、窥屏?乱象丛生的炉石狂野天梯,到底怎么了?

今日正文1 中午吃饭时&#xff0c;我第二十三次诱惑牌酱跟我一起去狂野玩&#xff0c;在他第二十三次拒绝后&#xff0c;我问他为什么&#xff0c;他放下了筷子看着我&#xff0c;只说了一个字&#xff1a;“乱”乱&#xff1f;嗯&#xff0c;想想最近的狂野&#xff0c;不论是…

.NET Core log4net 使用

log4net .NET Core 版使用&#xff0c;log4net 2.0.7版发布也有一段时间了&#xff0c;从2.0.6 版开始就已经支持.NET Core。 之前有介绍NLog .NET Core版的使用&#xff0c;ASP.NET Core 开发-Logging 使用NLog 写日志文件。 ASP.NET Core已经内置了日志支持,可以轻松输出到控…

用赫夫曼树进行文件的压缩

思路分析 代码实现 package com.atguigu.huffmancode;import com.sun.org.glassfish.external.statistics.CountStatistic; import com.sun.org.glassfish.external.statistics.StringStatistic;import javax.xml.bind.SchemaOutputResolver; import java.io.*; import java.s…

.NET跨平台之旅:博问站点迁移至ASP.NET Core on Linux并发布上线

Powered by ASP.NET Core on Linux&#xff01; 我们全站的 .NET Core 迁移工作如火如荼&#xff0c;这是我们今年上半年的重要工作。 今天我们终于完成了博问产品&#xff08;q.cnblogs.com&#xff09;向 ASP.NET Core 的迁移&#xff0c;并已发布上线。如果您在博问页面的页…

用赫夫曼树进行文件解压

思路分析 代码实现 package com.atguigu.huffmancode;import com.sun.org.glassfish.external.statistics.CountStatistic; import com.sun.org.glassfish.external.statistics.StringStatistic;import javax.xml.bind.SchemaOutputResolver; import java.io.*; import java.s…

python3 爬虫例子_如何让你写的爬虫速度像坐火箭一样快【并发请求】

开坑个新系列&#xff0c;主要面向新手&#xff0c;老司机可以忽略。这个系列内的文章将会让你知道如何做到让你写的爬虫在运行的时候速度能像火箭一样快&#xff01;很多初学爬虫的朋友对于这方面的知识似乎是空白的&#xff0c;甚至还有一些在爬虫岗位上工作了一两年的人也搞…

二叉排序树的删除+图解

图解 第一种情况 第二种情况 第三种情况 代码实现 package com.atguigu.binarysorttree;import com.sun.javafx.sg.prism.NGImageView; import javafx.scene.transform.Rotate;import java.io.InputStream; import java.util.Timer;/*** 创建人 wdl* 创建时间 2021/3/29* 描述…

如何一秒钟从头构建一个 ASP.NET Core 中间件

前言 其实地上本没有路&#xff0c;走的人多了&#xff0c;也便成了路。 -- 鲁迅 就像上面鲁迅说的那样&#xff0c;其实在我们开发中间件的过程中&#xff0c;微软并没有制定一些策略或者文档来约束你如何编写一个中间件程序&#xff0c; 但是其中却存在者一些最佳实践的方法&…

ssm(Spring+Spring mvc+mybatis)

在不久的之前我写了一篇ssh(SpringSpring mvchibernate)的文章&#xff0c;感兴趣的可以去这里看看~ 今天我来写一下ssm的增删改欧查案例&#xff1a; 数据库&#xff1a;mysql 浏览器&#xff1a;火狐浏览器 jdk&#xff1a;1.7 开发编辑器&#xff1a;myeclipse10.5 首…

C# winform程序免安装.net framework在XP/win7/win10环境运行

前文&#xff1a; 首先感谢群里的大神宇内流云 提供的anyexec for windows版本。 经过本人搭建虚拟机在xp环境 使用anyexec运行winfrom程序后&#xff0c;测试通过,如下是用的xp运行winfrom程序的部分截图 下面是n年前入坑C#写的winform。。。玩毒奶粉用的&#xff0c;勿喷。 .…

AVL树双旋转+图解

图解 代码实现 package com.atguigu.avl; /*** 创建人 wdl* 创建时间 2021/3/30* 描述*/ public class AVLTreeDemo {public static void main(String[] args) { // int[] arr{4,3,6,5,7,8};//创建一个AVLTree对象 // int arr[]{10,12,8,9,7,6};int[] arr{10,11…

[SSCore] 开源dotnet core 版本 SuperSocket

前言碎语 最近一直在做旧版本dotnet 程序迁移至dotnet core的工作, 非常欣慰dotnet社区的蓬勃发展, 目前大部分的第三方类库或开源代码都有了dotnet core版本 或者可以方便的找到替代方案. 这其中我唯一觉得遗憾的是dotnet 社区大名鼎鼎的socket 通讯框架SuperSocket SuperSock…

asp.net core mvc剖析:KestrelServer

KestrelServer是基于Libuv开发的高性能web服务器&#xff0c;那我们现在就来看一下它是如何工作的。在上一篇文章中提到了Program的Main方法&#xff0c;在这个方法里Build了一个WebHost&#xff0c;我们再来看一下代码&#xff1a; public static void Main( string [] args) …

win 7 mysql 1067_win7系统登陆MySQL服务出现1067错误的解决方法

很多小伙伴都遇到过win7系统登陆MySQL服务出现1067错误的困惑吧&#xff0c;一些朋友看过网上零散的win7系统登陆MySQL服务出现1067错误的处理方法&#xff0c;并没有完完全全明白win7系统登陆MySQL服务出现1067错误是如何解决的&#xff0c;今天小编准备了简单的解决办法&…

图的快速入门

快速入门案例 代码实现 package com.atguigu.graph;import java.util.ArrayList; import java.util.Arrays;/*** 创建人 wdl* 创建时间 2021/4/2* 描述*/ public class Graph {private ArrayList<String> vertexList;//存储顶点集合private int[][] edges;//存储图对应的…

.net core依赖注入的封装

现在流行的系统一般都采用依赖注入的实现方式&#xff0c;利用DI容器来直接获取所用到的类/接口的实例。.net core也一样采用DI的方式&#xff0c;提供了DI容器的接口IServiceCollection&#xff0c;并提供了基于该接口的缺省实现ServiceCollection。 这样我们就可以不再像以前…

图的深度优先遍历+图解

图解 代码实现 package com.atguigu.graph;import java.util.ArrayList; import java.util.Arrays;/*** 创建人 wdl* 创建时间 2021/4/2* 描述*/ public class Graph {private ArrayList<String> vertexList;//存储顶点集合private int[][] edges;//存储图对应的邻接矩阵…

Azure SQL的DTU和eDTU到底是个什么鬼

Azure SQL 使用了数据库事务单位 (DTU) 和弹性数据库事务单位 (eDTU)来作为一个计量单位。 但是DTU和eDTU是什么鬼啊? 官方文档这样解释 DTU 是一个资源度量单位&#xff0c;表示保证可用于单一数据库服务层内特定性能级别的单个 Azure SQL 数据库的资源。 DTU是一定比例的 C…

2015蓝桥杯省赛---java---B---1(三角形面积)

题目 三角形面积 解法 数学方法&#xff0c;直接求三角形的面积 88 - (82)/2 - (46)/2 - (84)/2 64 - (81216) 64 - 36 28 答案 28

深入理解Async/Await

C# 5 Async/Await 语法特性&#xff0c;极大地简化了异步编程&#xff0c;但我们知道&#xff0c;异步编程的基本原理并没有发生根本改变。也就是说&#xff0c;当一些复杂的东西看起来很简单时&#xff0c;它通常意味着有一些有趣的事情在背后发生。在计算机程序设计语言领域&…