java gzip 解压文件_Java实现文件压缩与解压[zip格式,gzip格式]

原文:http://www.cnblogs.com/visec479/p/4112881.html#3069573

Java实现ZIP的解压与压缩功能基本都是使用了Java的多肽和递归技术,可以对单个文件和任意级联文件夹进行压缩和解压,对于一些初学者来说是个很不错的实例。

zip扮演着归档和压缩两个角色;gzip并不将文件归档,仅只是对单个文件进行压缩,所以,在UNIX平台上,命令tar通常用来创建一个档案文件,然后命令gzip来将档案文件压缩。

Java I/O类库还收录了一些能读写压缩格式流的类。要想提供压缩功能,只要把它们包在已有的I/O类的外面就行了。这些类不是Reader和Writer,而是InputStream和OutStreamput的子类。这是因为压缩算法是针对byte而不是字符的。

相关类与接口:

Checksum 接口:被类Adler32和CRC32实现的接口

Adler32 :使用Alder32算法来计算Checksum数目

CRC32 :使用CRC32算法来计算Checksum数目

CheckedInputStream :InputStream派生类,可得到输入流的校验和Checksum,用于校验数据的完整性

CheckedOutputStream :OutputStream派生类,可得到输出流的校验和Checksum, 用于校验数据的完整性

DeflaterOutputStream :压缩类的基类。

ZipOutputStream :DeflaterOutputStream的一个子类,把数据压缩成Zip文件格式。

GZIPOutputStream :DeflaterOutputStream的一个子类,把数据压缩成GZip文件格式

InflaterInputStream :解压缩类的基类

ZipInputStream :InflaterInputStream的一个子类,能解压缩Zip格式的数据

GZIPInputStream :InflaterInputStream的一个子类,能解压缩Zip格式的数据

ZipEntry 类:表示 ZIP 文件条目

ZipFile 类:此类用于从 ZIP 文件读取条目

使用ZIP对多个文件进行压缩与解压

Java对Zip格式类库支持得比较全面,得用它可以把多个文件压缩成一个压缩包。这个类库使用的是标准Zip格式,所以能与很多的压缩工具兼容。

ZipOutputStream类有设置压缩方法以及在压缩方式下使用的压缩级别,zipOutputStream.setMethod(int method)设置用于条目的默认压缩方法。只要没有为单个 ZIP 文件条目指定压缩方法,就使用ZipOutputStream所设置的压缩方法来存储,默认值为 ZipOutputStream.DEFLATED(表示进行压缩存储),还可以设置成STORED(表示仅打包归档存储)。ZipOutputStream在设置了压缩方法为DEFLATED后,我们还可以进一步使用setLevel(int level)方法来设置压缩级别,压缩级别值为0-9共10个级别(值越大,表示压缩越利害),默认为Deflater.DEFAULT_COMPRESSION=-1。当然我们也可以通过条目ZipEntry的setMethod方法为单个条件设置压缩方法。

类ZipEntry描述了存储在ZIP文件中的压缩文件。类中包含有多种方法可以用来设置和获得ZIP条目的信息。类ZipEntry是被ZipFile[zipFile.getInputStream(ZipEntry entry)]和ZipInputStream使用来读取ZIP文件,ZipOutputStream来写入ZIP文件的。有以下这些有用的方法:getName()返回条目名称、isDirectory()如果为目录条目,则返回 true(目录条目定义为其名称以 '/' 结尾的条目)、setMethod(int method) 设置条目的压缩方法,可以为 ZipOutputStream.STORED 或 ZipOutputStream .DEFLATED。

下面实例我们使用了apache的zip工具包(所在包为ant.jar ),因为java类型自带的不支持中文路径,不过两者使用的方式是一样的,只是apache压缩工具多了设置编码方式的接口,其他基本上是一样的。另外,如果使用org.apache.tools.zip.ZipOutputStream来压缩的话,我们只能使用org.apache.tools.zip.ZipEntry来解压,而不能使用java.util.zip.ZipInputStream来解压读取了,当然apache并未提供ZipInputStream类。

文件压缩:

48304ba5e6f9fe08f3fa1abda7d326ab.png

package gizAction;

import java.io.*;

import java.util.zip.*;

/**

* @author Dana·Li

*

* 程序实现了ZIP压缩[compression]

*

* 大致功能包括用了多态,递归等JAVA核心技术,可以对单个文件和任意级联文件夹进行压缩和解压。 需在代码中自定义源输入路径和目标输出路径。

*

* 在本段代码中,实现的是压缩部分

*/

public class ZipCompressing {

private int k = 1; // 定义递归次数变量

private void zip(String zipFileName, File inputFile) throws Exception {

System.out.println("压缩中...");

ZipOutputStream out = new ZipOutputStream(new FileOutputStream(zipFileName));

BufferedOutputStream bo = new BufferedOutputStream(out);

zip(out, inputFile, inputFile.getName(), bo);

bo.close();

out.close(); // 输出流关闭

System.out.println("压缩完成");

}

private void zip(ZipOutputStream out, File f, String base,

BufferedOutputStream bo) throws Exception { // 方法重载

if (f.isDirectory()){

File[] fl = f.listFiles();

if (fl.length == 0){

out.putNextEntry(new ZipEntry(base + "/")); // 创建zip压缩进入点base

System.out.println(base + "/");

}

for (int i = 0; i < fl.length; i++) {

zip(out, fl[i], base + "/" + fl[i].getName(), bo); // 递归遍历子文件夹

}

System.out.println("第" + k + "次递归");

k++;

} else {

out.putNextEntry(new ZipEntry(base)); // 创建zip压缩进入点base

System.out.println(base);

FileInputStream in = new FileInputStream(f);

BufferedInputStream bi = new BufferedInputStream(in);

int b;

while ((b = bi.read()) != -1) {

bo.write(b); // 将字节流写入当前zip目录

}

bi.close();

in.close(); // 输入流关闭

}

}

/**

* 测试

* @param args

*/

public static void main(String[] args) {

ZipCompressing book = new ZipCompressing();

try {

book.zip("F:\\ziptest.zip",new File("F:\\ziptest"));

} catch (Exception e) {

e.printStackTrace();

}

}

}

48304ba5e6f9fe08f3fa1abda7d326ab.png

5b54e2bc88b37fa33fb48031d129f843.png

文件解压:

48304ba5e6f9fe08f3fa1abda7d326ab.png

package gizAction;

import java.io.BufferedInputStream;

import java.io.BufferedOutputStream;

import java.io.File;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.util.zip.ZipEntry;

import java.util.zip.ZipInputStream;

/**

* @author Dana·Li

*

* 程序实现了ZIP解压[decompression]

*

* 大致功能包括用了多态,递归等JAVA核心技术,可以对单个文件和任意级联文件夹进行压缩和解压。 需在代码中自定义源输入路径和目标输出路径。

*

* 在本段代码中,实现的是解压部分;

*/

public class zipDecompressing {

public static void main(String[] args) {

// TODO Auto-generated method stub

long startTime=System.currentTimeMillis();

try {

ZipInputStream Zin=new ZipInputStream(new FileInputStream(

"F:\\ziptest.zip"));//输入源zip路径

BufferedInputStream Bin=new BufferedInputStream(Zin);

String Parent="F:\\ziptest\\"; //输出路径(文件夹目录)

File Fout=null;

ZipEntry entry;

try {

while((entry = Zin.getNextEntry())!=null && !entry.isDirectory()){

Fout=new File(Parent,entry.getName());

if(!Fout.exists()){

(new File(Fout.getParent())).mkdirs();

}

FileOutputStream out=new FileOutputStream(Fout);

BufferedOutputStream Bout=new BufferedOutputStream(out);

int b;

while((b=Bin.read())!=-1){

Bout.write(b);

}

Bout.close();

out.close();

System.out.println(Fout+"解压成功");

}

Bin.close();

Zin.close();

} catch (IOException e) {

e.printStackTrace();

}

} catch (FileNotFoundException e) {

e.printStackTrace();

}

long endTime=System.currentTimeMillis();

System.out.println("耗费时间: "+(endTime-startTime)+" ms");

}

}

48304ba5e6f9fe08f3fa1abda7d326ab.png

e6b06e9f895a4febc85e3af93e16ecb7.png

用GZIP进行对单个文件压缩

GZIP的接口比较简单,因此如果你只需对一个流进行压缩的话,可以使用它。当然它可以压缩字符流,与可以压缩字节流,下面是一个对GBK编码格式的文本文件进行压缩的。

压缩类的用法非常简单;只要用GZIPOutputStream 或ZipOutputStream把输出流包起来,再用GZIPInputStream 或ZipInputStream把输入流包起来就行了。剩下的都是些普通的I/O操作。

48304ba5e6f9fe08f3fa1abda7d326ab.png

import java.io.BufferedOutputStream;

import java.io.BufferedReader;

import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.InputStreamReader;

import java.util.zip.GZIPInputStream;

import java.util.zip.GZIPOutputStream;

public class GZIPcompress {

public static void main(String[] args) throws IOException {

//做准备压缩一个字符文件,注,这里的字符文件要是GBK编码方式的

BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(

"e:/tmp/source.txt"), "GBK"));

//使用GZIPOutputStream包装OutputStream流,使其具体压缩特性,最后会生成test.txt.gz压缩包

//并且里面有一个名为test.txt的文件

BufferedOutputStream out = new BufferedOutputStream(new GZIPOutputStream(

new FileOutputStream("test.txt.gz")));

System.out.println("开始写压缩文件...");

int c;

while ((c = in.read()) != -1) {

/*

* 注,这里是压缩一个字符文件,前面是以字符流来读的,不能直接存入c,因为c已是Unicode

* 码,这样会丢掉信息的(当然本身编码格式就不对),所以这里要以GBK来解后再存入。

*/

out.write(String.valueOf((char) c).getBytes("GBK"));

}

in.close();

out.close();

System.out.println("开始读压缩文件...");

//使用GZIPInputStream包装InputStream流,使其具有解压特性

BufferedReader in2 = new BufferedReader(new InputStreamReader(

new GZIPInputStream(new FileInputStream("test.txt.gz")), "GBK"));

String s;

//读取压缩文件里的内容

while ((s = in2.readLine()) != null) {

System.out.println(s);

}

in2.close();

}

}

48304ba5e6f9fe08f3fa1abda7d326ab.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/303508.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

来看一场 AI 重建的 3D 全息世界杯比赛!

世界杯来了&#xff01;央视名嘴白岩松调侃 “俄罗斯世界杯&#xff0c;中国除了足球队没去&#xff0c;其他的都去了”&#xff0c;这届世界杯&#xff0c;中国球迷购买球票的数量在所有国家中排名第 9&#xff0c;可见球迷对世界杯的热情。那么&#xff0c;除了准备好小龙虾在…

编译Linux 2.6内核

编译内核易如反掌。让人叹为观止的是&#xff0c;这实际上比编译和安装像glibc这样的系统级组伴还要简单。2.6内核提供了一套新工具&#xff0c;使编译内核更加容易&#xff0c;比早期发布的内核有了长足的进步。 2.3.1 配置内核 因为Linux源码随手可得&#xff0c;那就意味着在…

获取父线程 java_java子线程中获取父线程的threadLocal中的值

我们都知道线程本地变量表也就是ThreadLocal在我们做线程级的数据隔离时非常好用&#xff0c;但是有时候我们会想如何让子线程获取到父线程的ThreadLocal&#xff0c;其实在线程中除了ThreadLocal外还有InheritableThreadLocal&#xff0c;顾名思义&#xff0c;可继承的线程变量…

源码分享,送你一份Google Python class源码

几年前&#xff0c;Google推出Python课堂。Google Python课堂:https://developers.google.com/edu/python/小编也整理了一下Google Python课堂的源码&#xff0c;里面有四个例子。logpuzzle这个例子主要是利用urllib模块做一个图片拼接的小游戏,主要是从一大堆的网页里面解析分…

用YARP当网关

Yarp是微软开源的一个用.net实现的反向代理工具包&#xff0c;github库就叫reverse-proxy&#xff08;反向代理&#xff09;&#xff08;吐槽一下微软起名字233333&#xff09;nuget包preview9之前都叫Microsoft.ReverseProxy&#xff0c;preview10变成Yarp.ReverseProxy了放上…

从生物神经网络到人工神经网络

如今提及人工智能&#xff0c;大家期待的一定是某种可以“学习”的方法&#xff0c;这种方法使用数学模型从数据中获取模式的某种表示。在众多“学习”方法中&#xff0c;获得最多关注&#xff0c;承载最多期望的非“神经网络”莫属。既然我们将这种数学方法称作神经网络&#…

很遗憾,我们正在逐渐丧失专注阅读的能力

这是头哥侃码的第238篇原创最近生活没什么规律&#xff0c;睡得晚&#xff0c;起得早&#xff0c;似乎除了工作之外&#xff0c;其余所有的节奏都有点乱了。前几天去体检&#xff0c;没想到像我这样的 “老司机”&#xff0c;居然会忘记 “要空腹” 的规定&#xff0c;愣是在体…

陶哲轩的10岁与30岁

Terence Tao&#xff08;陶哲轩&#xff09;&#xff0c;1975年7月17日出生于澳大利亚Adelaide&#xff08;阿德莱德&#xff09;。本讲话作于1985年上半年&#xff0c;即陶哲轩尚未满10周岁时所作&#xff0c;一个稚气儿童&#xff0c;给大学生和教授们作报告&#xff0c;少见…

NET问答: 重写了 Equals,还有必要重写 GetHashCode 吗?

咨询区 David Basarab&#xff1a;直入主题&#xff0c;参考如下代码&#xff1a;public class Foo {public int FooId { get; set; }public string FooName { get; set; }public override bool Equals(object obj){Foo fooItem obj as Foo;if (fooItem null) {return false;…

如果编程替换成中文就会怎样? 程序员看了表示头疼

首先大概的看一下中文编码&#xff1a;你以为会写中文就会编程吗&#xff1f;这就像你以为会写汉字就会写出好文章一样。编程是和机器沟通&#xff0c;因此要用机器的语言而不是人类的语言。最早的程序就是0和1的数字&#xff0c;不是中文也不是英文。以前的程序员&#xff0c;…

使用visio 2016 绘制画UML时序图(Sequence Diagram)

什么是时序图&#xff1f;时序图(Sequence Diagram)&#xff0c;又名序列图、循序图&#xff0c;是一种UML交互图。它通过描述对象之间发送消息的时间顺序显示多个对象之间的动态协作。让我们来看一看Visio2016对时序图的的解释。时序图的元素我们在画时序图时会涉及到7种元素&…

网页颜色搭配

兼职请上猪八戒网站转载于:https://blog.51cto.com/ayyzddq/598474

数字化诗人:这可能是第一位用算法写诗的诺贝尔文学奖得主

一位英国教授发现&#xff0c;一些优秀的诗人早在20世纪60年代就开始使用编码算法来写诗了。著名作家J.M.Coetzee&#xff0c;在早期的英国超级计算机上开发了创作诗歌的软件当我们回顾历史上探索科技应用的人才时&#xff0c;通常不会想到英语教授。但是伦敦国王学院现代文学博…

在asp.net core中使用的验证框架FluentValidation

FluentValidation在asp.net core中怎么使用&#xff1f;先安装包。Install-Package FluentValidation.AspNetCore和上一篇的实体类和验证类一样。实体类&#xff1a;public class Person {public int Id { get; set; }public string Name { get; set; }public string Tel { get…

【EFCORE笔记】异步查询工作原理注释标记

异步查询 当在远程数据库中执行查询时&#xff0c;同步查询可能会阻止当前线程&#xff0c;异步查询可避免阻止线程&#xff0c;这有助于避免冻结户端界面&#xff0c; 异步操作还可以增加 Web 应用程序的吞吐量&#xff0c;可以在数据库操作完成前释放线程去处理其他请求。EF …

CSS日常公用样式与一些解决方案

一、自己总结的公用样式解析html, body, div, p, ul, li, dl, dt, dd, h1, h2, h3, h4, h5, h6, form, input, select, button, textarea, iframe, table, th, td { margin: 0; padding: 0; }img { border: 0 none; vertical-align: top; }ul, li { list-style-type: none; }h1…

上班族吐槽大集合:那些发生在公司的傻X奇遇

“明明不需要加班&#xff0c;到了点却偏偏没人起身走。”—— 小爱“头脑风暴&#xff0c;人越多效率越低下&#xff0c;最后风暴出来的东西也很难落实。”—— 好奇心“只是申请个办公用品&#xff0c;需要人事处签字&#xff0c;行政部签字&#xff0c;总监签字&#xff0c;…

C# 9 record 并非简单属性 POCO 的语法糖

最近升级专案到大统一 .NET 5 并使用 C#9 语法尝试改写套件,发现之前以为 record 只是简单属性 POCO 的简化语法糖的认知是错误。另外因为 POCO 属于需定义口语词&#xff0c;这边在本文定义简单属性 POCO 为 public class 类别 {public string ID{get;set}/*略*/} 只有属性的简…

java实现思维导图_Java并发(思维导图)

1&#xff0c;线程状态转换无限期等待&#xff1a;限期等待&#xff1a;线程生命流程&#xff1a;2&#xff0c;实现方式代码实现样例【三种方式】&#xff1a;packagecom.cnblogs.mufasa.demo2;importjava.util.concurrent.Callable;public class test1_Runnable implementsRu…

这本免费小书,带你征服 GitHub!

GitHub 漫游指南&#xff0c;一本有趣又通俗的 GitHub 教程&#xff0c;想要成为 star 之王么&#xff1f;今天给大家分享一份通俗易懂的 GitHub 学习教程&#xff0c;即《GitHub 漫游指南》。看过了不下十套 GitHub 教程了&#xff0c;小编愿称它为最强&#xff01;虽然没有 G…