Java 自带MD5 校验文件

http://www.iteye.com/topic/1127319

 

前天第一次发表博客到论坛,关于Java文件监控一文,帖子地址在:http://www.iteye.com/topic/1127281

评论的朋友很多,下载代码的朋友很不少,感谢在论坛上看我帖子的朋友,还有回复评论的朋友,给我提供建议的朋友。

 

从这些建议中,虽然语言简短,但是却有的是一语中的,这里说一下一下关于帖子的代码中HashFile中的MD5文件校验算法,

该算法是使用Java自带的MessageDigest类,测试结果,获取一个2G文件的MD5码,耗时 971秒,这效率太给力了,可以用坑爹来形容,所以用MD5文件校验码来判断文件是否被修改,对于小文件来说可能还合适,要是对大文件来说,好吧,撞墙死了算了!

 

HashFile中的代码是这样子的:

import java.io.FileInputStream;
import java.io.InputStream;
import java.security.MessageDigest;

public class HashFile { 
 
    /**
     * @param args
     */ 
    public static char[] hexChar = { '0', '1', '2', '3', '4', '5', '6', '7', 
            '8', '9', 'a', 'b', 'c', 'd', 'e', 'f' };
 
    public static String getHash(String fileName, String hashType) 
            throws Exception { 
        InputStream fis; 
        fis = new FileInputStream(fileName); 
        byte[] buffer = new byte[1024]; 
        MessageDigest md5 = MessageDigest.getInstance(hashType); 
        int numRead = 0; 
        while ((numRead = fis.read(buffer)) > 0) { 
            md5.update(buffer, 0, numRead); 
        } 
        fis.close(); 
        return toHexString(md5.digest()); 
    } 
 
    public static String toHexString(byte[] b) { 
        StringBuilder sb = new StringBuilder(b.length * 2); 
        for (int i = 0; i < b.length; i++) { 
            sb.append(hexChar[(b[i] & 0xf0) >>> 4]); 
            sb.append(hexChar[b[i] & 0x0f]); 
        } 
        return sb.toString(); 
    } 

测试结果:


真给力啊,超过2G,效率变成这样 !

好吧,自带的MD5算法,上当了,对于检查文件是否更新这个问题来说,现在我使用的解决办法是File 类的lastModified方法,代码这样

private String getHash(String fp){
  File file = new File(fp);
  return String.valueOf(file.lastModified());
 }

 通过比较文件的最后修改时间来判断文件是否更新,对大文件也轻松拿下,

测试结果是这样:



 当然针对不同问题肯定是有不同的解决办法

 

分析原来HashFile代码,获取MD5校验码的瓶颈是出现在

Java代码 复制代码 收藏代码
  1. public static String getHash(String fileName, String hashType)     
  2.             throws Exception {     
  3.         InputStream fis;     
  4.         fis = new FileInputStream(fileName);     
  5.         byte[] buffer = new byte[1024];     
  6.         MessageDigest md5 = MessageDigest.getInstance(hashType);     
  7.         int numRead = 0;     
  8.         while ((numRead = fis.read(buffer)) > 0) {  //瓶颈   
  9.             md5.update(buffer, 0, numRead);     
  10.         }     
  11.         fis.close();     
  12.         return toHexString(md5.digest());     
  13.     }    
public static String getHash(String fileName, String hashType)  throws Exception {  InputStream fis;  fis = new FileInputStream(fileName);  byte[] buffer = new byte[1024];  MessageDigest md5 = MessageDigest.getInstance(hashType);  int numRead = 0;  while ((numRead = fis.read(buffer)) > 0) {  //瓶颈md5.update(buffer, 0, numRead);  }  fis.close();  return toHexString(md5.digest());  }  

 在上面代码中,while循环N次,2G的文件,循环1024 * 1024  * 2 次,不给力!

 

chimer回复

来个nio的简单版,看你们老是怀疑java慢

C++ MD5工具验证结果:

File: K:\Games\World of Warcraft\Data\common.MPQ
Size: 2226587191 bytes
Modified: 2008年11月19日 星期三, 12:57:24
MD5: CD9F9C5523F3BA3866B81CCC74ED6476


java运行结果,毫秒
耗时:12672,cd9f9c5523f3ba3866b81ccc74ed6476


核心代码

String hashType = "MD5";
  FileInputStream fStream = null;
  try {
   MessageDigest md5 = MessageDigest.getInstance(hashType);
   fStream = new FileInputStream(
     //"K:\\Games\\World of Warcraft\\Scan.dll");
     //"K:\\Games\\World of Warcraft\\Data\\patch-3.MPQ");
     "K:\\Games\\World of Warcraft\\Data\\common.MPQ");
   FileChannel fChannel = fStream.getChannel();
   ByteBuffer buffer = ByteBuffer.allocate(8*1024);
   long s = System.currentTimeMillis();
   for ( int count = fChannel.read( buffer ); count !=-1 ; count = fChannel.read( buffer )
    ) {
    buffer.flip();
    md5.update( buffer );
    if( !buffer.hasRemaining() ){
     //System.out.println("count:"+count);
     buffer.clear();
    }
   }
   s = System.currentTimeMillis() - s;
   System.out.println( "耗时:"+s+","+getString( md5.digest() ) );
   
  } catch (NoSuchAlgorithmException e) {
   e.printStackTrace();
  } catch (FileNotFoundException e) {
   e.printStackTrace();
  } catch (IOException e) {
   e.printStackTrace();
  }finally{
   try {
    if( fStream!=null )
     fStream.close();
   } catch (IOException e) {
    e.printStackTrace();
   }
  }

转载于:https://www.cnblogs.com/yangyudexiaobai/p/4452776.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/375105.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

决策树资料汇总

2012年8月26日决策树&#xff08;Decision tree&#xff09;决策树是以实例为基础的归纳学习算法。它从一组无次序、无规则的元组中推理出决策树表示形式的分类规则。它采用自顶向下的递归方式&#xff0c;在决策树的内部结点进行属性值的比较&#xff0c;并根据不同的属性值从…

metasploitable2渗透测试

一、系统弱密码登录 1、在kali上执行命令行telnet 192.168.26.129 2、Login和password都输入msfadmin 3、登录成功&#xff0c;进入系统 4、测试如下&#xff1a; 二、MySQL弱密码登录&#xff1a; 1、在kali上执行mysql –h 192.168.26.129 –u root 2、登录成功&#…

Portainer.io:让容器管理变得更加直观

在现代软件开发和部署中&#xff0c;容器化技术已经变得越来越流行。Docker 是其中一种领先的容器化平台&#xff0c;而 Portainer.io 则是一个优秀的管理工具&#xff0c;使得 Docker 的使用变得更加简单和可视化。本文将介绍 Portainer.io 的基本功能和如何在 Docker 上安装和…

python开发的一些tips

1. Notepad编写python脚本 1&#xff09;新建文件&#xff0c;编写代码 2&#xff09;点击菜单栏&#xff0c;“语言”—>“P”—>“Python”&#xff0c;设置脚本为Python语言的高亮&#xff08;这样保存文本的时候&#xff0c;Notepad也可以自动识别文件类型为.py&…

metasploitable3渗透测试

1、攻击windows服务器漏洞 用nmap对网段进行扫描nmap -sP 192.168.123 在进行IP扫描 发现Windows服务器漏洞 步骤: msfconsole---进入渗透模块

以前写的一个下载小说的工具

因为当时发现只有一个站点有。但是时时联网的要求太让人不爽。就写了一个给全下下来了。 用到了: 1. 正则表达式&#xff0c;分析章节和内容&#xff1b; 2. 线程池下载&#xff0c;并且对下载中的相关超时做了一些处理&#xff1b; 3. 文件生成与写入&#xff0c;注意格式问题…

数学之路-python计算实战(14)-机器视觉-图像增强(直方图均衡化)

我们来看一个灰度图像&#xff0c;让表示灰度出现的次数&#xff0c;这样图像中灰度为 的像素的出现概率是是图像中全部的灰度数&#xff0c; 是图像中全部的像素数, 实际上是图像的直方图&#xff0c;归一化到 。把 作为相应于 的累计概率函数, 定义为&#xff1a;是图像的…

Windows2008的安装

点击下一步 点击安装 选择第三个&#xff0c;点击下一步 点击下一步 点自定义安装 我在这里分两个盘并格式化 接下来就是等待安装完成即可

redhat linux7.0的安装

选择第一个 我选择中文 点击开始安装 设置root用户密码 完成如上图所示 我在网上找了一个redhat7.0镜像供大家使用 链接&#xff1a;https://pan.baidu.com/s/1WhG8BGZTZawDKTNlaAvzRg 提取码&#xff1a;uzpd

VMware虚拟机安装

创建新的虚拟机&#xff1a;在 VMWare 中创建虚拟机&#xff0c;要求设置内存大小为 1G&#xff0c;CPU 为 2&#xff0c;硬盘大小自行选择&#xff0c;网络连接采用 NAT 模式&#xff0c;其他保持默认即可 上面是安装啥系统就选啥系统 下一步 下一步 磁盘大小按自己需求来

二叉树算法:中序、后序推导先序(数组递归实现 【*模板】)

中根序列和后根序列重建二叉树 描述我们知道如何按照三种深度优先次序来周游一棵二叉树&#xff0c;来得到中根序列、前根序列和后根序列。反过来&#xff0c;如果给定二叉树的中根序列和后根序 列&#xff0c;或者给定中根序列和前根序列&#xff0c;可以重建一二叉树。本题输…

Windows主机安全加固

Windows主机安全加固 账户安全 更名administrator本地用户并禁用guest账户步骤: 点击“开始”,找到“管理工具”,点击里面的“计算机管理”,找到“本地用户和组”

JS笔记 入门第四

小测试:注意:取消所有的设定可以直接使用document.getElementById("txt").removeAttribute("style");这个是个神奇的东西.<!DOCTYPE HTML><html><head><meta http-equiv"Content-Type" Content"text/html; charsetutf…

数论神题——进击的羊角兽

数论神题 进击的羊角兽 题目描述&#xff1a; 求满足 \(ab|ab(a,b \leq n,a \neq b)\)的有序数对\((a,b)\)的个数。 solution 设\((a,b)d , (a < b \leq n)\),则$ axd , byd , ( x < y )$ \(ab|ab\) \((xy)d|xyd^2\) \(\because (xy, x)1,(xy, y)1\) \(\therefore (xy)|d…

靶场练习第一天~vulnhub靶场之Me-and-My-Girlfriend-1

兄弟们第一天打vulnhub靶场&#xff0c;我kali连靶场ip都扫不到&#xff0c;泪奔了&#xff0c;不说了开整 注意&#xff1a; vm虚拟机里面的编辑下面的虚拟机网络编辑器&#xff0c;把除了NAT模式外的模式&#xff0c;其他模式不启动。 至于为什么要这样操作&#xff0c;感觉…

靶场练习第二天~vulnhub靶场之 THE PLANETS: EARTH

前期准备&#xff1a; 靶机下载链接: https://pan.baidu.com/s/1_w8OZOPVsQaojq2rnKcdRA 提取码: gguw kali攻击机ip&#xff1a;192.168.101.10 靶机地址&#xff1a;192.168.101.101 一、信息收集 1.nmap扫描 因为kali与靶机在同一个网段下&#xff0c;使用nmap 192.168…

测试与封装5.1

我的队友是52吴舒婷&#xff0c;博客内容主要是白盒黑盒的测试数据分析 我们通过简单的四则运算来进行程序的测试与封装 我们主要完成的是事情 &#xff08;1&#xff09;封装&#xff1a;将运算要运用的方法进行封装 文件主要有三个&#xff1a;Calculate&#xff08;存放运算…

springmvc学习笔记--mybatis--使用插件自动生成实体和mapper

由于表对象在开发过程中会增删字段&#xff0c;有时候需要重新生成实体和对应的mapper&#xff0c;这时候可以通过mybatis的插件的生成。 优点是快速简洁&#xff0c;缺点同样很明显&#xff1a;覆盖。因此&#xff0c;通常是在第一次搭建框架的时候使用&#xff0c;因为开发过…

靶场练习第三天~vulnhub靶场之narak

靶机下载链接: https://pan.baidu.com/s/1GxcSL6efwd0GcbY45WsD0A 提取码: dhr5 一、信息收集 1.使用namp 192.168.101.0/24扫描该网段的地址&#xff0c;寻找靶机IP 2.直接访问192.168.101.102 3.进行目录扫描&#xff0c;dirb目录扫描工具&#xff08;kali自带的&#xff…

靶场练习第四天~vulnhub靶场之Lazysysadmin

靶机下载链接: https://pan.baidu.com/s/1MMkgaYLRc78YX4s6nvqdjQ 提取码: djpm 信息收集 查看kali的IP 使用nmap 192.168.101.0/24 探测靶机IP 发现开放445端口&#xff0c;并且开放的服务microsoft-ds。可以用enum4linux工具来扫描共享文件&#xff0c;使用方法: enum4linux…