MD5(Message-Digest Algorithm 5)是一种常用的哈希函数,用于生成一个128位(16字节)的哈希值(散列值),用于验证数据完整性。MD5求校验和的原理可以分为以下几个步骤:
1. 填充(Padding)
首先,将输入消息填充到长度满足 448 mod 512
(即长度对512取模后等于448)。填充方式是先加一个1
,然后加若干个0
,直到满足长度条件。最后,将消息的原始长度以64位表示,附加到消息末尾。填充后的消息长度总是512的倍数。
2. 初始化MD缓冲区
MD5算法使用四个32位的变量来存储中间结果和最终结果,分别是:A, B, C, D。初始值为:
A = 0x67452301
B = 0xEFCDAB89
C = 0x98BADCFE
D = 0x10325476
3. 处理消息分块
消息被分割成长度为512位(64字节)的分块,每个分块进一步被分割成16个32位的小块。对于每个分块,MD5进行64轮的处理,每轮使用不同的非线性函数、常数和当前分块中的一个子块。
4. MD5的四个非线性函数
MD5使用四个非线性函数,分别是:
F(X,Y,Z) = (X & Y) | (~X & Z)
G(X,Y,Z) = (X & Z) | (Y & ~Z)
H(X,Y,Z) = X ^ Y ^ Z
I(X,Y,Z) = Y ^ (X | ~Z)
5. 主循环
对于每一个512位的分块,执行以下步骤:
- 复制A, B, C, D到a, b, c, d
- 执行64次操作,每次操作更新a, b, c, d的值
每次操作包括:
- 将a, b, c, d与当前分块中的一个子块、一个常数和一个非线性函数的结果相加
- 将结果循环左移若干位
- 更新a, b, c, d的值
操作结束后,将a, b, c, d的值分别加到A, B, C, D中。
6. 输出
所有的分块处理完毕后,A, B, C, D的值即为消息的MD5校验和。这四个32位的变量连接在一起,形成一个128位的哈希值。
总结
MD5通过一系列复杂的位操作和非线性函数,将输入消息变换成一个固定长度的哈希值。尽管MD5算法曾经被广泛使用,但由于其碰撞和安全性问题,目前在安全领域中,SHA-256等更强的哈希函数逐渐取代了MD5。然而,MD5仍然在一些非安全应用中使用,例如文件完整性校验。
下面是一个用Java实现计算文件MD5校验和的示例代码:
import java.io.FileInputStream;
import java.io.InputStream;
import java.security.MessageDigest;public class MD5Checksum {public static void main(String[] args) {try {String filePath = "path/to/your/file";String checksum = getMD5Checksum(filePath);System.out.println("MD5 Checksum: " + checksum);} catch (Exception e) {e.printStackTrace();}}public static String getMD5Checksum(String filePath) throws Exception {// 创建MD5算法实例MessageDigest md = MessageDigest.getInstance("MD5");// 创建文件输入流InputStream fis = new FileInputStream(filePath);// 创建缓冲区byte[] buffer = new byte[1024];int bytesRead;// 读取文件并更新MD5摘要while ((bytesRead = fis.read(buffer)) != -1) {md.update(buffer, 0, bytesRead);}// 关闭文件输入流fis.close();// 获取最终的MD5摘要字节数组byte[] mdBytes = md.digest();// 将字节数组转换为十六进制字符串StringBuilder hexString = new StringBuilder();for (byte mdByte : mdBytes) {String hex = Integer.toHexString(0xff & mdByte);if (hex.length() == 1) {hexString.append('0');}hexString.append(hex);}return hexString.toString();}
}