前言
iText作为一个功能强大、灵活且广泛应用的PDF处理工具,在实际项目中发挥着重要作用。通过这些文章,读者可以深入了解如何利用iText进行PDF的创建、编辑、加密和提取文本等操作,为日常开发工作提供了宝贵的参考和指导。
掌握iText:轻松处理PDF文档-基础篇-CSDN博客
掌握iText:轻松处理PDF文档-进阶篇-CSDN博客
掌握iText:轻松处理PDF文档-高级篇-添加水印-CSDN博客
掌握iText:轻松处理PDF文档-高级篇-加密和解密-CSDN博客
需求描述
给pdf文档加密和解密
iText的依赖
在maven的pom.xml中配置:
这里需要注意的是:增加了一个java的加密库,即bcprov-jdk15on。
bcprov-jdk15on是一个Java加密库,它提供了用于加密、解密、签名、验证和其他安全操作的API和实现。它是由Bouncy Castle项目提供的,旨在扩展Java的加密功能。
该库支持多种加密算法和协议,包括对称加密(如AES、DES)、非对称加密(如RSA、DSA)、哈希函数(如SHA-1、SHA-256)以及数字签名(如PKCS#7、CMS)。此外,它还提供了对X.509证书的支持,可以用于处理与数字证书相关的操作。
<dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.5.13.3</version>
</dependency>
<dependency><groupId>com.itextpdf</groupId><artifactId>itext-asian</artifactId><version>5.2.0</version>
</dependency>
<dependency><groupId>org.bouncycastle</groupId><artifactId>bcprov-jdk15on</artifactId><version>1.68</version>
</dependency>
加密
- 创建一个空白的Document对象,该对象用于创建PDF文档。
- 创建PdfWriter对象,用于将文档内容写入到PDF文件中,并指定输出文件路径("e:/pdf-test/test-v4.pdf")。
- 使用PdfWriter的setEncryption方法设置加密算法和用户/所有者密码。其中,"yzxa001"是用户/所有者密码,PdfWriter.ALLOW_PRINTING表示允许打印文档,PdfWriter.ENCRYPTION_AES_128 | PdfWriter.DO_NOT_ENCRYPT_METADATA表示使用AES-128位加密算法,并且不加密文档的元数据。
- 打开文档。
- 向文档中添加一个段落,内容为"This is an encrypted PDF document."。
- 关闭文档。
这段代码的目的是创建一个加密的PDF文档,并向文档中添加一些内容。通过使用PdfWriter的setEncryption方法,可以对PDF文档进行加密,设置用户/所有者密码以及加密算法和权限。
需要注意的是,这里使用的是AES-128位加密算法,允许打印文档,但不加密文档的元数据。如果需要其他加密选项,请参考相关文档。
@Test
public void test4() {Document document = new Document();try {// 设置加密算法和用户/所有者密码PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("e:/pdf-test/test-v4.pdf"));writer.setEncryption("yzxa001".getBytes(), "yzxa001".getBytes(),PdfWriter.ALLOW_PRINTING, PdfWriter.ENCRYPTION_AES_128 | PdfWriter.DO_NOT_ENCRYPT_METADATA);document.open();// 添加一些内容到文档中document.add(new Paragraph("This is an encrypted PDF document."));document.close();} catch (DocumentException | IOException e) {e.printStackTrace();}}
加密后效果:
解密
- 创建了一个PdfReader对象pdfReader,用于读取指定路径的PDF文件。在创建PdfReader对象时,使用了密码"yzxa001".getBytes()进行解密。
- 获取PDF文件的总页数,并保存到变量numberOfPages中。
- 使用for循环遍历PDF文件的每一页,从每一页中提取文本内容。
- 使用PdfTextExtractor.getTextFromPage方法从每一页中提取文本,并将提取的文本内容打印到控制台上。
- 如果在读取PDF文件时发生IOException异常,将其转换为RuntimeException并抛出。
总体来说,这段代码的目的是读取加密的PDF文件"e:/pdf-test/test-v4.pdf",并使用指定的密码进行解密,然后逐页提取文本内容并输出到控制台。
@Test
public void test5() {try {String fileName = "e:/pdf-test/test-v4.pdf";PdfReader pdfReader = new PdfReader(fileName, "yzxa001".getBytes());int numberOfPages = pdfReader.getNumberOfPages();for (int i = 0; i < numberOfPages; i++) {String text = PdfTextExtractor.getTextFromPage(pdfReader, i + 1);System.out.println(text);}} catch (IOException e) {throw new RuntimeException(e);}
}