前言
目前比较主流的两种转pdf的方式,就是pdfbox和icepdf,两种我都尝试了下,icepdf解析出来有时候会出现中文显示不出来,网上的解决方式又特别麻烦,不是安装字体,就是重写底层类,所以我选择了pdfbox
添加依赖
<dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>3.0.0</version>
</dependency>
代码
import org.apache.pdfbox.Loader;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.PDFRenderer;import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;
import java.nio.file.Files;
import java.nio.file.Paths;public class Main {public static void main(String[] args) throws Exception {// 加载pdf文件PDDocument doc = Loader.loadPDF(new File("data.pdf"));// 2.x版本的pdfbox写法// PDDocument doc = PDDocument.load(new File("data.pdf"));PDFRenderer renderer = new PDFRenderer(doc);// 遍历每页pdffor (int i = 0; i < doc.getNumberOfPages(); i++) {// dpi调到300左右即可,太小会模糊,太大会使图片变得很大BufferedImage image = renderer.renderImageWithDPI(i, 300);ImageIO.write(image, "jpg", Files.newOutputStream(Paths.get("data_" + i + ".jpg")));}}
}
在arm架构的linux上转换可能会出现模糊情况
在windows上好好的,x86_64的linux上也好好的,就是arm架构的linux上会出现
网上的博客基本上不是安装字体,就是重写底层类,但你永远不会想到是jdk的问题
解决办法:jdk8以上版本的jdk,或者使用高版本的jdk8,不能低于8u311即可
转换效果如下:
附上高版本的jdk8下载地址:https://www.oracle.com/java/technologies/downloads/#java8