SpringBoot使用poi将word转换为PDF并且展示

1.前言

由于最近做了一个需求,界面上有一个按钮,点击按钮后将一个文件夹中的word文档显示在页面中,并且有一个下拉框可以选择不同的文档,选择文档可以显示该文档。这里我选择使用fr.opensagres.poi.xwpf.converter.pdf-gae依赖包来实现。

2.依赖

这里我只依赖了这些依赖包

        <dependency><groupId>fr.opensagres.xdocreport</groupId><artifactId>fr.opensagres.poi.xwpf.converter.pdf-gae</artifactId><version>2.0.1</version></dependency><!-- Apache PDFBox 依赖用于.docx转PDF --><dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>3.0.0</version> <!-- 根据最新版本调整 --></dependency>

3.代码

Java代码部分,这里我使用了两个文件夹中的文档

package com.hxgis.controller;import java.io.File;
import java.io.FileInputStream;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.Arrays;
import java.util.Collections;
import java.util.Comparator;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.util.stream.Collectors;import fr.opensagres.poi.xwpf.converter.pdf.PdfConverter;
import fr.opensagres.poi.xwpf.converter.pdf.PdfOptions;
import org.springframework.core.io.ByteArrayResource;
import org.springframework.core.io.Resource;
import org.springframework.http.ResponseEntity;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
//import org.apache.poi.xwpf.converter.pdf.PdfOptions;
//import org.apache.poi.xwpf.converter.pdf.PdfConverter;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;/*** ClassName: DocumentController* Package: com.hxgis.controller* Description:** @Author dhn* @Create 2024/1/31 11:56* @Version 1.0*/
@RestController
@RequestMapping("/api/document")
public class DocumentController {private final String MONTH_PATH = "D:/ftp_data/month"; // 修改为你的文档存储路径private final String QUARTER_PATH = "D:/ftp_data/quarter"; // 修改为你的文档存储路径//    private final String MONTH_PATH = "/home/geli/hbnyWeatherReport/month"; // 修改为你的文档存储路径
//    private final String QUARTER_PATH = "/home/geli/hbnyWeatherReport/quarter"; // 修改为你的文档存储路径@GetMapping("/monthLatest")public ResponseEntity<Resource> getDocument(@RequestParam(required = false) String name) throws IOException {File folder = new File(MONTH_PATH);File[] files = folder.listFiles((dir, filename) -> filename.endsWith(".docx"));if (files == null || files.length == 0) {return ResponseEntity.notFound().build();}File fileToConvert;if (name != null && !name.isEmpty()) {// 用户选择了特定的文件fileToConvert = Arrays.stream(files).filter(file -> file.getName().equals(name)).findFirst().orElse(null);} else {// 没有特定选择,找最新的文件Pattern pattern = Pattern.compile("(\\d{4})年(\\d{2})月风光资源趋势预测\\.docx");fileToConvert = Arrays.stream(files).filter(file -> pattern.matcher(file.getName()).matches()).max(Comparator.comparingInt(file -> {Matcher matcher = pattern.matcher(file.getName());if (matcher.find()) {int year = Integer.parseInt(matcher.group(1));int month = Integer.parseInt(matcher.group(2));return year * 100 + month;}return 0;})).orElse(null);}if (fileToConvert == null) {return ResponseEntity.notFound().build();}// 以下为文件转换为PDF的代码try (XWPFDocument document = new XWPFDocument(new FileInputStream(fileToConvert));ByteArrayOutputStream out = new ByteArrayOutputStream()) {PdfOptions options = PdfOptions.create();PdfConverter.getInstance().convert(document, out, options);byte[] pdfContent = out.toByteArray();ByteArrayResource resource = new ByteArrayResource(pdfContent);return ResponseEntity.ok().contentLength(pdfContent.length).header("Content-type", "application/pdf").body(resource);}}@GetMapping("/quarterLatest")public ResponseEntity<Resource> quarterLatest(@RequestParam(required = false) String name) throws IOException {File folder = new File(QUARTER_PATH);File[] files = folder.listFiles((dir, filename) -> filename.endsWith(".docx"));if (files == null || files.length == 0) {return ResponseEntity.notFound().build();}File fileToConvert;if (name != null && !name.isEmpty()) {// 用户选择了特定的文件fileToConvert = Arrays.stream(files).filter(file -> file.getName().equals(name)).findFirst().orElse(null);} else {// 没有特定选择,找最新的文件Pattern pattern = Pattern.compile("(\\d{4})年(?:\\d{2})月-(\\d{4})年(?:\\d{2})月风光资源趋势预测\\.docx|" +"(\\d{4})年(?:\\d{2})-(\\d{2})月风光资源趋势预测\\.docx");fileToConvert = Arrays.stream(files).filter(file -> pattern.matcher(file.getName()).matches()).max(Comparator.comparingInt(file -> {Matcher matcher = pattern.matcher(file.getName());if (matcher.find()) {if (matcher.group(1) != null) {// 处理跨年文件名int yearStart = Integer.parseInt(matcher.group(1));int yearEnd = Integer.parseInt(matcher.group(2));return yearEnd * 100 + (matcher.group(4) != null ? Integer.parseInt(matcher.group(4)) : 0);} else if (matcher.group(3) != null) {// 处理同一年文件名int year = Integer.parseInt(matcher.group(3));int monthEnd = Integer.parseInt(matcher.group(4));return year * 100 + monthEnd;}}return 0;})).orElse(null);}if (fileToConvert == null) {return ResponseEntity.notFound().build();}// 文件转换为PDF的代码try (XWPFDocument document = new XWPFDocument(new FileInputStream(fileToConvert));ByteArrayOutputStream out = new ByteArrayOutputStream()) {PdfOptions options = PdfOptions.create();PdfConverter.getInstance().convert(document, out, options);byte[] pdfContent = out.toByteArray();ByteArrayResource resource = new ByteArrayResource(pdfContent);return ResponseEntity.ok().contentLength(pdfContent.length).header("Content-type", "application/pdf").body(resource);}}@GetMapping("/monthList")public List<String> listAllDocs() {File folder = new File(MONTH_PATH);// 修改为获取.docx文件File[] files = folder.listFiles((dir, name) -> name.endsWith(".docx"));if (files == null) {return Collections.emptyList();}// 返回文件名列表return Arrays.stream(files).map(File::getName).collect(Collectors.toList());}@GetMapping("/quarterList")public List<String> quarterList() {File folder = new File(QUARTER_PATH);// 修改为获取.docx文件File[] files = folder.listFiles((dir, name) -> name.endsWith(".docx"));if (files == null) {return Collections.emptyList();}// 返回文件名列表return Arrays.stream(files).map(File::getName).collect(Collectors.toList());}}

前端代码html代码,使用两个按钮,点击后弹出模态框,在模态框中有iframe来展示pdf:

<!-- 模态框(Modal) -->
<div class="modal fade" id="pdfModalMonth" tabindex="-1" role="dialog" aria-labelledby="pdfModalLabelMonth" aria-hidden="true"><div class="modal-dialog" style="max-width: 90%; width: auto;"><div class="modal-content"><div class="modal-header"><h4 class="modal-title" id="pdfModalLabelMonth">月度预测文档</h4><button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">&times;</span></button></div><div class="modal-body"><!-- 下拉框用于选择文档 --><select id="MonthList" class="form-control"><option value="">请选择文档</option><!-- 文档列表将在这里填充 --></select><iframe id="MonthViewer" style="width:100%; height:700px;"></iframe> <!-- 可以根据需要调整高度 --></div><div class="modal-footer"><button type="button" class="btn btn-default" data-dismiss="modal">关闭</button></div></div></div>
</div><div class="modal fade" id="pdfModalQuarter" tabindex="-1" role="dialog" aria-labelledby="pdfModalLabelQuarter" aria-hidden="true"><div class="modal-dialog" style="max-width: 90%; width: auto;"><div class="modal-content"><div class="modal-header"><h4 class="modal-title" id="pdfModalLabelQuarter">月度预测文档</h4><button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">&times;</span></button></div><div class="modal-body"><!-- 下拉框用于选择文档 --><select id="QuarterList" class="form-control"><option value="">请选择文档</option><!-- 文档列表将在这里填充 --></select><iframe id="QuarterViewer" style="width:100%; height:700px;"></iframe> <!-- 可以根据需要调整高度 --></div><div class="modal-footer"><button type="button" class="btn btn-default" data-dismiss="modal">关闭</button></div></div></div>
</div>
<a class="btn btn-sm btn-primary" id="loadMonth"  style="text-decoration: none;color: #ffffff">月度预测</a><a class="btn btn-sm btn-primary" id="loadQuarter"  style="text-decoration: none;color: #ffffff">季度预测</a>

js代码:

$(document).ready(function() {// 加载月度列表function loadMonthList() {$.get("/api/document/monthList", function(data) {// 清空现有的选项$("#MonthList").empty();$("#MonthList").append('<option value="">请选择文档</option>');// 假设文档名包含日期,例如 "2024年01月风光资源趋势预测.docx"// 对文档进行倒序排序data.sort(function(a, b) {// 转换为日期格式进行比较var dateA = new Date(a.split('年')[0], a.split('年')[1].split('月')[0] - 1);var dateB = new Date(b.split('年')[0], b.split('年')[1].split('月')[0] - 1);return dateB - dateA; // 从新到旧排序});// 添加新的选项data.forEach(function(doc) {$("#MonthList").append('<option value="' + doc + '">' + doc + '</option>');});});}// 当点击加载最新文档的按钮时$("#loadMonth").click(function() {loadMonthList(); // 调用函数加载文档列表// 加载最新的PDF文档$("#MonthViewer").attr("src", "/api/document/monthLatest");// 显示模态框$("#pdfModalMonth").modal("show");});// 当选择不同的文档时$("#MonthList").change(function() {var selectedFile = $(this).val();if(selectedFile) {$("#MonthViewer").attr("src", "/api/document/monthLatest?name=" + encodeURIComponent(selectedFile));}});// 加载季度列表function parseDateFromDocName(docName) {var year, month;var parts = docName.match(/(\d{4})年(\d{2})-(\d{2})月|(\d{4})年(\d{2})月-(\d{4})年(\d{2})月/);if (parts) {if (parts[1]) {// 格式是 "YYYY年MM-DD月"year = parseInt(parts[1], 10);month = parseInt(parts[2], 10); // 使用开始月份} else {// 格式是 "YYYY年MM月-YYYY年MM月"year = parseInt(parts[4], 10);month = parseInt(parts[5], 10); // 使用开始月份}}return new Date(year, month - 1); // JavaScript中的月份是从0开始的}function loadQuarterList() {$.get("/api/document/quarterList", function(data) {// 清空现有的选项$("#QuarterList").empty();$("#QuarterList").append('<option value="">请选择文档</option>');// 对文档进行倒序排序data.sort(function(a, b) {var dateA = parseDateFromDocName(a);var dateB = parseDateFromDocName(b);return dateB - dateA; // 从新到旧排序});// 添加新的选项data.forEach(function(doc) {$("#QuarterList").append('<option value="' + doc + '">' + doc + '</option>');});});}// 当点击加载最新文档的按钮时$("#loadQuarter").click(function() {loadQuarterList(); // 调用函数加载文档列表// 加载最新的PDF文档$("#QuarterViewer").attr("src", "/api/document/quarterLatest");// 显示模态框$("#pdfModalQuarter").modal("show");});// 当选择不同的文档时$("#QuarterList").change(function() {var selectedFile = $(this).val();if(selectedFile) {$("#QuarterViewer").attr("src", "/api/document/quarterLatest?name=" + encodeURIComponent(selectedFile));}});
});

4.遇到的问题

做完一切后,发现有些文档中的标题的中文没有显示出来,我就对比显示的文档和没显示的文档,发现是因为字体的原因,宋体是可以显示出来的,但是宋体(中文)显示不出来。把宋体(中文)改成宋体就可以显示。
但是这只是我windows系统上运行是没问题的,我把项目部署到服务器(centos)后,发现中文一点都展示不出来,这时候我就很纳闷,为什么在windows上能显示出来,linux上显示不出来,经过查阅资料,我发现是由于Linux上缺乏一些中文字体,例如宋体、仿宋等,这些字体是我文档中用到的字体,所以下一步我要将windows中的字体放在服务器上。

5.在Linux中安装宋体

在Linux系统中安装宋体(SimSun)字体,需要手动下载字体文件或从Windows系统中复制字体文件,然后将其安装到Linux系统中。宋体不包含在开源字体包中,因为它是微软的商业字体。下面是一般步骤:

  1. 从Windows复制:如果你有访问Windows系统的权限,可以从C:\Windows\Fonts目录找到simsun.ttc(宋体)和其他中文字体文件,并将其复制到你的Linux系统中。
  2. 在Linux系统上安装字体一般有以下几个步骤:
    1. 创建字体目录(如果尚不存在)
sudo mkdir -p /usr/share/fonts/chinese
  1. 将字体文件复制到创建的目录中,假设你已经将simsun.ttc字体文件复制到了Linux系统的某个位置(例如~/Downloads),运行以下命令将其移动到字体目录:
sudo cp ~/Downloads/simsun.ttc /usr/share/fonts/chinese/
  1. 更新字体缓存,安装完字体后,需要更新字体缓存,以便系统识别新安装的字体:
sudo fc-cache -fv
  1. 安装后,你可以使用fc-list命令确认字体是否已正确安装:
fc-list | grep "simsun"

至此,大功告成!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/660751.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CoroNa Green acetoxymethyl (AM) ester,具有良好的细胞膜穿透能力

CoroNa Green, AM, Cell Permeant&#xff0c;CoroNa Green acetoxymethyl (AM) ester&#xff0c;CoroNa Green, AM&#xff0c;Sodium indicator 钠离子指示剂&#xff08;荧光探针&#xff09;&#xff0c;具有良好的细胞膜穿透能力&#xff0c;能够检测到细胞内钠离子的微小…

带大家详细了解msvcr120.dll丢失的原因,msvcr120.dll丢失怎样修复的方法

在使用电脑和运行应用程序时&#xff0c;我们经常会遇到与动态链接库&#xff08;Dynamic Link Library, DLL&#xff09;文件相关的错误。其中之一是 "msvcr120.dll 丢失" 的错误提示。今天我们就来详细的了解一下msvcr120.dll这个文件和分享msvcr120.dll丢失怎样修…

【目标检测】对DETR的简单理解

【目标检测】对DETR的简单理解 文章目录 【目标检测】对DETR的简单理解1. Abs2. Intro3. Method3.1 模型结构3.2 Loss 4. Exp5. Discussion5.1 二分匹配5.2 注意力机制5.3 方法存在的问题 6. Conclusion参考 1. Abs 两句话概括&#xff1a; 第一个真正意义上的端到端检测器最…

stm32--simulink开发之--timer的学习,硬件输入中断,触发事件,STM32通用定时器之输出比较模式与PWM模式(重要理解)

下面三个模块&#xff0c;一个比一个高级&#xff0c;当然使用是越来越简单 STM32F4xx系列控制器有2个高级控制定时器、10个通用定时器和2个基本定时器(推荐学习) 1&#xff0c;第一个模块&#xff1a;Timer Starts timer counter and provides current counter value Timer …

vivado 与系统设计师接口

与系统设计师接口 作为迭代I/O和时钟规划过程的一部分&#xff0c;您可以交换有关AMD设备通过导出CSV文件和IBIS模型&#xff0c;与PCB或系统设计者进行引脚连接。根据PCB或设计规范的变化&#xff0c;您可能需要将引脚重新导入为如定义和配置I/O端口中所述。完成I/O和时钟中的…

uniapp H5 px转换rpx

uniapp H5 px转换rpx 安装 px2rpx 重启 HBuilderX在要转换的文件 点击右键 点击 开启px2rpx(1px转成2rpx) 开启成功&#xff01;使用 编辑页面后 按下键盘 Ctrl s 保存&#xff01;转化成功&#xff01;当然 你也需要对使用的插件 进行转换&#xff01;否则可能导致样式出现…

51单片机温湿度数据管理系统

51单片机温湿度数据管理系统 1.硬件准备 开发板&#xff1a;51单片机 显示&#xff1a;lcd1602 温湿度模块&#xff1a;DHT11 通信模块&#xff1a;HC-08蓝牙 2.代码实现 uart.c #include "reg52.h" #include "config.h" #include <string.h>sf…

排序之计数排序

꒰˃͈꒵˂͈꒱ write in front ꒰˃͈꒵˂͈꒱ ʕ̯•͡˔•̯᷅ʔ大家好&#xff0c;我是xiaoxie.希望你看完之后,有不足之处请多多谅解&#xff0c;让我们一起共同进步૮₍❀ᴗ͈ . ᴗ͈ აxiaoxieʕ̯•͡˔•̯᷅ʔ—CSDN博客 本文由xiaoxieʕ̯•͡˔•̯᷅ʔ 原创 CSDN …

简述MinewSemi的GNSS模块引领体育与健康科技革新

体育与健康科技领域的创新一直在推动人们更健康、更活跃的生活方式。创新微公司的GNSS模块正成为这一变革的关键推动力。本文将深入研究MinewSemi的GNSS模块在体育和健康追踪领域的创新应用&#xff0c;探讨其如何帮助个体更全面地了解和改善自己的身体状态。 1. 个性化运动轨迹…

爬什么值得买的榜单——爬虫练习题目一(问)

爬虫题目你敢试试吗&#xff1f; 引言具体原因网站思路总体 我让AI给个框架1. **项目初始化与依赖安装**2. **定义数据模型**3. **网络请求模块**4. **页面解析模块**5. **数据存储模块**6. **主程序流程** 结尾 引言 最近在做什么呢 建立一套完整的信息输入输出系统 在我上一…

从0搭建一个springboot web系统

要从头开始搭建一个Spring Boot Web系统&#xff0c;你需要遵循以下步骤&#xff1a; 安装Java开发环境&#xff08;JDK&#xff09;和Maven&#xff08;构建工具&#xff09;。创建一个新的Maven项目。在项目的pom.xml文件中添加Spring Boot相关依赖。创建一个主类&#xff0…

Vue之状态管理的简单使用(事件总线(Event Bus),Vuex和若依前端示例)

文章目录 Vue之状态管理的简单使用&#xff08;事件总线&#xff08;Event Bus&#xff09;&#xff0c;Vuex和若依前端示例&#xff09;Vue之事件总线&#xff08;Event Bus&#xff09;的简单使用Vuex进行状态管理的简单使用若依前端代码store状态管理&#xff1a; Vue之状态…

云原生时代下,操作系统生态的挑战与机遇

在云计算快速发展的背景下&#xff0c;服务器操作系统的产业升级&#xff0c;不再局限于物理服务器层面&#xff0c;市场边界扩张&#xff0c;人工智能、大数据、云计算等新技术的发展也对操作系统的灵活度和智能化提出新的要求。在 2023 龙蜥操作系统大会上&#xff0c;龙蜥社…

pytorch学习笔记(十二)

以下代码是以CIFAR10这个10分类的图片数据集训练过程的完整的代码。 训练部分 train.py主要包含以下几个部件&#xff1a; 准备训练、测试数据集用DateLoader加载两个数据集&#xff0c;要设置好batchsize创建网络模型&#xff08;具体模型在model.py中&#xff09;设置损失函…

深入了解C++:底层编译原理

进程的虚拟空间划分 任何编程语言&#xff0c;都会产生两样东西&#xff0c;指令和数据。 .exe程序运行的时候会从磁盘被加载到内存中&#xff0c;但是不能直接加载到物理内存中。Linux会给当前进程分配一块空间&#xff0c;比如x86 32位linux环境下会给进程分配2^32(4G)大小…

vue3页面跳转产生白屏,刷新后能正常展示的解决方案

可以依次检查以下问题&#xff1a; 1.是否在根组件标签最外层包含了个最大的div盒子包裹内容。 2.看看是否在template标签下面直接有注释&#xff0c;如果有需要把注释写到div里面。&#xff08;即根标签下不要直接有注释&#xff09; 3.在router-view 中给路由添加key标识。 …

c# cass10 获取宗地内所有封闭线段的面积

获取面积的主要流程如下&#xff1a; 获取当前AutoCAD应用中的活动文档、数据库和编辑器对象。创建一个选择过滤器&#xff0c;限制用户只能选择"宗地"图层上的LWPOLYLINE对象作为外部边界。提示用户根据上述规则进行实体选择&#xff0c;并获取选择结果。检查用户是…

前端下载导出文件流,excel/word/pdf/zip等

** 一、导入导出接口增加responseType:‘blob’ ** axios({url: 接口,method: post,data&#xff1a;{},responseType: blob });二、导出方法封装 //data 文件流 //fileName 文件名称 /* mineType 文件类型例如&#xff1a;* 下载 Excel : "application/vnd.m…

(附源码)ssm 招聘信息管理系统-计算机毕设 78049

ssm 招聘客户管理系统 摘 要 由于数据库和数据仓库技术的快速发展&#xff0c;招聘客户管理系统建设越来越向模块化、智能化、自我服务和管理科学化的方向发展。招聘客户系统对处理对象和服务对象&#xff0c;自身的系统结构&#xff0c;处理能力&#xff0c;都将适应技术发展的…

逃避自由是所有成长的前提

《逃避自由》是埃里希弗洛姆的一部重要作品&#xff0c;首次出版于1941年。该书主要探讨了现代人在面对自由和独立时所表现出的逃避倾向。在这部作品中&#xff0c;弗洛姆分析了自由的心理学基础&#xff0c;并论证了自由不仅仅是一个政治和经济的概念&#xff0c;更是一个深刻…