Apache POI与easyExcel:Excel文件导入导出的技术深度分析

在处理Excel文件时,Java开发者经常会面临多种选择,其中Apache POI和easyExcel是两个非常受欢迎的选择。这两个库都提供了强大的Excel文件处理功能,但在性能、内存使用、API设计以及扩展性方面有所不同。本文将深入分析Apache POI和easyExcel在导入导出Excel文件时的技术特点和使用体验。

一、Apache POI:全面但重量级的解决方案

  • Apache POI是一个历史悠久且功能全面的开源项目,用于处理Microsoft Office格式文件,包括Excel。它提供了对Excel文件读写操作的全面支持,在处理Excel文件时,POI通过HSSF和XSSF两个子项目分别支持.xls和.xlsx格式。HSSF针对的是旧版的二进制Excel格式,而XSSF则是为新版的基于XML的Excel格式设计的。

  • 在导入Excel文件时,Apache POI会将整个文件加载到内存中,然后提供API来访问和操作文件中的各个元素,如单元格、行、列等。这种处理方式在处理小型文件时非常有效,因为它允许开发者以任意方式访问文件内容。然而,随着文件大小的增加,内存消耗也会急剧增长,这可能导致性能下降甚至内存溢出。

  • 导出Excel文件时,Apache POI同样需要将所有数据加载到内存中,然后一次性写入文件。这种方式在处理大量数据时可能会变得非常缓慢,并且需要大量的内存资源。

1.1 POI实现读取excel

下面是一演示如何使用 Apache POI 导入(读取)和导出(写入)Excel 文件(.xlsx 格式)

<dependency>  <groupId>org.apache.poi</groupId>  <artifactId>poi</artifactId>  <version>5.2.0</version>  
</dependency>  
<dependency>  <groupId>org.apache.poi</groupId>  <artifactId>poi-ooxml</artifactId>  <version>5.2.0</version>  
</dependency>

开一个Excel文件、读取数据,并将内容打印到控制台上:

import org.apache.poi.ss.usermodel.*;  
import org.apache.poi.xssf.usermodel.XSSFWorkbook;  import java.io.File;  
import java.io.FileInputStream;  
import java.io.IOException;  public class ExcelReaderExample {  public static void main(String[] args) {  // 指定要读取的Excel文件路径  String filePath = "path/to/your/excel/file.xlsx";  // 使用FileInputStream打开文件  try (FileInputStream fis = new FileInputStream(new File(filePath))) {  // 创建工作簿对象  Workbook workbook = new XSSFWorkbook(fis);  // 获取第一个工作表(Sheet),索引从0开始  Sheet sheet = workbook.getSheetAt(0);  // 遍历工作表的每一行  for (Row row : sheet) {  // 遍历行中的每一个单元格  for (Cell cell : row) {  // 读取单元格内容并打印到控制台  System.out.print(getCellValue(cell) + "\t");  }  // 每读取完一行后换行  System.out.println();  }  // 工作完成,关闭工作簿(实际上在这个例子中不需要,因为使用了try-with-resources)  // workbook.close();  } catch (IOException e) {  // 处理文件读取过程中可能出现的异常  e.printStackTrace();  }  }  // 辅助方法:根据单元格类型获取单元格的值  private static String getCellValue(Cell cell) {  DataFormatter formatter = new DataFormatter(); // 创建一个格式化对象,用于处理各种数据类型  return formatter.formatCellValue(cell); // 返回格式化后的单元格内容  }  
}

请注意,getCellValue方法使用DataFormatter类来确保无论单元格包含何种类型的数据(如数字、日期或文本),都能以合适的格式返回其字符串表示形式。

1.2 poi实现写入excel

当使用Apache POI写入.xlsx格式的Excel文件时,您需要创建一个XSSFWorkbook对象来表示整个工作簿,然后在其中创建XSSFSheet对象来表示工作表。接下来,您可以在工作表中创建行和单元格,并设置它们的值。最后,将工作簿写入到文件系统中。

import org.apache.poi.ss.usermodel.*;  
import org.apache.poi.xssf.usermodel.XSSFWorkbook;  import java.io.FileOutputStream;  
import java.io.IOException;  public class ExcelWriterExample {  public static void main(String[] args) {  // 创建一个新的工作簿  Workbook workbook = new XSSFWorkbook();  // 创建一个工作表(Sheet),命名为"MySheet"  Sheet sheet = workbook.createSheet("MySheet");  // 在工作表中创建行(从0开始计数)  Row row = sheet.createRow(0);  // 在行中创建单元格(从0开始计数),并设置值  Cell cell = row.createCell(0);  cell.setCellValue("Hello");  // 创建另一个单元格,并设置值  Cell cell2 = row.createCell(1);  cell2.setCellValue("World");  // 也可以链式地创建行和单元格  sheet.createRow(1).createCell(0).setCellValue("Apache");  sheet.getRow(1).createCell(1).setCellValue("POI");  // 写入到文件系统  try (FileOutputStream fos = new FileOutputStream("path/to/your/excel/file.xlsx")) {  workbook.write(fos);  } catch (IOException e) {  e.printStackTrace();  }  // 关闭工作簿(在这个例子中不需要,因为使用了try-with-resources)  // workbook.close();  System.out.println("Excel file written successfully.");  }  
}

二、easyExcel:轻量级且高效的Excel处理工具

  • easyExcel是阿里巴巴开源的一个轻量级且高效的Excel处理框架。它针对大型Excel文件的处理进行了优化,采用了流式处理的方式,允许开发者逐行读写数据,从而大大降低了内存消耗。在导入Excel文件时,easyExcel使用了基于事件驱动的模型。它不会将整个文件加载到内存中,而是逐行解析文件,通过回调函数将每行的数据传递给开发者进行处理。
  • EasyExcel 是在在POI的解析引擎基础上改进的,但并没有完全重写 Apache POI 的整个解析引擎,特别是对于 XLSX 文件格式(即 Excel 2007 及以上版本所使用的格式,POI 中对应的是 XSSF 实现),它仍然是基于 POI 的一些底层结构和功能。但是,EasyExcel 在 POI 的基础上进行了大量的优化和重构,以实现更高的性能和更低的内存消耗。

EasyExcel 的核心改进之一是在处理大型数据时采用了“读写分离”和“懒加载”的策略。具体来说,EasyExcel 做了以下几点优化:

  • 按需解析:EasyExcel 不会一次性将整个文件加载到内存中,而是按需读取和解析数据,通过滑动窗口的方式只处理当前需要的数据行,从而大大降低了内存占用。

  • 写入优化:在写入数据时,EasyExcel 同样采用了流式写入的策略,将数据分批次写入磁盘,避免了大数据量时的内存溢出问题。

  • 内存管理:EasyExcel 对内存的使用进行了精细化的管理,通过对象池、缓存优化等技术减少了内存分配和垃圾回收的频率,提升了处理速度。

  • 模型映射:通过注解和反射机制,EasyExcel 可以将 Excel 数据行直接映射为 Java 对象,简化了数据转换的过程。

  • 异常处理:EasyExcel 提供了更加友好的异常处理机制,帮助开发者快速定位和处理读写过程中可能出现的问题。

  • 扩展性:EasyExcel 设计了更加灵活和可扩展的架构,允许开发者通过实现特定的接口来定制和扩展功能。

在这里插入图片描述

尽管 EasyExcel 在 POI 的基础上进行了很多优化,但它仍然依赖于 POI 的一些核心组件来处理 XLSX 文件的底层细节。因此,在使用 EasyExcel 时,仍然可以看到 POI 的影子,尤其是在处理一些复杂的 Excel 特性时。不过,对于大多数常见的 Excel 读写需求,EasyExcel 提供了更加高效和简洁的解决方案。

2.1 easyExcel实现批量读取excel

将 easyExcel 的依赖添加到了你的项目中。如果使用 Maven,可以在 pom.xml 文件中添加如下依赖:

<dependency>  <groupId>com.alibaba</groupId>  <artifactId>easyexcel</artifactId>  <version>最新版本</version> <!-- 请替换为实际的最新版本号 -->  
</dependency>

使用easyExcel的读取API,并指定要读取的sheet索引(从0开始计数,第二个sheet的索引为1)。
实现一个监听器来处理读取到的数据行,并在这个监听器中将数据分批写入数据库。

import com.alibaba.excel.EasyExcel;  
import com.alibaba.excel.context.AnalysisContext;  
import com.alibaba.excel.event.AnalysisEventListener;  
import com.alibaba.excel.read.builder.ExcelReaderBuilder;  
import com.alibaba.excel.read.builder.ExcelReaderSheetBuilder;  
import com.alibaba.excel.read.metadata.ReadSheet;  import java.util.ArrayList;  
import java.util.List;  // 数据模型类  
class DataModel {  private String column1;  private String column2;  // ... 其他字段  // 省略getter和setter方法  
}  // 读取Excel并写入数据库的类  
public class ExcelReaderToDB {  // 模拟的批量写入数据库方法  private void batchInsertToDB(List<DataModel> dataList) {  // 这里应该是将数据真正写入数据库的代码  // 这里仅做打印输出模拟  System.out.println("Inserting batch of " + dataList.size() + " rows to DB...");  for (DataModel data : dataList) {  System.out.println(data);  }  }  // 读取Excel文件的方法  public void readExcelFile(String filePath) {  // 第二个sheet的索引为1  int sheetIndex = 1;  // 读取Excel文件  ExcelReaderBuilder readerBuilder = EasyExcel.read(filePath);  ExcelReaderSheetBuilder sheetBuilder = readerBuilder.sheet(sheetIndex);  // 读取数据并注册监听器  sheetBuilder.registerReadListener(new AnalysisEventListener<DataModel>() {  // 用来缓存读取到的数据  private List<DataModel> cachedDataList = new ArrayList<>();  // 读取每行数据时会调用此方法  @Override  public void invoke(DataModel dataModel, AnalysisContext analysisContext) {  cachedDataList.add(dataModel);  // 当读取到一定数量的数据时,可以执行批量写入数据库的操作  // 这里假设我们每读取100行数据就写入一次数据库  if (cachedDataList.size() >= 100) {  batchInsertToDB(cachedDataList);  // 清空缓存  cachedDataList.clear();  }  }  // 所有数据解析完成后会调用此方法  @Override  public void doAfterAllAnalysed(AnalysisContext analysisContext) {  // 将剩余的数据写入数据库  if (!cachedDataList.isEmpty()) {  batchInsertToDB(cachedDataList);  cachedDataList.clear();  }  }  });  // 开始读取  sheetBuilder.build();  readerBuilder.build().read();  }  public static void main(String[] args) {  String filePath = "path/to/your/excel/file.xlsx";  ExcelReaderToDB excelReader = new ExcelReaderToDB();  excelReader.readExcelFile(filePath);  }  
}

2.2 easyExcel实现写入excel

定义一个模型类来表示你要写入的数据。创建一个数据模型类来映射Excel表格中的数据列,并使用easyExcel的注解来标识表头和字段映射关系。
编写一个方法来创建Excel写入对象,并填充数据到Excel文件中.

import com.alibaba.excel.EasyExcel;  
import com.alibaba.excel.write.metadata.WriteSheet;  
import com.alibaba.excel.annotation.ExcelProperty;  import java.util.ArrayList;  
import java.util.List;  // 数据模型类,使用注解标识表头和字段映射关系  
public class DataModel {  // 表头名称与字段的映射  @ExcelProperty("姓名")  private String name;  @ExcelProperty("年龄")  private Integer age;  // 省略getter和setter方法  // 构造函数  public DataModel(String name, Integer age) {  this.name = name;  this.age = age;  }  
}  // 导出数据到Excel的类  
public class ExcelExporter {  // 模拟数据  private List<DataModel> getData() {  List<DataModel> list = new ArrayList<>();  list.add(new DataModel("张三", 20));  list.add(new DataModel("李四", 22));  list.add(new DataModel("王五", 24));  return list;  }  // 导出数据到Excel文件  public void exportToExcel(String filePath) {  // 创建写入对象  EasyExcel.write(filePath, DataModel.class)  .sheet("Sheet1") // 设置sheet名称  .doWrite(getData()); // 写入数据  }  public static void main(String[] args) {  String filePath = "path/to/your/excel/file.xlsx";  ExcelExporter exporter = new ExcelExporter();  exporter.exportToExcel(filePath);  }  
}

三、API设计与易用性

Apache POI提供了丰富且灵活的API,允许开发者以多种方式操作Excel文件。然而,由于其功能全面且复杂,API的学习曲线相对较陡,对于初学者来说可能需要一些时间来熟悉。

相比之下,easyExcel的API设计更加简洁和直观。它提供了针对常见任务的简化方法,使得开发者能够更快速地完成任务。此外,easyExcel还支持自定义读写策略、异步处理、数据校验等高级特性,这些功能都通过简洁的API暴露给开发者,提高了易用性。

四、总结

Apache POI和easyExcel都是优秀的Java库,用于处理Excel文件。Apache POI以其全面性和灵活性著称,提供了对Excel文件的全面支持。然而,在处理大型文件时,它可能会遇到性能问题和内存消耗过高的情况。相比之下,easyExcel则针对大型文件的处理进行了优化,提供了更高的性能和更低的内存消耗。此外,easyExcel的API设计更加简洁和易用,使得开发者能够更高效地完成任务。

在选择使用哪个库时,开发者应根据项目需求和文件大小来决定。如果项目需要处理大型Excel文件,并且对性能和内存消耗有较高要求,那么easyExcel可能是一个更好的选择。而如果项目需要全面的Excel文件处理功能,并且对性能要求不高,那么Apache POI也是一个不错的选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/666292.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Unity 通过配置文件生成代码

文章目录 示例1&#xff1a;基于ScriptableObject的配置生成类示例2&#xff1a;预制体路径列表生成加载代码示例3&#xff1a;动画剪辑生成动画控制器片段示例4&#xff1a;Excel配置表生成序列化类示例5&#xff1a;UI元素及其事件绑定生成代码 在Unity编辑器模式下&#xff…

电商实战练习部署

基于阿里云ECS服务器实战部署 1 单架构部署方案 1.1 部署流程 传统方案 基于docker 2 持续集成&持续部署方案 随着软件开发复杂度的不断提高&#xff0c;团队开发成员间如何更好地协同工作以确保软件 开发的质量已经慢慢成为开发过程中不可回避的问题。互联网软件的开发…

护眼台灯有aaa级吗为什么?一文揭晓护眼台灯照度等级分类

尽管台灯是一个很成熟的行业&#xff0c;但却时不时也会冒出一些新的概念和名词。比如近些年的”AAA级”台灯&#xff0c;很频繁地出现在我们视野中。给人感觉似乎带”AAA级”的台灯&#xff0c;要比其他的强上一头。那到底是真是假呢&#xff1f; 一、护眼台灯有AAA级吗&…

字节跳动推出MagicVideo-V2超高清文生视频模型

&#x1f989; AI新闻 &#x1f680; 字节跳动推出MagicVideo-V2超高清文生视频模型 摘要&#xff1a;MagicVideo-V2是由字节跳动的研究人员开发的一种超高清文生视频模型。该模型在视频的高清度、润滑度、连贯性、文本语义还原等方面表现出色&#xff0c;比目前主流的文生视…

leetcode 1.两数之和(C++)DAY1(待补充哈希表法)

文章目录 1.题目描述示例提示 2.解答思路3.实现代码结果4.总结 1.题目描述 给定一个整数数组 nums 和一个整数目标值 target&#xff0c;请你在该数组中找出 和为目标值 target 的那 两个 整数&#xff0c;并返回它们的数组下标。 你可以假设每种输入只会对应一个答案。但是&…

ffmpeg操作实战001:视频+音频文件融合

一、功能需求 把视频文件video.mp4 和音频文件audio.wav融合在一起&#xff0c;输出视频文件output.mp4 二、操作指令 ffmpeg -i video.mp4 -i audio.wav -c:v copy -map 0:v:0 -map 1:a:0 output.mp4 三、参数说明 ffmpeg: 这是用于执行FFmpeg命令行工具的命令。-i video…

04. 【Linux教程】安装 Linux 操作系统

通过前面的小节学习&#xff0c;我们已经对 Linux 操作系统有了简单的了解&#xff0c;同时也在 Windows 下安装了虚拟机软件 VMware &#xff0c;那么本节课我们就介绍下如何使用虚拟机软件安装 Linux 操作系统。 通过第一小节的学习我们知道 Linux 有很多的发行版本&#xf…

工信部颁发的《计算机视觉处理设计开发工程师》中级证书

计算机视觉&#xff08;Computer Vision&#xff09;是一门研究如何让计算机能够理解和分析数字图像或视频的学科。简单来说&#xff0c;计算机视觉的目标是让计算机能够像人类一样对视觉信息进行处理和理解。为实现这个目标&#xff0c;计算机视觉结合了图像处理、机器学习、模…

Python 连接 mysql 详解(mysql-connector-python)

文章目录 1 概述1.1 第三方库&#xff1a;mysql-connector-python1.2 可视化工具&#xff1a;navicat1.3 创建测试数据库 2 连接 mysql 数据库2.1 创建一个连接2.2 捕获连接异常2.3 从配置文件中获取连接信息 3 执行 sql 语句3.1 插入、更新、删除3.2 查询 1 概述 1.1 第三方库…

深度学习系列56:使用whisper进行语音转文字

1. openai-whisper 这应该是最快的使用方式了。安装pip install -U openai-whisper&#xff0c;接着安装ffmpeg&#xff0c;随后就可以使用了。模型清单如下&#xff1a; 第一种方式&#xff0c;使用命令行&#xff1a; whisper japanese.wav --language Japanese --model…

MySQL运维实战(5.3) MySQL数据乱码的一些情况

作者&#xff1a;俊达 表数据乱码 表数据出现乱码的情况通常是由于数据的真实编码与相关参数不一致引起的&#xff0c;其中包括常见的参数如character_set_client、character_set_results、字段编码以及终端编码等。确保这些参数保持一致&#xff0c;可以有效预防和解决乱码问…

歌声悠扬如往昔

有一首歌 - 朱晓琳&#xff08;网易云单曲&#xff09; 作词 : 陈彼得作曲 : 陈彼得有一首歌我想起你那时候微风轻轻有一首歌我想起你你的感觉温馨有多少的欢笑就有多少的忧伤 愿时光在这里停住(好景不常在)歌声悠扬如往昔哦哦哦咿咿咿有一首歌我和你词意朦胧旋律依稀唱一首歌…

【数据结构 09】哈希

哈希算法&#xff1a;哈希也叫散列、映射&#xff0c;将任意长度的输入通过散列运算转化为固定长度的输出&#xff0c;该输出就是哈希值&#xff08;散列值&#xff09;。 哈希映射是一种压缩映射&#xff0c;通常情况下&#xff0c;散列值的空间远小于输入值的空间。 哈希运…

如何在个人PC的桌面创建一个类似网吧的游戏菜单并分类?

GGTools 免费的桌面图标管理器、软件菜单、游戏菜单 单机版游戏菜单、个人/家用/家庭版游戏菜单、轻量级图标收纳软件

GPT用来润色论文\生成完整长篇论文\进行AI绘图,真的太香了!

详情点击公众号&#xff1a;技术科研吧 链接&#xff1a;GPT用来润色论文\生成完整长篇论文\进行AI绘图&#xff0c;真的太香了&#xff01; 第一&#xff1a;2024年AI领域最新技术 1.OpenAI新模型-GPT-5 2.谷歌新模型-Gemini Ultra 3.Meta新模型-LLama3 4.科大讯飞-星火认…

Jenkins(三):自动化部署SpringBoot项目

前言 在软件开发过程中&#xff0c;自动化部署已经成为不可或缺的一环。Jenkins是一个广泛使用的开源自动化部署工具&#xff0c;它提供了强大的功能和灵活的配置选项&#xff0c;可以帮助开发团队实现高效的持续集成和持续部署。本文将详细介绍如何使用Jenkins自动化部署Spri…

6-树-二叉树的层序遍历 II

这是树的第7篇算法&#xff0c;力扣链接。 给你二叉树的根节点 root &#xff0c;返回其节点值 自底向上的层序遍历 。 &#xff08;即按从叶子节点所在层到根节点所在的层&#xff0c;逐层从左向右遍历&#xff09; 示例 1&#xff1a; 输入&#xff1a;root [3,9,20,null,nu…

前端JavaScript篇之常用的正则表达式有哪些?

目录 常用的正则表达式有哪些&#xff1f; 常用的正则表达式有哪些&#xff1f; 常用的正则表达式包括以下几个方面&#xff1a; 匹配16进制颜色值&#xff1a;#([0-9a-fA-F]{6}|[0-9a-fA-F]{3})可以用于匹配16进制颜色值&#xff0c;如"#ff0000"或"#f00"…

【MySQL】——数据定义

&#x1f383;个人专栏&#xff1a; &#x1f42c; 算法设计与分析&#xff1a;算法设计与分析_IT闫的博客-CSDN博客 &#x1f433;Java基础&#xff1a;Java基础_IT闫的博客-CSDN博客 &#x1f40b;c语言&#xff1a;c语言_IT闫的博客-CSDN博客 &#x1f41f;MySQL&#xff1a…

IDEA插件ChatGPT - Easycode安装使用

IDEA插件ChatGPT - Easycode简介 ChatGPT - Easycode 是一个由 OpenAI 开发的 IntelliJ IDEA 插件,它可以利用 ChatGPT 的强大语言生成能力,帮助开发人员提高编码效率。 主要功能: 代码生成:可以根据自然语言描述生成代码,支持多种编程语言,包括 Java、Python、JavaSc…