Java实现Excel百万级数据的导入(约30s完成)

前言

在遇到大数据量excel,50MB大小或数百万级别的数据读取时,使用常用的POI容易导致读取时内存溢出或者cpu飙升。
本文讨论的是针对xlsx格式的excel文件上传,采用com.monitorjbl.xlsx.StreamingReader 。

什么是StreamReader?
StreamReader 是 java.io 包中的一个类,用于读取字符流的高级类。它继承自 Reader 类,可以以字符为单位读取文件中的数据。
StreamReader的主要功能?

  • 以字符为单位读取文件中的数据
  • 提供了多种读取方法,如read()、readLine()等
  • 可以指定字符编码,以适应不同类型的文件

StreamReader的优势?

  • 简化了文件读取的过程,提供了高层次的读取方法可以处理不同类型的文件,如文本文件、CSV文件等
  • 可以读取大型文件,节省内存空间

注:StreamReader只能用遍历形式读取数据

        Sheet sheet = wk.getSheetAt(0);//遍历所有的行for (Row row : sheet) {System.out.println("开始遍历第" + row.getRowNum() + "行数据:");//遍历所有的列for (Cell cell : row) {System.out.print(cell.getStringCellValue() + " ");}System.out.println(" ");}

 

案例步骤

1、导入文件前端接口

Controller.java

    /*** 导入文件前端接口*/@PostMapping("/importData")@ResponseBodypublic AjaxResult importData(MultipartFile file, boolean updateSupport) throws Exception {// 开始时间Long begin = new Date().getTime();// excel转换为List集合(约30s~40s)List<TpInstallationMaintenanceLabelDetailed> tpInstallationMaintenanceLabelDetailedList = largeFilesUtils.importExcelLargeFile(file, updateSupport);// 结束时间Long end = new Date().getTime();// 数据导入(约30s)String message = importInstallationMaintenanceLabelDetailed(tpInstallationMaintenanceLabelDetailedList, updateSupport);// 总用时(约60s~70s)message = message +"<br/>数据转换花费时间 : "+(end - begin) / 1000 + " s" ;// 返回return AjaxResult.success(message);}

2、Excel数据转为List

largeFilesUtils.java


import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.springframework.stereotype.Service;
import org.springframework.web.multipart.MultipartFile;import com.monitorjbl.xlsx.StreamingReader;
import com.ruoyi.huawei.domain.TpInstallationMaintenanceLabelDetailed;/*** 大文件Excel导入* * @author y* @date 2024-03-29*/
@Service
public class LargeFilesUtils {/*** 大文件Excel导入* * @param* @return 工具*/public List<TpInstallationMaintenanceLabelDetailed> importExcelLargeFile(MultipartFile file,boolean updateSupport) {List<TpInstallationMaintenanceLabelDetailed> tpInstallationMaintenanceLabelDetailedList = new ArrayList<TpInstallationMaintenanceLabelDetailed>();try {// 大文件测试开始InputStream inputStream = file.getInputStream();// com.monitorjbl.xlsx.StreamingReader Workbook workbook = StreamingReader.builder().rowCacheSize(1000) // 缓存到内存中的行数(默认是10).bufferSize(10240) // 读取资源时,缓存到内存的字节大小(默认是1024).open(inputStream);// 获取第一个ShhetSheet sheet = workbook.getSheetAt(0);//boolean fastRowBoolean = true;// monitorjbl只能支持遍历,不能通过指定下标获取for (Row row : sheet) {// 判断是否首行if(fastRowBoolean) {// 设置为非首行fastRowBoolean = false;// continue 语句用于跳过当前循环中剩余的代码,并开始下一次迭代。continue;}// 创建实体TpInstallationMaintenanceLabelDetailed rowData = new TpInstallationMaintenanceLabelDetailed();// 列下标初始化int n = 0;// 遍历列for (Cell cell : row) {//switch (n) {// 第一列case 0:rowData.setPppoeAccount(cell.getStringCellValue());break;// 第二列case 1:rowData.setInstallationMaintenanceName(cell.getStringCellValue());break;case 2:rowData.setCounty(cell.getStringCellValue());break;case 3:rowData.setPoorQualityUser(cell.getStringCellValue());break;case 4:rowData.setOldLightCat(cell.getStringCellValue());break;case 5:rowData.setSetTopBoxWirelessConnection(cell.getStringCellValue());break;case 6:rowData.setPleaseUseXgponOnu(cell.getStringCellValue());break;case 7:rowData.setHighTemperatureLightCat(cell.getStringCellValue());break;case 8:rowData.setAnOldSetTopBox(cell.getStringCellValue());break;case 9:rowData.setTwoOldSetTopBoxes(cell.getStringCellValue());break;case 10:rowData.setThreeOldSetTopBoxes(cell.getStringCellValue());break;case 11:rowData.setAnPoorQualityRouter(cell.getStringCellValue());break;case 12:rowData.setTwoPoorQualityRouters(cell.getStringCellValue());break;case 13:rowData.setThreePoorQualityRouters(cell.getStringCellValue());break;case 14:rowData.setThreeOrMoreLowQualityRouters(cell.getStringCellValue());break;case 15:rowData.setThreeOrMoreOldSetTopBoxes(cell.getStringCellValue());break;case 16:rowData.setSeverelyPoorQualityUsersAndOldOpticalCats(cell.getStringCellValue());break;// 处理其他属性default:break;}// 列下标+1n = n+1;}tpInstallationMaintenanceLabelDetailedList.add(rowData);}workbook.close();} catch (Exception e) {// TODO: handle exceptionSystem.out.println(e);}return tpInstallationMaintenanceLabelDetailedList;}}

3、List集合数据导入

importInstallationMaintenanceLabelDetailed

/*** 导入文件分析*/public String importInstallationMaintenanceLabelDetailed(List<TpInstallationMaintenanceLabelDetailed> tpInstallationMaintenanceLabelDetailedList, Boolean isUpdateSupport){if (StringUtils.isNull(tpInstallationMaintenanceLabelDetailedList) || tpInstallationMaintenanceLabelDetailedList.size() == 0){throw new ServiceException("导入数据不能为空!");}// 执行开始时间Long begin = new Date().getTime();// 线程数final int THREAD_COUNT = 10;// 每个线程处理的数据量final int BATCH_SIZE = tpInstallationMaintenanceLabelDetailedList.size() / THREAD_COUNT;// ExecutorService是Java中对线程池定义的一个接口ExecutorService executor = Executors.newFixedThreadPool(THREAD_COUNT);// for (int i = 0; i < THREAD_COUNT; i++) {// List数据开始下标final int startIndex = i * BATCH_SIZE;// List数据结束下标final int endIndex = (i + 1) * BATCH_SIZE;// 线程池执行executor.submit(new Runnable() {public void run() {// 初始化数据库连接对象Connection conn = null;// 初始化预编译的 SQL 语句的对象PreparedStatement ps = null;try {// 获取连接conn =  DriverManager.getConnection("jdbc:mysql://localhost:3306/tool_platform_db?useUnicode=true&characterEncoding=utf8&zeroDateTimeBehavior=convertToNull&useSSL=true&serverTimezone=GMT%2B8&useSSL=false", "root", "123456");//获取连接// 设置自动提交模式,默认trueconn.setAutoCommit(false);// sql前缀String prefix = "INSERT INTO tp_label_detailed ("+ "account,"+ "maintenance_name,"+ "county,quality_user,"+ "light_cat,wireless_connection,"+ "xgpon_onu,"+ "light_cat,"+ "an_box,two_boxes,"+ "three_boxes,"+ "an_router,"+ "two_routers,"+ "three_routers,"+ "three_or_more_routers,"+ "three_or_more_boxes,"+ "severely_and_cats"+ ") VALUES ";// 创建预编译对象ps = conn.prepareStatement(prefix);// 保存sql后缀StringBuffer suffix = new StringBuffer();// 执行条数int number_of_cycles = 0;//for (int j = startIndex; j < endIndex; j++) {// 拼接sqlsuffix.append("("+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getPppoeAccount()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getInstallationMaintenanceName()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getCounty()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getPoorQualityUser()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getOldLightCat()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getSetTopBoxWirelessConnection()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getPleaseUseXgponOnu()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getHighTemperatureLightCat()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getAnOldSetTopBox()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getTwoOldSetTopBoxes()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getThreeOldSetTopBoxes()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getAnPoorQualityRouter()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getTwoPoorQualityRouters()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getThreePoorQualityRouters()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getThreeOrMoreLowQualityRouters()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getThreeOrMoreOldSetTopBoxes()+"',"+"'"+tpInstallationMaintenanceLabelDetailedList.get(j).getSeverelyPoorQualityUsersAndOldOpticalCats()+"'"+"),");   //拼接sqlnumber_of_cycles = number_of_cycles +1;}// sql拼接String sql = prefix + suffix.substring(0, suffix.length() - 1);// 添加预处理sqlps.addBatch(sql);// 执行语句ps.executeBatch();// 提交conn.commit();// 初始化拼接sqlsuffix.setLength(0);// 初始化条数number_of_cycles = 1;} catch (SQLException e) {e.printStackTrace();} finally {if (ps != null) {try {// 关闭psps.close();} catch (SQLException e) {e.printStackTrace();}}if (conn != null) {try {// 关闭数据库连接conn.close();} catch (SQLException e) {e.printStackTrace();}}}}});}//关闭线程池,不接受新任务,但会把已添加的任务执行完executor.shutdown();// 等待所有线程完成任务while (!executor.isTerminated()) {} System.out.println("完成");// 结束时间Long end = new Date().getTime();// 耗时logger.debug(tpInstallationMaintenanceLabelDetailedList.size()+"条数据插入花费时间 : " + (end - begin) / 1000 + " s");//return "数据导入成功!共 " + tpInstallationMaintenanceLabelDetailedList.size() + " 条!"+"<br/>数据导入花费时间 : "+(end - begin) / 1000 + " s" ;}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/796885.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开源低代码平台概况和说明推荐

开源低代码平台是一类允许开发者通过图形化界面和预构建的代码块&#xff0c;而非传统的手动编程方式&#xff0c;来创建应用程序的工具。这些平台通常提供了丰富的功能和特性&#xff0c;帮助开发者更加高效地进行应用开发。 开源低代码平台的概况可以总结为以下几点&#xf…

【C++】背包问题

目录 背包问题01 背包背包不装满问题背包必须满问题 完全背包 背包问题 背包问题属于动态规划的一类题型 01 背包 背包不装满问题 背包必须满问题 #include <iostream> using namespace std; const int N 1010; #include <vector> int main() {int n , V;int v[…

【Ambari】Ansible自动化部署大数据集群

目录 一&#xff0e;版本说明和介绍信息 1.1 大数据组件版本 1.2 Apache Components 1.3 Databases支持版本 二&#xff0e;安装包上传和说明 三&#xff0e;服务器基础环境配置 3.1global配置修改 3.2主机名映射配置 3.3免密用户名密码配置 3.4 ansible安装 四. 安…

2024.4.1-[作业记录]-day06-认识 CSS(三大特性、引入方式)

个人主页&#xff1a;学习前端的小z 个人专栏&#xff1a;HTML5和CSS3悦读 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结&#xff0c;欢迎大家在评论区交流讨论&#xff01; day06-认识 CSS(三大特性、引入方式) 文章目录 day06-认识 CSS(三大特性、引入方式)作业…

实践笔记-03 docker buildx 使用

docker buildx 使用 1.启用docker buildx2.启用 binfmt_misc3.从默认的构建器切换到多平台构建器3.1创建buildkitd.toml文件&#xff08;私有仓库是http没有证书的情况下&#xff0c;需要配置&#xff09;3.2创建构建器并使用新创建的构建器 4.构建多架构镜像并推送至harbor仓库…

JVM—对象的创建流程与内存分配

JVM—对象的创建流程与内存分配 创建流程 对象创建的流程图如下&#xff1a; 对象的内存分配方式 内存分配的方式有两种&#xff1a; 指针碰撞&#xff08;Bump the Pointer&#xff09;空闲列表&#xff08;Free List&#xff09; 分配方式说明收集器指针碰撞&#xff08…

三防笔记本丨加固笔记本丨三防笔记本电脑赋能车辆检修

随着汽车数量的不断增加和交通运输行业的发展&#xff0c;车辆检修行业成为了保障交通安全和延长车辆寿命的重要领域。在车辆检修过程中&#xff0c;需要使用各种工具和设备来进行检测、维修和保养&#xff0c;而信息化技术的应用正逐渐渗透到这一行业中&#xff0c;为检修工作…

51单片机实验03-定时器T0来实现流水灯从左到右再从右到左

目录 一、实验目的 二、实验说明 1、51单片机有两个16位内部计数器/定时器&#xff08;C/T&#xff0c; Counter/Timer&#xff09;。 2、模式寄存器TMOD 1) M1M0工作模式控制位&#xff1b; 2) C/T定时器或计数器选择位&#xff1a; 3&#xff09;GATE定时器/计数器运行…

超声波清洗机哪家强?超声波清洗机排行榜!最强超声波清洗机推荐

眼镜作为日常生活中不可或缺的用品&#xff0c;对于很多人来说是必备的。然而&#xff0c;随着使用时间的增长&#xff0c;眼镜表面往往会沾染灰尘、污垢等&#xff0c;这不仅影响了镜片的透光性&#xff0c;也可能影响到使用者的视力和舒适度。因此&#xff0c;清洁眼镜成了一…

2_6.Linux高级存储管理

##1.逻辑卷## pv ##物理卷 被处理过的物理分区 pe ##物理扩展 设定存储最小单元 vg ##物理卷组 捆绑pv到一个组中 lv ##逻辑卷 分配最终的使用设备 监控建立过程&#xff1a; watch -n 1 "pvs;echo ;vgs;echo ;lvs;echo ;df -h /weixindata" &#xff08;1&#xf…

wheeltec轮趣ROS教育机器人的网络连接

一、术语解析 宿主机&#xff1a;宿主机是指物理主机&#xff0c;比如用于开发测试的笔记本电脑和台式机电脑。 虚拟机&#xff1a;虚拟机是指安装在宿主机的VMware&#xff0c;推荐在宿主机上安装虚拟机&#xff0c;官方提供虚拟机的镜像以及配套的开发环境。 ROS主机&…

DC/DC1A30V高效同步降压转换器H4010

DC/DC 1A30V高效同步降压转换器是一种高频、同步、整流、降压、开关模式转换器&#xff0c;内置功率MOSFET。它可以在宽输入电源范围内实现1.5A峰值输出电流&#xff0c;并具有出色的负载和线路调节性能。此外&#xff0c;该转换器需要最少数量的现成外部元件&#xff0c;并采用…

微信聊天记录恢复只需简单3招,快速找回聊天内容!

各种社交软件早已深深融入我们的日常生活&#xff0c;无论是与亲朋好友的闲聊&#xff0c;还是与同事伙伴的工作沟通&#xff0c;都离不开它们的陪伴。然而&#xff0c;有时由于误操作、系统更新或手机故障等原因&#xff0c;我们可能会不小心删除了重要的聊天记录&#xff0c;…

PCI总线学习笔记:读写篇

前言 最近在写E1000网卡的驱动&#xff0c;这其中涉及到了PCI总线的相关内容。但是网上大部分关于PCI的文章都只局限在概念上的描述&#xff0c;并没有给出具体的例子来解释。这其实也是情理之中的&#xff0c;因为PCI总线规范就像是一个抽象的接口&#xff0c;其具体怎么实现…

C语言之自定义类型联合和枚举

目录 前言 一&#xff1a;联合体&#xff08;共用体&#xff09;union 1.联合体类型的声明 2.联合体的特点 3.联合体大小的计算 4.联合体判断机器的大小端 二&#xff1a;枚举enum 1.概念 2.枚举的优点 3.枚举的使用 接下来的日子会顺顺利利&#xff0c;万事胜意…

C++ 类和对象(中篇)

类的6个默认成员函数 如果一个类中什么成员都没有&#xff0c;简称为空类。空类中什么都没有吗&#xff1f;并不是的&#xff0c;任何一个类在我们不写的情 况下&#xff0c;都会自动生成下面6个默认成员函数。 构造函数&#xff1a; 定义&#xff1a;构造函数是一个特殊的成员…

【C语言】猜数字小游戏(并讲解随机数相关知识)

前言 一、游戏菜单 二、游戏逻辑 1.用户选择 2.开始游戏 2.1 生成1~100的随机数 总结 前言 本文讲解使用C语言写一个猜数字小游戏(1~100)&#xff0c;涉及到的语法为&#xff1a;循环、分支、随机数、函数 一、游戏菜单 一个游戏的最开始&#xff0c;往往是一个菜单&…

Jetpack Bluetooth——更优雅地使用蓝牙

Jetpack Bluetooth——更优雅地使用蓝牙 蓝牙是安卓开发中非常常用的操作&#xff0c;但安卓经过这么多年的迭代&#xff0c;蓝牙的相关接口都经过了很多修改需要适配&#xff0c;还有的接口需要实现一堆函数。。。整套操作虽说不算复杂&#xff0c;但难免感觉不太舒服。 之前…

专题【双指针】【学习题】刷题日记

题目列表 11. 盛最多水的容器 42. 接雨水 15. 三数之和 16. 最接近的三数之和 18. 四数之和 26. 删除有序数组中的重复项 27. 移除元素 75. 颜色分类 167. 两数之和 II - 输入有序数组 2024.04.06 11. 盛最多水的容器 题目 给定一个长度为 n 的整数数组 height 。有 n 条垂…

PHP实现网站微信扫码关注公众号后自动注册登陆实现方法及代码【关注收藏】

在网站注册登陆这环节&#xff0c;增加微信扫码注册登陆&#xff0c;普通的方法需要开通微信开发者平台&#xff0c;生成二维码扫码后才能获取用户的uinonid或openid&#xff0c;实现注册登陆&#xff0c;但这样比较麻烦还要企业认证交费开发者平台&#xff0c;而且没有和公众号…