内存泄漏java例子_一次线上Java应用内存泄漏分析实例

由于JVM的内存管理采用GC垃圾自动回收机制,这使得Java程序员在编程的时候确实可以从内存管理中释放出来,但这也引发了另外一个大问题,一旦Java应用出现内存泄漏的时候,常常让人措手不及,陷入无从下手的尴尬境地,我们总不能一句话重启吧(苦笑)。

内存问题可能是大多数Java程序员心中都曾有过的伤,因为太容易遇见了。

下面这篇文章是我去年写在个人微信公众号上的,今天早上回头再看心中不免有些嘘嘘感慨,于是决定重新整理把它发到简书上来,以下为正文:

前2天负责的一个线上系统在早上9点20分接到大量用户反馈系统很卡,页面无响应。我联系运维及时查看后台服务器,发现WAS(Websphere) server bin目录下生成了javacore 和heapdump,这个消息让我整个人都不好了,项目推广关键时期居然来这么一出,可谓多事之秋,搞事情啊!

好吧,既然程序运行时遇到了坑,那我们就先来找到这个坑,再把坑填好(围笑)。

简单介绍下,线上应用运行在power linux OS平台之上,web容器为IBM WebSphere ,JDK  ibm j9vm 64 位。

首先开始通过ibm ha456.jar 分析线上dump 文件

519dafb26354609e7911ddfa9a4a3ab5.png

33fafef0264d721cb3adc85530d362f6.png

上图Heap usage,堆内存已使用约3.7G,且41.95%的内存都被rootobject 和它的引用吃掉了,接下来我再查看rootobject,如下图:

3c5f823d3f6cff3580f5b9cef5af4f38.png

内存主要是被2个LinkedHashMap吃掉了,于是仔细查找项目源码中会用到LinkedHashMap的地方,无果。

接下来再来看一下这些LinkedHashMap当中都包含什么对象,看看它们会指向哪些东西呢,如下图:

24dac497e201406ad0f8a2dccdd0ded2.png

这里发现有一个org.xhtmlrender.resource.ImageResource类,且点开所有节点LinkedHashMap 都有此类的实例及强引用,如下图显示第一个root  LinkedHashMap 有178个此类实例

51aeae4bb3743707435e416edb0ef464.png

于是继续分析下ImageResource类节点,如下图:

eaf42af967526aae4cb7f6ffb871a370.png

此对象节点只有一个parentes node,且这个parentes node 对象就是LinkedHashMap

接着我查看项目源码,发现 org.xhtmlrender.resource.ImageResource类属于如下图:

139d26a0c5e9ec8608f77798b0a1d146.png

Maven 引用如下:

714f9ba7c60c57d5e7ba5a41d162e2ad.png

分析项目代码,上面3个jar包是用来将html文件转成pdf文件,目前能推断出的结论是此功能模块耗用尽了jvm 堆内存,由此导致线上应用崩溃了。。。

仔细检查这一功能块区域的代码发现不存在有大规模瞬时加载大量数据到内存中的潜在代码,由此判断不是瞬时某个交易功能导致,应该是此功能区域的某个方法执行时存在内存泄漏的可能。

线上应用架构是集群 F5部署,因此有另外一台尚没有生成javacore 的was服务做对比,于是在当晚非作业时间,kill -3 [pid]生成dump 文件进一步分析,发现这台应用的堆内存也用到3.6G,只是还没有到崩溃的临界点而已,且都是被同样的LinkedHashMap 吃掉大半以上。

内存泄漏点几乎已确定在此处了,于是让同事写了一个客户端测试小程序并发的对此功能区方法Action发起请求,以下为测试环境请求我自己本地服务JVM监控图示:

ef4a66c146ad20b96808fe0ad0b69140.png

1

上部左边图可看出垃圾回收活动越来越频繁,上部右边图堆内存的已使用占比也在缓慢递增,典型的内存有泄漏,GC每次回收都不完全,导致GC回收的复杂度越来越高,离out of memory 只是时间问题。

再对测试环境中的was服务器进行压测,以进一步验证此问题点,发现was体系内存的开销更明显,如下图,看到内存呈现阶梯式递增

f3e6e5435539622239a14d3c46b86967.png

2

对比上面2图,在客户端测试程序压力一定情况下,was服务器(1.6jdk)的表现比我本机还要糟糕,这可能是我本机Mac用的1.8 jdk JVM GC相对于1.6有优化吧。

服务端在运行4小时之后,内存耗尽,程序Over,且在was应用目录下生成了javacore(这期间暂停过很多次客户端压力程序,但服务端JVM堆内存的占用一直是居高不下,无法回收)。

8ddab08b67248e8f94505c49c920c01a.png

3

同样使用ha456分析javacore,发现堆内存的耗用情况与生产几乎一致,堆内存大部分都是耗用在LinkedHashMap和commons pool中

0b4cd25006c2f3aae1d763ed0dc2cc3d.png

4

至此断定问题一定是出在html转pdf方法体中,查阅项目源码及用到的开源jar包说明文档,定位到出问题的关键代码块如下:

7d53d9284e49d077aeb23b48f67b1875.png

初步分析应该是ITextRenderObjctFactory中ObjctPool池的ITextRender对象资源不释放导致的,对象池Factory关键配置如下:

3b428bba882950d2cc120995fe9c522c.png

查阅相关资料说明,我分析应该是ITextRende对象一直活跃在对象池pool中(pool默认配置:空闲对象可存活30分钟),应用在白天作业期间对htmlToPdf方法的调用几乎不会有空闲时间,所以render一直处于被外围重复调用的情况,导致render持有的资源一直无法得到释放的机会,进而使程序内存耗尽。

调研过其他项目组源码也有类似实现的写法,但是未出现内存耗尽的情况,对比源码分析区别在于其他项目组render渲染html为pdf 时并未涉及到html文件中有可变图片url引用的链入,而我们项目组每次html转pdf 时存在可变路径的图片引用,导致render需要每次动态创建ImageResource类来动态加载外部图片URL链接,而动态创建的ImageResource 实例并未能释放。

因此对以上关键代码进行优化如下:

c758703030b0fdec33914b83a7fc6a6a.png

第一个红色箭头修改部分改为document 由原来的url加载方式改为file

第二个红色箭头为新添加代码,用于把ITextRender共享上下文Context内容重置,以便于单个render对象中的资源及时释放;

同时对于ObjectPool池config配置优化如下,关键代码:

e1a236d8f0be394fee34968256d3701a.png

修改参数说明如下:

1、空闲对象获取策略修改为FIFO,先进先出,便于对象池中的对象公平共享使用,便于空闲未使用到的对象及时释放

cbf50161f0f61dcbee4d2997b0697dba.png

2、timeBetweenEvictionRunsMillis为每间隔5秒检查一下是否存在空闲Idle对象

3、minEvictableIdleTimeMillis空闲对象存在1分钟未被调用即销毁

OK,优化之后,更新was服务,使用之前的客户端测试程序发起压力测试,将堆内存上限设定为1G,结果表现如下:

74a640499bef1f97f263d2a35d76901e.png

持续压测2小时,内存耗用稳定在1G以内,当客户端压力撤去,3分钟之后内存稳稳回收到200M左右,如下:

eb55c55063c1c18c90cdc76aa6cc2304.png

接下来稳定性测试6小时,持续压测,压力撤去之后,内存占用逐渐回归到600M左右

abc0aabc29eb07db22a657ea9f7225d8.png

更新线上应用程序不再出现问题,至此,总算把此问题解决。在这期间收集用于分析的javacore和dump文件约5G(包含测试环境was、生产环境was、本机tomcat)

3cf98fcd109784cbfbb48ec9a3e36e38.png

以上从定为问题、找到原因、测试复现、解决问题到复测通过我断断续续用了2天时间,这2天放下了手头一切工作上相对来说优先级没有此问题高的事情,可能有的朋友会感觉我最近工作不走心了呢,其实不然,不会了(围笑)。

软件系统最常见的就是系统故障,人非圣贤孰能无过,程序员都是人,是人就会写Bug,写了Bug系统就会出问题,出了问题系统就可能宕机。即使你什么事都没干正在家里陪老丈人喝酒,人家在微博上说,大家好,给大家介绍一下,这是我的女盆友。哐当,系统挂了,这特么能怪谁呢?真出了问题,慌,骂人,处罚都是后话,没用的,重要的是解决问题,梳理流程,增加监控,减少损失,最后复盘问题才是牛批。

现在我们的项目正处于大力推广前的关键时期,软件将迎来最终用户的快速增长,保持服务的稳定是重中之重。

前段时间看到Mac Talk公众号池建强老师发的一篇原创文章,大意讲的是我们每个人在临大战前应有静气,何意?就是你面临压力和挑战的时候,一方面心跳加速血管收缩手心冒汗,但你感到的是兴奋而不是焦虑,内心深处是安静的,沉着的。

最后大家要是觉得本文还OK,对你的工作学习有所帮助的话请给点个赞️!笔芯

如果你对设计模式学习感兴趣的话,请关注下我,因为我最近正在编写一部《从零开始学设计模式》系列。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/244725.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python比较列表所有项是否有相同的部分_检查列表中的所有元素是否相同

一般方法&#xff1a;def checkEqual1(iterator):iterator iter(iterator)try:first next(iterator)except StopIteration:return Truereturn all(first rest for rest in iterator)单线&#xff1a;def checkEqual2(iterator):return len(set(iterator)) < 1还有一条线&…

java项目管理工具_Java 开发项目管理工具

团队协同工具(worktil):https://worktile.com/版本管理工具(GitLab)&#xff1a;http://www.tuicool.com/articles/bEz6Vf 配置教程&#xff1a;http://www.cnblogs.com/wintersun/p/3930900.html自动化构建工具(jenkins)&#xff1a;http://jenkins-ci.org/ 配置教程&#xff…

python判断是不是整数的命令_介绍python判断一个数是不是正小数和整数的方法

这篇文章主要介绍了python 判断是否为正小数和正整数的实例的相关资料,这里提供实例&#xff0c;实例注释说明很清楚&#xff0c;需要的朋友可以参考下python 判断是否为正小数和正整数的实例实现代码&#xff1a;def check_float(string):#支付时&#xff0c;输入的金额可能是…

.net core 2.1 mysql_ASP.NET Core 2.2 + MySQL + DB First

1 项目添加 Pomelo.EntityFrameworkCore.MySql2 编辑项目文件&#xff0c;在节点中添加如下代码&#xff1a;netcoreapp2.2InProcess3 CMD 切换到当前项目目录&#xff0c;执行如下命令dotnet ef dbcontext scaffold "Serverlocalhost;User Id数据库访问用户;Password数据…

java 向上抛异常_java throws 向上抛出的概念问题

展开全部------------------附注------------------------向上抛出的意思 针对 子类 父类,这里面涉及到几个方面,最重32313133353236313431303231363533e4b893e5b19e31333332613637要的一点,(先抛子类的异常,再抛父类的异常.)(FALSE)如果在该方法写明catch子句,catch的顺序是子…

windows linux cpu 抢占式 时间片_嵌入式Linux中进程调度怎样来解析

合作微信&#xff1a;xydf321456Linux是一套免费使用和自由传播的类Unix操作系统&#xff0c;是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的UNIX工具软件、应用程序和网络协议。1.前言处理机&#xff08;CPU&#xff09;是整个计算机系…

java 堆内存分析_JVM内存堆布局图解分析

JAVA能够实现跨平台的一个根本原因&#xff0c;是定义了class文件的格式标准,凡是实现该标准的JVM都能够加载并解释该class文件&#xff0c;据此也可以知道&#xff0c;为啥Java语言的执行速度比C/C语言执行的速度要慢了,当然原因肯定不止这一个&#xff0c;如在JVM中没有数据寄…

python生成奇数列表_python3:列出一个不需要迭代的奇数列表

您可以使用range为您生成列表&#xff1a;first_hundred_odd list(range(1, 200, 2)) # get an iterator in 1..200 range with step of 2在Python2.x上不需要将其转换为列表更新&#xff1a;是的&#xff0c;将range()迭代器转换为list实际上是在执行迭代来填充列表&#xff…

wpf表格datagrid拖动列_这才是老板要的Excel表格,你做的太丑了!

在网上看到一个高手做的Excel表格&#xff0c;非常的漂亮&#xff0c;今天我们一起仿做一下。原始的表格&#xff0c;再熟悉不过的样式&#xff1a;完成后的效果&#xff0c;是不是有让你颠覆三观的感觉&#xff1f;同样的数据&#xff0c;不同的展示方式&#xff0c;后者不但好…

java同步转化成异步_Java 如何把异步调用模拟成同步调用

在某些时候&#xff0c;须要把异步调用模拟成同步调用的形态。例如&#xff0c;基于基于异步通讯的客户端须要同步调用。 :-)异步要实现这个转换&#xff0c;能够有多种实现方法&#xff1a;this1。很经常使用的方法&#xff0c;应用循环机制&#xff1a;spaboolean flag fals…

python系统自学_如何系统地自学python

可以按照黑马程序员整理的这套教程来学习:一、Python入门这一阶段,你需要学习的知识点:如果学习能力还不错的话,这一阶段,只需要一个多月的时间Python视频教程:1、重磅级教程推荐,讲的非常好Python入门教程完整版(懂中文就能学会):http://pan.baidu.com/s/1miwZ1WW2、Python基础…

java实现加减乘除运算符随机生成十道题并判断对错_简单小程序——产生三十道小学四则运算题目...

题目要求程序可以生成三十道小学四则运算题目。因为要随机生成题目&#xff0c;则需要产生随机数&#xff0c;因此我上网搜索了生成随机数的方法&#xff0c;选择了使用Random类得到规定范围内的随机数。因为一个运算需要三个元素&#xff0c;两个参与运算的数字&#xff0c;一…

proteus跑马灯仿真_不花费一分钱,实现跑马灯编程实验

建立仿真工程初学者学习单片机编程&#xff0c;并不需要去网上买个开发板才能开始编程做实验&#xff0c;若是想先了解&#xff0c;可以先用proteus仿真软件来做实验&#xff0c;Protues软件具有其它EDA工具软件的功能。这些功能是&#xff1a;1&#xff0e;原理布图2&#xff…

java异常 说服力_异常常见面试题目

1) Java中什么是Exception?这个问题经常在第一次问有关异常的时候或者是面试菜鸟的时候问。我从来没见过面高级或者资深工程师的时候有人问这玩意&#xff0c;但是对于菜鸟&#xff0c;是很愿意问这个的。简单来说&#xff0c;异常是Java传达给你的系统和程序错误的方式。在ja…

linux下python脚本print中文显示不正确_在终端上运行python脚本,没有打印或显示-为什么?...

通过艰苦的学习Python&#xff0c;第25课。我尝试执行脚本&#xff0c;结果如下&#xff1a;myComp:lphw becca$ python l25myComp:lphw becca$终端中不打印或显示任何内容。这是密码。def breaks_words(stuff):"""This function will break up words for us.&q…

美团科技 Java工程师_美团网java工程师面试都会问哪些问题?

美团网java工程师面试主要考察面试者的专业知识&#xff0c;涉及TCP/IP 线程、synHashMap底层、进程关系、servlet生命周期、pringMVC单例异常、Object方法、ConcurrentHashMap、java并发包、线程池、zookeeper、SpringMVC、JMM、GC等&#xff0c;问的问题很细致&#xff0c;专…

线性共轭梯度法python_python实现的共轭梯度法

共轭梯度法是介于最速下降法与牛顿法之间的一个方法&#xff0c;它仅需利用一阶导数信息&#xff0c;但克服了最速下降法收敛慢的缺点&#xff0c;又避免了牛顿法需要存储和计算Hesse矩阵并求逆的缺点&#xff0c;共轭梯度法不仅是解决大型线性方程组最有用的方法之一&#xff…

java原子操作cas_java并发编程系列二:原子操作/CAS

什么是原子操作不可被中断的一个或者一系列操作实现原子操作的方式Java可以通过锁和循环CAS的方式实现原子操作CAS( Compare And Swap ) 为什么要有CAS&#xff1f;Compare And Swap就是比较并且交换的一个原子操作&#xff0c;由Cpu在指令级别上进行保证。为什么要有CAS&…

power bi 日期计算_PowerBI 动态计算周内日权重指数

在很多行业&#xff0c;尤其是零售业&#xff0c;其销售规律在一周内呈现一定的特点。例如&#xff1a;平时有一种购买特点&#xff1b;周末有一种购买特点。故而一周内的星期一到星期日呈现一定的权重分布。周内日权重分布1 到 12 表示月序号&#xff1b;1 到 7 表示周内日。这…

updatechecker.java_解决ehcache的UpdateChecker问题

问题描述项目中用了ssh框架&#xff0c;每次启动tomcat的时候都特别慢&#xff0c;会在这样一句话下面停留很久[2016-01-08 23:55:51,517 INFO UpdateChecker.java:doCheck:98] ---- New update(s) found: 2.6.5 [http://www.terracotta.org/confluence/display/release/Releas…