记录背景
公司仓库系统经常反馈出现系统使用不了503的情况,自动挂掉。
启动脚本添加命令
以为是程序发生OOM导致内存溢出,添加命令,发生内存溢出输出文件
-XX:+HeapDumpOnOutOfMemoryError -XX:ErrorFile=./errorfile.log -XX:HeapDumpPath=./app.dump
HeapDumpOnOutOfMemoryError 指示 JVM 在遇到 OutOfMemoryError 错误时将 heap 转储到物理文件中。
HeapDumpPath 表示要写入文件的路径; 可以给出任何文件名;
仓库再次反馈程序使用不了
登录机器发现没内存溢出的dump文件输出,查看日志输出也没有OutOfMemoryError错误。
发现一个新的可能被kill的原因
- java本身发生OOM,即日志中打印"java.lang.OutOfMemoryError: Java heap space"
- 被linxu操作系统执行OOM-Killer
排查linxu操作系统执行OOM-Killer
查看java进程数据
dmesg | grep java
查看被系统杀死的进程
dmesg | egrep -i 'killed process'
至此已经确定了程序挂掉的原因是触发了OOM Killer机制
解决方案(没有什么事钱解决不了的问题!!!)
阿里云出现OOM Killer的原因及解决方案
当然咱公司没加钱,内部系统,挂掉重启!!!
仓库又又又反馈程序使用不了
这次就不一样了,发现了有dump文件,也就是说明发生了内存溢出。
使用jvisualvm打开dump文件排查
定位具体方法
使用MAP打开dump文件排查
定位com.spire.doc.packages.sprjzp这个类
确定代码
inputStream = DocUtils.replaceContent(dataMap, "模版文件", false);
具体代码就不拉出来了
看一下启动脚本
最大堆内存只有1g
-Xms1024m -Xmx1024m
最后
问题确定了就行,咱们都是打工人,具体问题具体分析了!!!