目录
分析问题
hs_err_pid.log
上周排查了一个java应用的崩溃问题,在这里记录一下。
分析问题
首先是排查到/tmp目录下有很多的core文件,形式类似:
core-18238-java-1705462412 1.3 GB 程序崩溃数据 2024-01-17 11:33:44
core-18108-java-1705462399 1.3 GB 程序崩溃数据 2024-01-17 11:35:54
.
.
.
.
core文件,通常是指程序在运行过程中发生严重错误(比如段错误)时生成的一种文件。它记录了程序在崩溃时的内存状态、寄存器信息等,有助于开发者在调试时找到问题所在。一般出现在tmp目录下。
我们在这里可以看到许多core文件,并且文件名中包含java字样,说明这是java应用崩溃的core文件。
hs_err_pid.log
Java应用崩溃的信息往往存储在hs_err_pid.log里面,其中pid是进程的id。
本次崩溃的hs_err_pid.log日志也在tmp下,我们来分析下其中的内容:
日志的一开头会是一些基本信息,比如用到的jdk版本(Line 6),断点的信息(Line 9)等等。
通过开头我们可知,Java应用是在strcpy处断错误的。
再继续看Stack段:
从Stack部分我们可以看出,断错误发生在ScanDevice.so里,com.xwj.verify.ScanDevice.getDeviceList中。
之后联系了维护ScanDevice.so的同事排查,发现是其中的getDeviceList函数的bug,修复了问题后应用可以正常使用,不再崩溃。