记一次线上服务假死排查过程

大家好,我是烤鸭:

     最近线上问题有点多啊,分享一个服务假死的排查过程。

问题描述

9点10分,收到进程无响应报警(一共6台机器,有1台出现),后来又有1台出现。

排查思路

首先确认是否误报或者网络抖动,登陆服务器查看进程存在。

查看cat监控,发现gc次数和gc耗时都升高,基本确认是oom导致的。

在这里插入图片描述

当时由于优先处理问题,服务重启后,没办法找到oom源头了(进程命令包含oom记录,但是没生成oom日志)。

-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/data/logs/

jvm 参数:

jvm_args: -Xms8g -Xmx8g -Xmn4g -Xss256k -XX:MetaspaceSize=512m -XX:MaxMetaspaceSize=512m -Dlog4j2.formatMsgNoLookups=true -XX:+UseG1GC -XX:+UnlockExperimentalVMOptions -XX:InitiatingHeapOccupancyPercent=45 -XX:G1MixedGCLiveThresholdPercent=65  -XX:MaxTenuringThreshold=10 -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/data/logs/ -XX:ErrorFile=/data/logs/hs_err_%p.error -XX:+PrintTenuringDistribution -XX:+PrintGCApplicationStoppedTime -XX:+PrintClassHistogram -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintHeapAtGC -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=5 -XX:GCLogFileSize=100M -Xloggc:/data/logs/gc.gclog -XX:-OmitStackTraceInFastThrow 

但是生成了error日志(hs_err_%p.erro)。其中的Core dump文件生成是有条件,一般Linux是关掉的.可以通过 ulimit -a 这个命令进行查看。

#
# There is insufficient memory for the Java Runtime Environment to continue.
# Native memory allocation (mmap) failed to map 8589934592 bytes for committing reserved memory.
# Possible reasons:
#   The system is out of physical RAM or swap space
#   In 32 bit mode, the process size limit was hit
# Possible solutions:
#   Reduce memory load on the system
#   Increase physical memory or swap space
#   Check if swap backing store is full
#   Use 64 bit Java on a 64 bit OS
#   Decrease Java heap size (-Xmx/-Xms)
#   Decrease number of Java threads
#   Decrease Java thread stack sizes (-Xss)
#   Set larger code cache with -XX:ReservedCodeCacheSize=
# This output file may be truncated or incomplete.
#
#  Out of Memory Error (os_linux.cpp:2627), pid=13887, tid=0x00007ff3239f9700
#
# JRE version:  (8.0_111-b14) (build )
# Java VM: Java HotSpot(TM) 64-Bit Server VM (25.111-b14 mixed mode linux-amd64 compressed oops)
# Failed to write core dump. Core dumps have been disabled. To enable core dumping, try "ulimit -c unlimited" before starting Java again
#

在这里插入图片描述

后来下午又出现了,dump出来了gc日志,通过工具分析(jprofiler)。

可以看出String和charp[]加起来就5G多了。

在这里插入图片描述

后来又看了下String和char[],基本就是字段名称。基本就是确定是大对象导致的问题,最后查一下大对象是哪个中间件返回的。(mongo、redis、db、es)

在这里插入图片描述

找到一个业务对象,查一下引用,发现是mongo查询导致的。

在这里插入图片描述

根因分析

代码运行很长时间都没有问题,为什么会出现oom。

后来发现上游分页参数的page太大了,导致这个问题。

虽然是恶意请求,不过也应该尽量避免这种问题。(参数为空或者数值过大,都应该限制下)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/412491.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[css] 简述下你理解的优雅降级和渐进增强

[css] 简述下你理解的优雅降级和渐进增强 优雅降级,先做好一个完善的具备完整体验的版本,再向下做兼容。 渐进增强,先做好一个可以基本正常使用的版本,再慢慢丰富体验和内容。个人简介 我是歌谣,欢迎和大家一起交流前…

vue小记

1.vue绑定属性&#xff0c;点击事件 1.<!-- 完整语法 --> <a v-bind:href"url">...</a><!-- 缩写 --> <a :href"url">...</a>2.<!-- 完整语法 --> <a v-on:click"doSomething">...</a>&l…

nacos注册中心自动上下负载

大家好&#xff0c;我是烤鸭&#xff1a; 还有2天就过年了&#xff0c;祝大家新年快乐。最近好久没写技术文章了&#xff0c;还是得回归下主业&#xff0c;今天分享下nacos注册中心自动上下负载的方式和组件。 组件版本 <properties><java.version>1.8</java.v…

[css] 清除浮动的方式有哪些及优缺点?

[css] 清除浮动的方式有哪些及优缺点&#xff1f; 什么是盒子塌陷&#xff1f; 外部盒子本应该包裹住内部的浮动盒子&#xff0c;结果却没有。问题出现的原因 父元素只包含浮动元素&#xff0c;那么它的高度就会塌缩为零&#xff08;前提就是你们没有设置高度&#xff08;heig…

windows10 C盘清理

大家好&#xff0c;我是烤鸭&#xff1a; 身为一个号称修电脑的&#xff0c;磁盘清理是必备技能了。前几天刚出的新闻 男子帮女友清理电脑C盘&#xff0c;扫出17万个文件。 想必大家都经历过清理C盘的痛苦&#xff0c;这两天正好又清了&#xff0c;分享下。 先给个结论&#…

JS代码计算股票涨停

这个纯粹是给自己留做备份用的&#xff0c;股票涨停有一个计算公式&#xff0c;但是为了自己方便查看股票涨了多少钱&#xff0c;还是决定自己写了一个 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>…

[css] 简述你对BFC规范的理解

[css] 简述你对BFC规范的理解 是CSS中的一个渲染机制&#xff0c;BFC就相当于一个盒子&#xff0c;内部的元素与外界的元素互不干扰。它不会影响外部的布局&#xff0c;外部的布局也不会影响到它。形成条件&#xff08;任意一条&#xff09;float的值不是noneposition 的值不是…

《实现领域驱动设计》读书笔记

大家好&#xff0c;我是烤鸭&#xff1a; 《实现领域驱动设计》&#xff0c;读书笔记&#xff0c;贴个封面&#xff0c;要不不知道是哪本。 了解概念 刚开始接触DDD&#xff0c;肯定懵逼&#xff0c;很多名词&#xff0c;一点点看下。 领域&#xff1a;带有业务属性的范…

[css] 用css创建一个三角形,并简述原理

[css] 用css创建一个三角形&#xff0c;并简述原理 width: 0;height: 0;margin: 100px auto;border-top: 50px solid transparent;border-left: 50px solid transparent;border-right: 50px solid transparent;border-bottom: 50px solid red;个人简介 我是歌谣&#xff0c;欢…

spring junit单元测试

项目是有很多个功能块组成的&#xff0c;我们开发的时候&#xff0c;当我们开发出来一个功能&#xff0c;想要测试这个功能是否正确&#xff0c;不可能等到前端和后端全部写好了再进行测试&#xff0c;这样太浪费时间&#xff0c;有没有什么方法能直接测试后台的功能写的是否正…

windows docker redis

大家好&#xff0c;我是烤鸭&#xff1a; docker真的太方便了&#xff0c;尤其是对windows系统&#xff0c;友好的不得了。以前还只能是正版的专业版才能用&#xff0c;现在已经没有限制了&#xff0c;虽然加了收费&#xff0c;个人用免费就够了。redis 新版也不支持windows系统…

[css] CSS3新增伪类有哪些并简要描述

[css] CSS3新增伪类有哪些并简要描述 个人简介 我是歌谣&#xff0c;欢迎和大家一起交流前后端知识。放弃很容易&#xff0c; 但坚持一定很酷。欢迎大家一起讨论 主目录 与歌谣一起通关前端面试题

模拟微信自动化发送(微信公众号文章自动点击)

大家好&#xff0c;我是烤鸭&#xff1a; 分享个微信自动化发送的新方式&#xff0c;仅技术分享。 本来是公众号文章抓取相关的&#xff0c;审核一直不过&#xff0c;将就看吧。 需要的工具 Java&#xff08;jdk1.8&#xff09; Fiddler Python&#xff08;3.8&#xff09;…

Entity FrameWork 操作使用详情

Entity FrameWork 是以ADO.net为基础发展的ORM解决方案。 一、安装Entity FrameWork框架 二、添加ADO.Net实体数据模型 三、EF插入数据 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks;namespace EFDem…

[css] CSS选择器有哪些?哪些属性可以继承?

[css] CSS选择器有哪些&#xff1f;哪些属性可以继承&#xff1f; 选择器通配符idclass标签后代选择器子选择器兄弟选择器属性选择器伪类选择器伪元素选择器可以继承的属性font-sizefont-weightfont-stylefont-familycolor个人简介 我是歌谣&#xff0c;欢迎和大家一起交流前…

《redis 设计与实现》读书笔记

大家好&#xff0c;我是烤鸭&#xff1a; 《redis 设计与实现》&#xff0c;读书笔记。 第一部分 数据结构与对象 第2章 简单动态字符串 Redis 使用SDS 作为字符串表示。 O(1) 复杂度获取字符串长度。 杜绝缓冲区溢出。 减少修改字符串长度时所需的内存重分配次数。 …

网络通信中TCP出现的黏包以及解决方法 socket 模拟黏包

粘包问题概述 1.1 描述背景 采用TCP协议进行网络数据传送的软件设计中&#xff0c;普遍存在粘包问题。这主要是由于现代操作系统的网络传输机制所产生的。我们知道&#xff0c;网络通信采用的套接字(socket)技术&#xff0c;其实现实际是由系统内核提供一片连续缓存(流缓冲)来…

[css] 在页面上隐藏元素的方法有哪些?

[css] 在页面上隐藏元素的方法有哪些&#xff1f; position配合z-index; 或者 left/top/bottom/right &#xff1a; -100%&#xff1b;margin-left: -100%;width: 0; height: 0; overflow: hidden;这个算吗opacity: 0;display:none;transform: scale(0)/translateX(-100%)/tran…

[css] CSS3有哪些新增的特性?

[css] CSS3有哪些新增的特性&#xff1f; 边框圆角border-radius盒子阴影box-shadow文字阴影text-shadow2d、3d变换transformrotate()scale()skew()translate()过度动画transition自定义动画animation(只记得这些了)个人简介 我是歌谣&#xff0c;欢迎和大家一起交流前后端知…

windows docker redis 集群部署

大家好&#xff0c;我是烤鸭&#xff1a; 上次分享了windows docker redis&#xff0c;这么快就不够用了&#xff0c;单机的不行&#xff0c;整个集群的&#xff0c;看了网上的教程都好麻烦&#xff0c;简单点。 单机的&#xff1a;https://blog.csdn.net/Angry_Mills/article…