K8S容器OOM killed排查

K8S容器OOM killed排查

news/2025/4/5 4:11:47/文章来源:https://blog.csdn.net/bruce128/article/details/132575142

背景

数据服务平台南海容器k8s设置的内存上限2GB，多次容器被OOM killed。

启动命令

java -XX:MaxRAMPercentage=70.0 -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/apps/logs/ ***.jar

排查过程

1 当收到实例内存超过95%告警时，把jvm进程堆dump下来后，用visual vm分析堆内存，并未发现内存泄漏。推测进程就需要花较多的内存，是内存分配不够。遂将内存增加到4GB。继续观察

2 南海和顺德docker实例依然OOM killed。当实例内存超过95%时，dump出堆内存并分析，依然没有发现内存泄漏，比较正常。

3 怀疑是容器内部除了java的其他进程耗用了容器内存。当实例内存超过95%时，对比top显示的的jvm进程内存和ps stats输出的docker实例内存信息，其余进程耗用的内存忽略不计。

4 由于堆内存没有的到达上限，但是整个jvm进程内存超出了容器的内存限制。因此推测是对外内存（本地内存，栈内存等，元数据空间等）耗用较大，执行命令

/****/jcmd 1 VM.native_memory

VM.native_memory特性并未开启。

5 观察到一个现象，docker进程被oom killed之前，java应用堆内存并没有被Full gc。并且堆内存没有用到上限值2.8GB(4 * 0.7)。docker是go语言编写，并没有GC的能力。docker耗用完内存前，堆内存并没有达到上限，于是没有触发老年代GC，内存没有降下去。当堆内存不够的时候，依然会找docker容器申请内存。

6 修改jvm配置，将南海的MaxRAMPercentage降到60，南海分组的堆内存上限变成2.4GB(4 * 0.6),顺德分组不变。并增加-XX:NativeMemoryTracking=summary配置。8.18日重启所有实例使新增的配置生效。观察一段时间
请添加图片描述

发现南海分组的full gc更加频繁，继续观察

结论

如果容器OOM killed，容器里的jvm进程没有Full GC，那么肯定是MaxRAMPercentage参数太高，导致堆内存没有用到上限，无法触发堆内存（老年代）GC。这个情况下就需要把MaxRAMPercentage参数适当调低。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/63823.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Data Rescue Professional for Mac：专业的数据恢复工具

Data Rescue Professional for Mac：专业的数据恢复工具

在数字化时代，我们的生活和工作离不开电脑和存储设备。但是，意外情况时常发生，例如误删除文件、格式化硬盘、病毒攻击等，这些都可能导致重要的数据丢失。面对数据丢失，我们迫切需要一款可靠的数据恢复工具。今天&#…

阅读更多...

YOLOv8目标检测实战：TensorRT加速部署（视频教程）

YOLOv8目标检测实战：TensorRT加速部署（视频教程）

课程链接：https://edu.csdn.net/course/detail/38956 PyTorch版的YOLOv8是先进的高性能实时目标检测方法。 TensorRT是针对英伟达GPU的加速工具。本课程讲述如何使用TensorRT对YOLOv8目标检测进行加速和部署。 •采用改进后的tensorrtx/yolov8的代码，…

阅读更多...

全民健康生活方式行动日，天猫健康联合三诺生物推出“15天持续测糖计划”

全民健康生活方式行动日，天猫健康联合三诺生物推出“15天持续测糖计划”

糖尿病是全球高发慢性病中患病人数增长最快的疾病，是导致心血管疾病、失明、肾衰竭以及截肢等重大疾病的主要病因之一。目前中国有近1.4亿成人糖尿病患者，科学的血糖监测和健康管理对于糖尿病患者来说至关重要。在9月1日全民健康生活方式行动日前夕&am…

阅读更多...

Homebrew下载安装及使用教程

Homebrew下载安装及使用教程

Homebrew是什么？ 简单来说，就是用命令行的形式去管理mac系统的包或软件。安装命令 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"国内请使用镜像源进行下载执行上述命令后会要求输入…

阅读更多...

工具分享 | PDF文档解析工具PyMuPDF

工具分享 | PDF文档解析工具PyMuPDF

1 需求描述最近工作需要从PDF文档中按照章节解析出对应的文本和图片(后续可能还会有表格)，经过调研，找到了一个功能强大的解析工具MuPDF，对应的Python包是PyMuPDF。本篇博客记录使用它来实现具体功能。官方文档：https://pymupd…

阅读更多...

JavaScript 生成 16: 9 宽高比

JavaScript 生成 16: 9 宽高比

这篇文章只是对 for 循环一个简单应用，没有什么知识含量。可以跳过这篇文章。只是我用来保存一下我的代码，保存在本地我嫌碍眼，总想把他删了。正文部分公式：其中 width 表示宽度，height 表示高度 16 9 w i d t…

阅读更多...

sql各种注入案例

sql各种注入案例

目录 1.报错注入七大常用函数 1)ST_LatFromGeoHash (mysql>5.7.x) 2)ST_LongFromGeoHash （mysql>5.7.x） 3)GTID (MySQL > 5.6.X - 显错<200) 3.1 GTID 3.2 函数详解 3.3 注入过程( payload ) 4)ST_Pointfromgeohash (mysql>5.…

阅读更多...

【python使用 Pillow 库】缩小|放大图片

【python使用 Pillow 库】缩小|放大图片

当我们处理图像时，有时候需要调整图像的大小以适应特定的需求。本文将介绍如何使用 Python 的 PIL 库（Pillow）来调整图像的大小，并保存调整后的图像。环境准备在开始之前，我们需要安装 Pillow 库。可以使用以下命令…

阅读更多...

【学习笔记】fhq Treap实现文艺平衡树

【学习笔记】fhq Treap实现文艺平衡树

没有学习过 fhq Treap 的可以看我上一篇文章，看过的建议去再看看分裂和合并操作回顾在上一篇文章中提到，fhq Treap 可以支持比较多的操作，文艺平衡树就是其中一种，其实就是可以实现区间操作（翻转）的平衡…

阅读更多...

面试官问我MySQL和MariaDB的联系和区别，这我能不知道？

面试官问我MySQL和MariaDB的联系和区别，这我能不知道？

🏆作者简介，黑夜开发者，CSDN领军人物，全栈领域优质创作者✌，CSDN博客专家，阿里云社区专家博主，2023年6月CSDN上海赛道top4。 🏆数年电商行业从业经验，历任核心研发工程师…

阅读更多...

MQTT，如何在SpringBoot中使用MQTT实现消息的订阅和发布

MQTT，如何在SpringBoot中使用MQTT实现消息的订阅和发布

一、MQTT介绍 1.1 什么是MQTT？ MQTT（Message Queuing Telemetry Transport，消息队列遥测传输协议），是一种基于发布/订阅（publish/subscribe）模式的“轻量级”通讯协议，该协议构建于…

阅读更多...

广场舞音乐制作软件，FL Studio怎么做广场舞音乐

广场舞音乐制作软件，FL Studio怎么做广场舞音乐

广场舞一直以来都是许多人日常的消遣方式之一，富有节奏感的音乐能够让人沉浸其中，这也说明了音乐的重要性。那么如果我们想自己制作一个广场舞风格的音乐，需要具备哪些条件呢？今天我们就来说一说广场舞音乐制作软件，FL…

阅读更多...

大数据专业毕业能从事什么工作

大数据专业毕业能从事什么工作

大数据从业领域很宽广，不管是科技领域还是食品产业，零售业等都是需要大数据人才进行大数据的处理，以提供更好的用户体验，优化库存降低成本预测需求。大数据开发做什么？ 大数据开发分两类，编写Hadoop、Spa…

阅读更多...

无涯教程-JavaScript - POISSON函数

无涯教程-JavaScript - POISSON函数

POISSON函数取代了Excel 2010中的POISSON.DIST函数。描述该函数返回泊松分布。泊松分布的常见应用是预测特定时间的事件数。语法 POISSON(x,mean,cumulative)争论 Argument描述Required/OptionalXThe number of events.RequiredMeanThe expected numeric value.Require…

阅读更多...

C# XML格式转换字典

C# XML格式转换字典

public static Dictionary<string, string> GetXmlStr(string xmlStr) //获取 xml 字符串转字典 { Dictionary<string, string> kv new Dictionary<string, string>(); XmlDocument x new XmlDocument(); …

阅读更多...

【每日一题】66. 加一，1822. 数组元素积的符号，682. 棒球比赛

【每日一题】66. 加一，1822. 数组元素积的符号，682. 棒球比赛

66. 加一 - 力扣（LeetCode） 给定一个由整数组成的非空数组所表示的非负整数，在该数的基础上加一。最高位数字存放在数组的首位， 数组中每个元素只存储单个数字。你可以假设除了整数 0 之外，这个整数不会以零开头…

阅读更多...

RISC-V交叉工具链riscv-gnu-toolchain编译

RISC-V交叉工具链riscv-gnu-toolchain编译

文章目录 1、下载2、编译1. 依赖安装2. 编译 3、运行 1、下载 $ sudo apt-get install git wget build-essential $ git clone https://github.com/riscv-collab/riscv-gnu-toolchain $ git checkout 2023.06.02注意上面 clone 的仓库，我们称其为构建脚本仓库&…

阅读更多...

K8s：一文认知 CRI，OCI，容器运行时，Pod 之间的关系

K8s：一文认知 CRI，OCI，容器运行时，Pod 之间的关系

写在前面博文内容整体结构为结合华为云云原生课程整理而来,部分内容做了补充课程是免费的，有华为云账户就可以看，适合理论认知，感觉很不错。有需要的小伙伴可以看看，链接在文末理解不足小伙伴帮忙指正对每个人而言&#xff0c…

阅读更多...

Linux之web服务器

Linux之web服务器

目录 www简介常见Web服务程序介绍服务器主机主要数据浏览器网址及HTTP简介 URL http请求方法状态码 MIME（Multipurpose Internet Mail Extension） www服务器的类型静态网站动态网站 Apache服务的搭建 Apache的安装准备工作 htt…

阅读更多...

在支付宝中下载社会保险参保证明方法

在支付宝中下载社会保险参保证明方法

这里我们打开支付宝选择市明中心然后选择社保这里在社保查询下找到个人社会参保证明查询这里选择好自己的省市区文件就会出现在下面了我们直接点击这个文件进入下面就会有下载的选项了

阅读更多...

最新文章