记录一次hiveserver2和namenode进程宕掉的排查

记录一次hiveserver2和namenode进程宕掉的排查

news/2025/4/18 17:36:01/文章来源:https://blog.csdn.net/u012841509/article/details/134546180

背景

最近发现集群主节点总有进程宕机，定位了大半天才找到原因，分享一下

排查过程

查询hiveserver2和namenode日志，都是正常的，突然日志就不记录了，直到我重启之后又恢复工作了。

在这里插入图片描述

排查各种日志都是正常的，直到查看Grafana，发现内存满了

在这里插入图片描述
在这个节点下已无内存资源可用，在服务宕掉的节点内存使用突然下降，猜测是linux内核的杰作，故查询系统日志

grep "Out of memory" /var/log/messages

在这里插入图片描述

果然存在因OOM被杀掉的进程

进程被杀的原因

Linux 内核有个机制叫OOM killer，全称为 Out Of Memory killer，很形象的一个名字——内存溢出杀手，这个机制会监控那些占用内存过大，尤其是瞬间占用内存很快的进程，为防止机器内存耗尽而主动把该进程杀掉。

当内核检测到系统内存不足、挑选并杀掉某个进程的过程可以参考内核源代码 linux/mm/oom_kill.c（2023-4-4 23:24:07确认了此文件存在），当系统内存不足的时候，out_of_memory() 函数被触发，然后调用 select_bad_process() 函数选择一个进程杀掉，这个选择的过程是通过调用 oom_badness() 函数实现的，挑选的算法和想法都暴力但朴实：就是找到最占用内存的进程。

出现问题的原因

最近刚刚增加了sentry和hivemetastore内存大小，导致机器内存不够了。

解决方案

1.调整机器进程分布，确保机器不会出现内存超用
2.可以通过设置/proc/sys/vm/overcommit_memory为不同的值来调整OverCommit策略。

overcommit_memory可以取3个值：

0：默认值，由Linux内核通过一些启发式算法来决定是否超售和超售的大小，一般允许轻微的超售，拒绝一些明显不可能提供的请求，同时做一些规则限制，比如不同用户overcommit的大小也不一样。
1：允许，不做限制的超售，当然这个也不是无限大，还受到寻址空间的限制，32位系统最大可能只有4G，64位系统大概16T左右。
2：禁止，禁止超售，系统能够分配的内存不会超过swap+实际物理内存*overcommit_ratio，该值可以通过/proc/sys/vm/overcommit_ratio设置，默认50%。

vi /etc/sysctl.conf
-- 添加
vm.overcommit_memory=1
-- 重启生效
sysctl -p

总结

如果你发现运行了一段时间的进程突然不见了，那可能是内核嫉妒生恨把它给干掉了
查询内存溢出被杀掉的进程可以直接通过系统日志来查 grep “Out of memory” /var/log/messages
也可以通过专门的命令查找 dmesg -T | grep “Out of memory”

阿里P7数据技术专家，修改简历、模拟面试+vx：wodatoucai

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/157953.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Vue3 插槽 v-slot

Vue3 插槽 v-slot

插槽视频链接：尚硅谷vue-插槽章节不使用插槽的情况下结果： 1 默认插槽在子组件中只能有一个结果： 2 具名插槽 #b是v-slot:b 的缩写顾名思义就是指着名字去插入结果： 3 作用域插槽可以传递数据的插槽&#…

阅读更多...

分享一些简单的英语问候语

分享一些简单的英语问候语

昨天和一个朋友聊天，他问我最近有没有某个国家的客户？我说只有一两个，都已经好久没有联系了，上一次问候还是在九月份。他说从十月底开始就收到很多来自当地的询盘，你不妨问下客户最近是否有新的需求？ 于是…

阅读更多...

python 实现蚁群算法（simpy带绘图）

python 实现蚁群算法（simpy带绘图）

这里使用了蚁群算法求解了旅行商问题，同时结合了simpy来绘图选择下一个食物的函数为： probability[i] pheromone[self.now][self.not_to_foods[i]] ** pheromone_w (1 / distance[self.now][self.not_to_foods[i]]) ** distance_w 该条路概率权重该点…

阅读更多...

idea pom导入net.sf.json的jar包失败

idea pom导入net.sf.json的jar包失败

开始在pom.xml文件中加入依赖如下 <dependency><groupId>net.sf.json-lib</groupId><artifactId>json-lib</artifactId><version>2.2.3</version> </dependency> maven reload project后，项目一直报：…

阅读更多...

排序算法--插入排序

排序算法--插入排序

实现逻辑 ① 从第一个元素开始，该元素可以认为已经被排序 ② 取出下一个元素，在已经排序的元素序列中从后向前扫描 ③如果该元素（已排序）大于新元素，将该元素移到下一位置 ④ 重复步骤③，直到找到已排序的元…

阅读更多...

【python基础】random模块常用方法讲解

【python基础】random模块常用方法讲解

文章目录前言random常用方法random.random()random.uniform(a,b)random.randint(a,b)random.randrange([start], stop[, step])random.choice(sequence)random.shuffle(x,[random])random.sample(sequence,k) 前言 Python标准库中的random函数，可以生成随机浮点数…

阅读更多...

【数据结构】树与二叉树（十八）：树的存储结构——Father链接结构、儿子链表链接结构

【数据结构】树与二叉树（十八）：树的存储结构——Father链接结构、儿子链表链接结构

文章目录 5.1 树的基本概念5.1.1 树的定义5.1.2 森林的定义5.1.3 树的术语 5.2 二叉树5.3 树5.3.1 树的存储结构1. 理论基础2. 典型实例 5.3.2 Father链接结构a. 定义树节点结构b. 创建新节点c. 主函数d. 代码整合 5.3.3 儿子链表链接结构a. 定义树节点结构b. 创建新节点c. 添加…

阅读更多...

为什么录屏没声音？实用技巧大放送！

为什么录屏没声音？实用技巧大放送！

录屏已成为我们在数字时代记录和分享内容的重要方式之一。但有时，您可能会遇到录制视频却没有声音的问题。这个问题可能出现在不同的录屏软件中，导致许多人感到疑惑。在本文中，我们将探讨为什么录屏没声音，并提供两种解决方案&…

阅读更多...

C语言实现堆栈和队列(动态)

C语言实现堆栈和队列(动态)

行路难！行路难！多歧路，今安在？长风破浪会有时，直挂云帆济沧海。————李白一 .堆栈 1 什么是堆栈堆栈是一种特殊的线性表，堆栈中的元素以及元素之间的逻辑关系和线性表完全相同。在操作上的差别是线性…

阅读更多...

springboot+jsp+bootstrap+java问卷调查系统

springboot+jsp+bootstrap+java问卷调查系统

系统功能需求包含业务需求和功能需求，系统功能需求分析是在了解用户习惯、开发人员技术和实力等各个因素的前提下，对其进行深入分析，了解系统基本需求后，基本功能如下： 本课题要求实现优质的问卷调查系统，就…

阅读更多...

安全框架springSecurity+Jwt+Vue-2(后端开发)

安全框架springSecurity+Jwt+Vue-2(后端开发)

一、创建项目及配置 ①：创建新的项目及常用包 ②：引入依赖和配置 devtools：项目的热加载重启插件 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId&…

阅读更多...

如何配置ESB单据集成接口

如何配置ESB单据集成接口

ESB企业服务总线在实际项目中主要用于各业务系统之间的集成，集成包括数据集成、应用集成以及业务单据集成等，ESB企业服务总线主要包含三部分：ESB设计器、SMC管理控制台以及Server运行环境，ESB设计器用于服务以及集成流程的开发&am…

阅读更多...

【C++ 设计模式】面向对象设计原则 Template Method 模式 Strategy 策略模式

【C++ 设计模式】面向对象设计原则 Template Method 模式 Strategy 策略模式

一、面向对象设计原则重新认识面向对象 理解隔离变化 • 从宏观层面来看，面向对象的构建方式更能适应软件的变化， 能将变化所带来的影响减为最小 各司其职 • 从微观层面来看，面向对象的方式更强调各个类的“责任” • 由于需求变化导…

阅读更多...

Tesco EDI需求分析

Tesco EDI需求分析

Tesco，成立于1919年，是一家全球领先的综合性零售企业，总部位于英国。公司致力于提供高质量、多样化的商品和服务，以满足客户的需求。Tesco的使命是通过创新和卓越的客户服务，为客户创造更美好的生活。多年来&#xff0…

阅读更多...

vue2.x源码刨析-new Vue的时候做了什么(手写简易版01)

vue2.x源码刨析-new Vue的时候做了什么(手写简易版01)

本篇文章大致的介绍一下new Vue的过程， 首先我们在生成一个Vue实例化对象的时候，一般会这样写： <div id"app" style"color: red">{{name}} dep {{age}} dep {{name}}</div> const vm new Vue({data() {ret…

阅读更多...

【idea】解决idea 执行maven build总下载 Downloading maven-metadata.xml文件

【idea】解决idea 执行maven build总下载 Downloading maven-metadata.xml文件

可以看到如下日志中打印了执行的命令行，其中包含 --update-snapshots，是强制更新的意思。日志内容如下： D:\env\jdk1.8.0_261\bin\java.exe --update-snapshots -s D:\env\apache-maven-3.8.6\conf\settings.xml -Dmaven.repo.localD:\env\…

阅读更多...

【开源】基于Vue.js的天然气工程业务管理系统的设计和实现

【开源】基于Vue.js的天然气工程业务管理系统的设计和实现

项目编号： S 021 ，文末获取源码。 \color{red}{项目编号：S021，文末获取源码。} 项目编号：S021，文末获取源码。目录一、摘要1.1 项目介绍1.2 项目录屏二、功能模块三、使用角色3.1 施工人员3.2 管理员四…

阅读更多...

tomcat （SCI）ServletContainerInitializer 的加载原理

tomcat （SCI）ServletContainerInitializer 的加载原理

问题：使用WebScoket的时候发现通过ServerEndpoint方式注册上去的url无法访问，报错404 经过排查发现在WsServerContainer这个类中的addEndpoint方法一直没有触发ServerEndpoint注解的扫描通过该方法来源于StandardContext.startInternal()方法的调用如下…

阅读更多...

CSS特效015：7个小球转圈圈加载效果

CSS特效015：7个小球转圈圈加载效果

CSS常用示例100专栏目录本专栏记录的是经常使用的CSS示例与技巧，主要包含CSS布局，CSS特效，CSS花边信息三部分内容。其中CSS布局主要是列出一些常用的CSS布局信息点，CSS特效主要是一些动画示例，CSS花边是描述了一些CSS…

阅读更多...

ERP对接淘宝/天猫/京东/拼多多商品详情数据API接口

ERP对接淘宝/天猫/京东/拼多多商品详情数据API接口

引言今天，我们时代变化非常快，传统行业做法，已经无法完全适应时代的发展。互联网的发展，造成了一股网购热。京东，天猫，淘宝，易购……网购，给我们生活带来了方便，消费者…

阅读更多...

最新文章