flink Jobmanager metaspace oom 分析

文章目录

    • 现象
    • 作业背景
    • 分析
      • 现象分析
      • 类卸载条件
      • MAT 分析
    • 解决办法
    • flink 官方提示

现象

通过flink 页面提交程序,多次提交后,jobmanager 报metaspace oom

作业背景

用户代码是flink 代码+Spring +nacos

分析

现象分析

从现象来看肯定是因为有的类没有被正确卸载导致的

类卸载条件

要卸载一个 Java 类,需要满足以下几个基本条件:

该类没有被任何引用对象所引用。也就是说,没有其他对象持有该类的引用。

该类的类加载器已经不再使用。如果一个类的类加载器还在使用,那么这个类就无法被卸载。

该类的 Class 对象已经从内存中被清除。只有当 Class 对象被从内存中移除,类的定义和字节码才算真正被卸载。

该类没有任何静态方法或静态变量被其他类所引用。如果有其他类持有该类的静态成员的引用,那么这个类也无法被卸载

MAT 分析

从MAT Duplicate Class 功能分析来看,确实是多个类被重复加载,从引用关系上来说可以看到重复的类被线程所引用,正常来说这些线程应该是正常结束的,然后用arthas 分析了下nacos 这个线程ClientWorker 是一个守护线程只有jobmanager 结束线程会会正常结束

排除了nacos,看现象还有类重复加载,继续分析,发现是log4j 注册了钩子 函数,导致的

我用简单的代码还原了钩子函数下这个问题,从mat 分析来看是一样的

private static String name = "xxxl";public void launcher(String[] args) {StreamExecutionEnvironment executionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment();executionEnvironment.socketTextStream("localhost", 9092).print();try {Runtime.getRuntime().addShutdownHook(new Thread(new Runnable() {@Overridepublic void run() {System.out.println(name);}}));executionEnvironment.execute("aa");} catch (Exception e) {throw new RuntimeException(e);}}

解决办法

解决办法,因为作业代码不好修改,对于这种有spring那一套的实时作业程序来讲,不适合从页面提交,从客户端直接提交,不会有这个问题,为啥从客户端提交不会有这问题,因为从页面提交,实际上是在jobmanager 这个进程里去搞,相当于会把这个进程给污染了,从客户端来说,每次提交都交都是全新的环境。

这个和部署也有一定的关系,如果是application 和per-job 模式,每次都会有一个新的jobmanager,也不会有这问题,实际上生产用的是k8s部署,用的session mode 模式,就会有这个问题

在这里插入图片描述

flink 官方提示

其实flink 官方已经注意到了这个问题,给出了常见的原因和解决方案

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/21258.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python教程-快速入门基础必看课程06-List索引

摘要 该视频主要讲述了Python中for循环的基本结构和用法,特别是针对处理复杂数据结构如list of list的情况。首先介绍了for循环的基本概念,然后通过实例详细解释了如何遍历list中的元素,并解决了单层for循环无法处理list of list的问题。视频…

Linux系统-前台任务组,后台任务组

文章目录 前台进程后台进程新命令jobsfg 【后台进程组序号】ctrlz组合键信号 和 bg命令ctrlz组合键信号bg 【后台进程组序号】 session会话此时我们关闭本次的会话,我们的后台进程是否也会退出呢? 总结 前台进程 在我们远程登录Linux服务器后&#xff0…

【Java基础-注解】Java中注解的分类有哪些,如何自定义一个注解,并使用举例

在Java中,注解(Annotation)是一种元数据(metadata)的形式,用于为Java代码(类、方法、变量、参数、包等)提供信息。注解不会直接影响代码的执行,但可以被编译器用来生成代…

APP上架 篇四:计算机软件著作权证书和APP电子版权证书

文章目录 系列文章概念《计算机软件著作权证书》和《软件著作权认证证书》《APP电子版权证书》和《软件著作权认证证书》申请《计算机软件著作权证书》中国版权保护中心的官方网站申请流程费用详情软件更新后续维护申请《软件著作权认证证书》和《APP电子版权证书》“易版权”官…

创建__init__()方法

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 在创建类后,可以手动创建一个__init__()方法。该方法是一个特殊的方法,类似Java语言中的构造方法。每当创建一个类的新实例时…

【AI界的狼人杀】人工智能“反图灵测试”实验

5月28日, AI Power Users、Unity 独立开发者:Tore Knabe 在其社交平台发布了一则名为《Reverse Turing Test Experiment with AIs》的视频,立马引发了热议。 视频中共出现了五位主要角色,“他们”分别是:亚里士多德&am…

961操作系统知识总结

部分图片可能无法显示,参考这里:https://zhuanlan.zhihu.com/p/701247894 961操作系统知识总结 一 操作系统概述 1. 操作系统的基本概念 重要操作系统类型:批处理操作系统(批量处理作业,单道批处理/多道批处理系统,用…

RabbitMQ-直连交换机(direct)使用方法

RabbitMQ-默认读、写方式介绍 RabbitMQ-发布/订阅模式 目录 1、概述 2、直连交换机 3、多重绑定 4、具体代码实现 4.1 生产者部分 4.2 消费者部分 5、运行代码 6、总结 1、概述 直连交换机,可以实现类似路由的功能,消息从交换机发送到哪个队列…

夜天之书 #98 Rust 程序库生态合作的例子

近期主要时间都在适应产品市场(Product Marketing)的新角色,不少想法还在酝酿和斟酌当中,于是文章输出没有太多时间来推敲和选题,只能保持每月发布相关的进展或一些零碎的思考。或许我可以恢复最早的模式,多…

C#面:说出尽可能多的基于.Net Framework的语言

C#、VB.Net、F#、PowerShell、IronPython、J#、Ruby.Net C#是一种基于.Net Framework的编程语言,是微软公司开发的一种通型、面向对象的编程语言。C#可以用于开发种类型的应用程序,包括桌面应用程序、Web应用程序、移动应用程序和游戏等。 除了C#之外&…

YOLOv8改进(一)-- 轻量化模型ShuffleNetV2

文章目录 1、前言2、ShuffleNetV2代码实现2.1、创建ShuffleNet类2.2、修改tasks.py2.3、创建shufflenetv2.yaml文件2.4、跑通示例 3、碰到的问题4、目标检测系列文章 1、前言 移动端设备也需要既准确又快的小模型。为了满足这些需求,一些轻量级的CNN网络如MobileNe…

如何进入docker容器中

要进入正在运行的Docker容器&#xff0c;您可以使用docker exec命令。这里是一个基本的命令示例&#xff1a; docker exec -it <container_id_or_name> /bin/bash这里的-it参数是为了让我们能交互式地使用容器的shell。<container_id_or_name>是您想要进入的容器的…

十_信号4-SIGCHLD信号

SIGCHLD信号 在学习进程控制的时候&#xff0c;使用wait和waitpid系统调用何以回收僵尸进程&#xff0c;父进程可以阻塞等待&#xff0c;也可以非阻塞等待&#xff0c;采用轮询的方式不停查询子进程是否退出。 采用阻塞式等待&#xff0c;父进程就被阻塞了&#xff0c;什么都干…

力扣83. 删除排序链表中的重复元素

Problem: 83. 删除排序链表中的重复元素 文章目录 题目描述思路复杂度Code 题目描述 思路 1.定义快慢指针fast、slow均指向head&#xff1b; 2.每次fast后移一位&#xff0c;当fast和slow指向的节点值不一样时&#xff0c;将slow.next指向fast同时使slow指向fast&#xff1b; 3…

MyBatis框架-开发方式+参数传递+#{}、${}+返回值处理+查询结果封装为对象+resultType

一、开发方式 MyBatis-Dao层Mapper接口化开发 二、注意事项 1、Mapper接口与Mapper.xml映射文件要满足4个对应 &#xff08;1&#xff09;Mapper接口的全类名必须与Mapper映射文件中的namespace相同 &#xff08;2&#xff09;Mapper接口中的每一个方法名在Mapper映射文件…

创建对象和继承的多种方式

1. 创建对象的多种方式&优缺点 1.1 工厂模式 function createPerson(name) {var o new Object();o.name name;o.getName function () {console.log(this.name);};return o; }var person1 createPerson(kevin);优点&#xff1a;简单&#xff1b; 缺点&#xff1a;对象…

Linux C/C++ 系统错误

在C中&#xff0c;如果调用了库函数&#xff0c;可以通过函数的返回值判断调用是否成功。其实还有一个整型的全局变量errno&#xff0c;存放了函数调用过程中产生的错误代码。 如果调用库函数失败&#xff0c;可以通过errno的值来查找原因 #include <errno.h>strerror(…

密码学——银行应用程序安全:理解和解决关键安全问题

1. 认证和访问控制 1.1 用户认证 银行应用程序通过Web服务器让客户访问其银行账户的操作历史。用户首先通过用户名和密码进行认证&#xff0c;然后才能查看其账户历史。这个过程涉及基本的认证和访问控制机制&#xff0c;确保只有合法用户可以访问其个人信息。 2. 安全执行环境…

时序数据库介绍及应用场景,C#实例

一&#xff0c;时序数据库介绍 时序数据库&#xff08;Time Series Database&#xff0c;TSDB&#xff09;是一种专门用于存储、处理和查询时间序列数据的数据库系统。以下是关于时序数据库的详细解释&#xff1a; 定义 时序数据库是一种优化用于摄取、处理和存储时间戳数据的…

回溯算法之电话号码字母组合

题目&#xff1a; 给定一个仅包含数字 2-9 的字符串&#xff0c;返回所有它能表示的字母组合。答案可以按 任意顺序 返回。 给出数字到字母的映射如下&#xff08;与电话按键相同&#xff09;。注意 1 不对应任何字母。 示例 1&#xff1a; 输入&#xff1a;digits "2…