集群节点状态异常的解决方式

在这里插入图片描述

文章目录

集群节点状态异常的解决方式
- - 问题概述
  - 解决方式
  - - - 1.关闭所有服务
      - 2.对所有集群删除Hadoop相关文件
      - 2.1 删除Hadoop系统运行时创建的临时数据和文件
        2.2 删除Hadoop的数据文件
      - 3.重新对Hadoop节点进行初始化和启用
      - 4.重启服务，检查节点状态

集群节点状态异常的解决方式

问题概述

集群的主要架构是有两个主节点(master01、master02)和一个工作节点(worker01)的Hadoop高可用集群，在过了较长时间重启后，发现主节点的状态都为Standby，不存在Active的节点。

解决方式

具体的统一调用脚本可以看我的另一篇博客集群管理脚本中有统一调用脚本remote_call.sh

1.关闭所有服务

stop-all.sh

2.对所有集群删除Hadoop相关文件

2.1 删除Hadoop系统运行时创建的临时数据和文件

对所有集群中的机器调用(可以使用统一调用脚本)

rm -rf /tmp/hadoop

2.2 删除Hadoop的数据文件

删除安装目录下的Hadoop数据文件

rm -rf /opt/software/hadoop-3.1.3/data/*

3.重新对Hadoop节点进行初始化和启用

启动zk服务

zkServer.sh start

这两个命令需要对集群中的所有机器执行(可以调用统一调用脚本)

# 启动 journalnode 集群hdfs --daemon start journalnode # *4
#格式化zkfchdfs zkfc -formatZK

对Master01节点进行格式化。

#主NN节点格式化hdfs namenode -format

对另一个主节点执行下列命令

#从NN节点格式化和启动ssh root@master02 hdfs namenode -bootstrapStandbyssh root@master02 hdfs --daemon start namenode

4.重启服务，检查节点状态

检查Master01节点是否变为Active状态。
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/pingmian/46759.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

集群节点状态异常的解决方式

文章目录

集群节点状态异常的解决方式

问题概述

解决方式

1.关闭所有服务

2.对所有集群删除Hadoop相关文件

2.1 删除Hadoop系统运行时创建的临时数据和文件

2.2 删除Hadoop的数据文件

3.重新对Hadoop节点进行初始化和启用

4.重启服务，检查节点状态

相关文章

软件测试工作流程

Ext JS适用于哪些开发场景？

PostgreSQL（二十一）clog的作用与管理

如何应对AI发展下的伦理挑战

第一百五十九节 Java IO教程 - Java输入流、文件输入流、缓冲输入流、推回输入流

【C++】——类和对象(中)

JSON传输二进制

Windows上LabVIEW编译生成可执行程序

DFS和BFS(c++)

C++第七弹 -- C/C++内存管理

超详细Midjourney国际版注册使用全流程

软件测试——测试用例

ng-container、‌ng-template 和 ng-content 区别

ref 和 reactive 区别

高阶面试-mongodb

人工智能与伦理挑战：多维度应对策略

C#知识|账号管理系统：添加账号的功能笔记

如何用Claude 3 Sonnet Artifacts实现对数据文件的可视化分析？

【Memcached】一文详解 Memcached

实验二：图像灰度修正