hadoop分布式中某个 节点报错的解决案例

前言

在分布式节点中,发现有个节点显示不可用状态,因此需要紧急修复。

hadoop版本

目前这套集群hadoop的版本如下:

集群报错详细日志:

1/1 local-dirs are bad: /kkb/install/hadoop-2.6.0-cdh5.14.2/hadoopDatas/tempDatas/nm-local-dir; 1/1 log-dirs are b 

报错分析

通过分析发现,应该是这个节点的磁盘空间满了。

这条错误信息指出 Hadoop 集群的 NodeManager 无法写入其配置的本地目录和日志目录。这通常发生在 Hadoop 集群启动时,NodeManager 尝试初始化时。错误的原因是指定的本地目录 (`local-dirs`) 和日志目录 (`log-dirs`) 不可用或不可写。

### 可能的原因包括:

1. **目录不存在**:配置的路径可能不存在。
2. **权限问题**:运行 Hadoop 的用户可能没有权限写入这些目录。
3. **磁盘空间不足**:指定的磁盘可能已满。
4. **SELinux 策略**:如果你的系统使用 SELinux,可能需要调整安全上下文。
5. **目录损坏**:文件系统损坏或目录结构损坏。

### 解决步骤:

1. **检查目录是否存在**:
   ```sh
   ls -ld /kkb/install/hadoop-2.6.0-cdh5.14.2/hadoopDatas/tempDatas/nm-local-dir
   ls -ld /kkb/install/hadoop-2.6.0-cdh5.14.2/logs/userlogs
   ```

2. **创建缺失的目录**:
   如果目录不存在,你需要手动创建它们:
   ```sh
   mkdir -p /kkb/install/hadoop-2.6.0-cdh5.14.2/hadoopDatas/tempDatas/nm-local-dir
   mkdir -p /kkb/install/hadoop-2.6.0-cdh5.14.2/logs/userlogs
   ```

3. **检查权限**:
   确保运行 Hadoop 的用户(例如 `hadoop` 用户)对这些目录具有写权限:
   ```sh
   chown -R hadoop:hadoop /kkb/install/hadoop-2.6.0-cdh5.14.2/hadoopDatas/tempDatas/
   chown -R hadoop:hadoop /kkb/install/hadoop-2.6.0-cdh5.14.2/logs/
   ```

4. **检查磁盘空间**:
   使用 `df -h` 检查磁盘空间是否已满。

5. **调整 SELinux**:
   如果你的系统使用 SELinux,可能需要调整策略或更改目录的安全上下文:
   ```sh
   chcon -R -t hadoop_var_lib_t /kkb/install/hadoop-2.6.0-cdh5.14.2/hadoopDatas/tempDatas/
   chcon -R -t hadoop_log_t /kkb/install/hadoop-2.6.0-cdh5.14.2/logs/
   ```

6. **检查 Hadoop 配置**:
   确保 `hdfs-site.xml` 和 `core-site.xml` 中配置的本地目录和日志目录路径正确无误。

7. **格式化 NameNode(如果必要)**:
   如果 NameNode 损坏,可能需要格式化。但这将删除所有 HDFS 数据,因此只有在安全模式或测试环境中才考虑执行此操作。

8. **重启 Hadoop 服务**:
   在解决了目录问题后,尝试重启 Hadoop 服务,特别是 NodeManager。

9. **查看日志文件**:
   检查 Hadoop 的日志文件,特别是 `hadoop-*.log` 文件,以获取更多错误信息。

10. **联系管理员**:
    如果你没有足够的权限或不熟悉系统,联系系统管理员来帮助解决问题。

请在进行任何重要更改之前备份重要数据,并确保你具有足够的系统管理知识或获得专业帮助。
 

通过50070端口进去发现确实是因为节点01的空间即将耗尽。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/42721.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

离线开发(VSCode、Chrome、Element)

一、VSCode 扩展 使用能联网的电脑 A,在VSCode官网下载安装包 使用能联网的电脑 A,从扩展下载vsix扩展文件 将VSCode安装包和vsix扩展文件通过手段(u盘,刻盘 等)导入到不能联网的离线电脑 B 中 在离线电脑 B 中安装…

Spring之 IoC、BeanFactory、ApplicationContext

IoC (Inverse of Control) IoC ,也就是 控制反转。 对于软件来说,即某一接口具体实现类的选择控制权从调用类中移除,转交给第三方决定,即由Spring容器借由Bean配置来进行控制。 Martin Fowler提出了DI(Dependency Injection,依…

快速解决找不到krpt.dll,无法继续执行代码问题

对于那些遇到计算机开机出现由于无法找到krpt.dll,进而无法继续执行代码问题的用户。 krpt.dll是计算机系统中与DirectX紧密相关的重要文件,如果它出现问题,可能会对一些特定的软件或游戏的运行产生影响。实际上,我们有多种解决该…

在CentOS和Ubuntu云服务下搭建Git版本控制器管理系统

目录 0.Git背景 1.在CentOS下安装Git 2.在Ubuntu下安装Git 3.安装git和图形化界面工具_哔哩哔哩_bilibili 0.Git背景 不知道你⼯作或学习时,有没有遇到这样的情况:我们在编写各种⽂档时,为了防⽌⽂档丢失,更改失误&#xff…

无需服务器,浏览器跑700+AI模型?!【送源码】

Transformers.js 是一个创新的网络机器学习库,它将先进的 Transformer 模型直接带入浏览器,无需服务器端支持。这个库与 Hugging Face 的 Python transformers 库功能对等,提供相似的 API 接口来运行预训练模型,涵盖了自然语言处理…

mysql signed unsigned zerofill详解

灵感来源 mysql中有符号signed,无符号unsigned与零填充zerofill UNSIGNED 无符号UNSIGNED是一个属性,你可以在创建或修改表时为整数类型的列指定它。无符号属性意味着该列只能存储非负整数(0和正整数),而不是默认的有…

docker部署onlyoffice,开启JWT权限校验Token

原来的部署方式 之前的方式是禁用了JWT: docker run -itd -p 8080:80 --name docserver --network host -e JWT_ENABLEDfalse --restartalways onlyoffice/documentserver:8 新的部署方式 参考文档:https://helpcenter.onlyoffice.com/installation/…

C9联盟是什么?

九校联盟(C9 League),简称C9联盟,是中国首个顶尖大学间的高校联盟,于2009年10月正式启动。 其成员都是国家首批“985工程”重点建设的一流大学,包括北京大学、清华大学、哈尔滨工业大学、复旦大学、上海交通…

c++ primer plus 第15章友,异常和其他:15.2.2模板中的嵌套

c primer plus 第15章友,异常和其他:15.2.2模板中的嵌套 15.2.2模板中的嵌套 文章目录 c primer plus 第15章友,异常和其他:15.2.2模板中的嵌套15.2.2模板中的嵌套程序清单15.5 queuetp.h程序清单15.6 nested.cpp 15.2.2模板中的…

撸包广告小游戏app开发对接广告联盟

以下是开发对接广告联盟的撸包广告小游戏 APP 的大致步骤: 需求分析 明确小游戏的类型、玩法和目标用户群体。确定所需的广告展示形式和位置。 技术选型 选择适合的开发框架和编程语言,如 Unity 搭配 C# 等。确定服务器架构和数据库方案。 游戏开发 设计…

五.RocketMQ理论及常见问题处理方案

RocketMQ的架构理论及底层原理 一:生产消息1.消息生产过程2.Queue选择算法 二:存储消息2.1存储介质2.2消息的存储和发送2.3消息存储结构2.4刷盘机制 三:消费消息1 获取消费类型2 消费模式3 Rebalance机制4.Queue分配算法 四:消息清…

078、Python 中的枚举类型

初识 在Python中,没有定义枚举类型的语法,但是可以通过继承Enum类来实现枚举类型。所以在Python中的枚举,就是一种特殊的类,用于表示一组常量,这些常量在定义后就不能被改变。 枚举的使用可以使代码更加清晰易读和易…

html+css+JavaScript 实现两个输入框的反转动画

开发时遇到了一个输入框交换的动画 做完之后觉得页面上加些许过渡或动画,其变化虽小,却能极大的提升页面质感,给人一种顺畅、丝滑的视觉体验。它的实现过程主要是通过css中的transition和animation来实现的。平时在开发的时候增加一些动画效…

C语言:高级并发操作(信号)

引言 同步和异步的使用。 异步事件处理的两种方法:查询法、通知法。(单核机器不存在异步) 一、信号 1. 信号的概念 信号是软件中断。信号的响应依赖于中断。中断是底层硬件的机制。 2. signal函数 kill -l命令查看所有的信号。1 -31 属…

使用qt creator配置msvc环境(不需要安装shit一样的宇宙第一IDE vs的哈)

1. 背景 习惯使用Qt编程的童鞋,尤其是linux下开发Qt的童鞋一般都是使用qt creator作为首选IDE的,通常在windows上使用Qt用qt creator作为IDE的话一般编译器有mingw和msvc两种,使用mingw版本和在linux下的方式基本上一样十分简单,不…

如何在Ubuntu环境下使用加速器配置Docker环境

一、安装并打开加速器 这个要根据每个加速器的情况来安装并打开,一般是会开放一个代理端口,比如1087 二、安装Docker https://docs.docker.com/engine/install/debian/#install-using-the-convenience-script 三、配置Docker使用加速器 3.1 修改配置…

UE5 04-重新加载当前场景

给关卡加一个淡出的效果 给关卡加一个淡入的效果, 这个最好放置在Player 上,这样切关卡依然有这个效果

防火墙基础及登录(华为)

目录 防火墙概述防火墙发展进程包过滤防火墙代理防火墙状态检测防火墙UTM下一代防火墙(NGFW) 防火墙分类按物理特性划分软件防火墙硬件防火墙 按性能划分百兆级别和千兆级别 按防火墙结构划分单一主机防火墙路由集成式防火墙分布式防火墙 华为防火墙利用…

Qt 关于字节流可否嵌套的一个实验

1.可否嵌套方案 1.1 概要 * 需求:数据头数据体校验码数据尾 * 校验码的生成只与数据体相关 * 可否通过QByteArray的嵌套实现这个功能呢, * 最终失败: * 理由一个char*的整体内存是无法再头部插入输入的。 * 那么只能靠生成校验码的时候…

creature_equip_template

creature_equip_template CreatureID 链接 creature_template.entry ID creature 装备模板编号 一个 creature entry 可以有多个装备模板如有多个装备模板,从1开始依次递增1 ItemID1 - ItemID3 装备模板使用的装备id,取值参见 ItemSparse.db2 | Item.db2…