Hadoop2.6集群动态添加和删除数据节点

2019独角兽企业重金招聘Python工程师标准>>>

开始之前，应该把所有新增数据节点上的Hadoop环境都配置好（如果要直接复制已经存在节点的hadoop文件夹，应该删掉里面已经产生的集群数据，比如tmp和data目录，不然会出问题）

Step1：关闭新加入数据节点的防火墙。

Step2：在各个节点上把新增节点的hosts信息补充完整

Step3：在两个NameNode上，打通向新增数据节点无密钥SSH登录的通道。

Step4：在两个NameNode上的dfs.hosts指定的白名单文件中追加上所有新增的数据节点的hostname，需要更改下hdfs-site.xml，黑名单文件用于排除集群中的节点

        <property><name>dfs.hosts</name><value>/usr/hadoop/etc/hadoop/datanode-allow.list</value></property><property><name>dfs.hosts.exclude</name><value>/usr/hadoop/etc/hadoop/datanode-deny.list</value></property>

Step5：在namenode上执行如下刷新命令：hdfs dfsadmin -refreshNodes

可通过hdfs dfsadmin -report或者master:50070 web端口查看当前集群节点状态

Step6：在两个NameNode节点上，更改slaves文件，将要上线的数据节点hostname追加到slaves文件中。在slave上启动datanode和nodemanager进程：

sbin/hadoop-daemon.sh start datanode

sbin/yarn-daemon.sh start nodemanager

用新增节点用jps查看进程，可在master节点通过yarn node -list查看集群情况

Step7：均衡block(非必须，根据集群情况设定)

./bin/start-balancer.sh

1) 如果不balance，那么cluster会把新的数据都存放在新的node上，这样会降低mapred的工作效率
2) 设置平衡阈值，默认是10%，值越低各节点越平衡，但消耗时间也更长

hdfs balancer -threshold 5

3) 设置balance的带宽，默认只有1M/s

hdfs dfsadmin -setBalancerBandwidth 67108864

数据节点的删除和上述步骤类似，只不过在master1上修改datanode-allow.list和datanode-deny.list，还有slaves文件并且同步到master2上。整个操作的过程中都不涉及集群的重启~等待刷新的操作结束后，需要下架的机器就可以安全的关闭了。

[root@master  hadoop]# ./bin/ hdfs dfsadmin -refreshNodes
[root@master  hadoop]# ./bin/ hadoop dfsadmin -report

可以查看到现在集群上连接的节点

正在执行Decommission，会显示：
Decommission Status : Decommission in progress  执行完毕后，会显示：
Decommission Status : Decommissioned

重新加入各个删除的节点

1，在master的datanode-deny.list删除相应机器

2，在master上刷新节点配置情况：

hadoop dfsadmin -refreshNodes

3，在slave上重启tasktracker进程：

hadoop-daemon.sh start datanode

PS：如果之前没有关闭该slave上的datanode进程，需要先关闭再重新启动。

转载于:https://my.oschina.net/aibati2008/blog/633961

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/261799.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Hadoop2.6集群动态添加和删除数据节点

重新加入各个删除的节点

相关文章

读操作系统的设计与实现--进程互斥

拉取ftp服务器上的文件_winscp和云服务器，2步实现winscp将文件上传到腾讯云Linux云服务器...

计算机技术qq交流群,专业计算机群QQ

笔记：设计模式(3)-Abstract Factory抽象工厂模式

MongoDB操作：insert()

python文件批量改名_python文件批量重命名

内存管理简介之Buddy算法和slab分配

人工操作阶段计算机是如何工作的,管理信息系统作业参考答案

最近处理的几个小问题_20160311

3. 什么是icmp?icmp与ip的关系_你知道如何跟女生，确定恋人关系吗？

量子计算机完整的图片,记者带你走近世界首台超越早期经典计算机的光量子计算机（组图）...

当Grid的数据源是View时，如何使用PeopleSoft自带的Save Function？

同批号不同批次同一单据中出现数量不限制

编程题：“丑数”

qtreewidget点击空白处时取消以选项_VUE+elementUI 点击页面空白处弹窗不隐藏

漂浮的表单

计算机word文档无法工作,电脑docx打不开怎么办（word文档无法打开的解决方法）...

LinkedList剖析

3013-04-13 腾讯笔试

jquery调用asp.net 页面后台方法