CentOS 7安装Hadoop 3.0.0

最近在学习大数据,需要安装Hadoop,自己弄了好久,最后终于弄好了。网上也有很多文章关于安装Hadoop的,但总会遇到一些问题,所以把在CentOS 7安装Hadoop 3.0.0的整个过程记录下来,有什么不对的地方大家可以留言更正。

  一、ssh免密登录

1、测试是否能免密登录

      # ssh localhost

The authenticity of host 'localhost (::1)' can't be established.

2、设置免密登录

1)、去掉 /etc/ssh/sshd_config中的两行注释,如没有则添加,所有服务器都要设置的:

        #RSAAuthentication yes  #PubkeyAuthentication yes 

2)、生成秘钥:

# ssh-keygen -t rsa

备注:输入命令后回车4次

3)、复制到公共密钥中:

# cp /root/.ssh/id_rsa.pub /root/.ssh/authorized_keys

4)、将秘钥复制到目标服务器:

# ssh-copy-id 目标服务器IP

5)、测试:(没有报错,并没有提示输入目标服务器用户密码,用户切换到目标服务器用户名则成功)

# ssh 目标服务器IP

备注:配置好了hadoop1到hadoop2免密登录,同时需要配置hadoop2到hadoop1的免密登录,在hadoop2上操作,过程同上

  二、安装JDK

hadoop-3.0.0需要jdk1.8,此处省略安装过程,网上很多,过程也比较简单

  三、安装hadoop

1、下载hadoop:

http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-3.0.0/

2、解压安装:

 1)、复制 hadoop-3.0.0.tar.gz 到/usr/hadoop目录下, 然后

  #tar -xzvf hadoop-3.0.0.tar.gz

解压,解压后目录为:/usr/hadoop/hadoop-3.0.0,Hadoop 解压后即可使用。输入如下命令来检查 Hadoop 是否可用,成功则会显示 Hadoop 版本信息:

#cd /usr/hadoop/hadoop-3.0.0 #./bin/hadoop version

2),在/usr/hadoop/目录下,建立tmp:

#mkdir /usr/hadoop/tmp

3)、设置环境变量:

#vi /etc/profile
        # set hadoop path
        export HADOOP_HOME=/usr/hadoop/hadoop-3.0.0
        export PATH=$PATH:$HADOOP_HOME/bin

4)、使环境变量生效,终端中运行如下命令:

#source /etc/profile

5)、设置hadoop:     

一共需要配置主要的6个文件:

  hadoop-3.0.0/etc/hadoop/hadoop-env.sh 

  hadoop-3.0.0/etc/hadoop/yarn-env.sh 

  hadoop-3.0.0/etc/hadoop/core-site.xml 

  hadoop-3.0.0/etc/hadoop/hdfs-site.xml 

  hadoop-3.0.0/etc/hadoop/mapred-site.xml 

          hadoop-3.0.0/etc/hadoop/yarn-site.xml

        ⑴、配置hadoop-env.sh:

          # The java implementation to use.  #export JAVA_HOME=${JAVA_HOME}  export JAVA_HOME=/usr/java/jdk1.8.0_152 //根据自己jdk安装目录配置

⑵、配置yarn-env.sh:

          #The java implementation to usr  export JAVA_HOME=/usr/java/jdk1.8.0_152 //根据自己jdk安装目录配置

⑶、配置core-site.xml:

  <!-- 指定HADOOP所使用的文件系统schema(URI),HDFS的老大(NameNode)的地址 -->
          <configuration> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> <description>HDFS的URI,文件系统://namenode标识:端口号</description> </property> <property> <name>hadoop.tmp.dir</name> <value>/usr/hadoop/tmp</value> <description>namenode上本地的hadoop临时文件夹</description> </property> </configuration>

⑷、配置hdfs-site.xml:

  <configuration>  <!—hdfs-site.xml-->  <property>  <name>dfs.replication</name>  <value>1</value>  <description>副本个数,配置默认是3,应小于datanode机器数量</description>  </property>  </configuration>

⑸、配置mapred-site.xml:

  <!-- 指定mr运行在yarn上 -->
          <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>

⑹、配置yarn-site.xml:

  <!-- 指定YARN的老大(ResourceManager)的地址 -->
          <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property>  

     <!-- reducer获取数据的方式 -->
             <property>
              <name>yarn.nodemanager.aux-services</name>
              <value>mapreduce_shuffle</value>
             </property>

   </configuration>

  备注:以上配置都是以最简配置,还有很多配置可以自行添加

       6)、将/usr/hadoop复制到其他服务器:

          scp -r /usr/hadoop root@192.168.1.11:/usr/hadoop

 7)、格式化namenode:  

  #CD /usr/hadoop/hadoop-3.0.0# ./bin/hdfs namenode -format

  成功的话,会看到 “successfully formatted” 和 “Exitting with status 0” 的提示,若为 “Exitting with status 1” 则是出错          

  备注:只需格式化namenode,datanode不需要格式化(若格式化了,可将/usr/hadoop/tmp目录下文件都删除),所以先将安装文件夹复制到其他服务器,再格式化

    四、测试:

      1、启动HDFS:

      #CD /usr/hadoop/hadoop-3.0.0# sbin/start-dfs.sh

如果运行脚本报如下错误,

ERROR: Attempting to launch hdfs namenode as root
      ERROR: but there is no HDFS_NAMENODE_USER defined. Aborting launch.
      Starting datanodes
      ERROR: Attempting to launch hdfs datanode as root
      ERROR: but there is no HDFS_DATANODE_USER defined. Aborting launch.
      Starting secondary namenodes [localhost.localdomain]
      ERROR: Attempting to launch hdfs secondarynamenode as root
      ERROR: but there is no HDFS_SECONDARYNAMENODE_USER defined. Aborting launch.

 

解决方案

(缺少用户定义而造成的)因此编辑启动和关闭

      $ vim sbin/start-dfs.sh$ vim sbin/stop-dfs.sh

顶部空白处添加

      HDFS_DATANODE_USER=root  HADOOP_SECURE_DN_USER=hdfs  HDFS_NAMENODE_USER=root  HDFS_SECONDARYNAMENODE_USER=root

2)启动ResourceManager和NodeManager:

      #CD /usr/hadoop/hadoop-3.0.0#sbin/start-yarn.sh

      如果启动时报如下错误,

      Starting resourcemanager
      ERROR: Attempting to launch yarn resourcemanager as root
      ERROR: but there is no YARN_RESOURCEMANAGER_USER defined. Aborting launch.

      解决方案

(也是由于缺少用户定义)

      是因为缺少用户定义造成的,所以分别编辑开始和关闭脚本 

      $ vim sbin/start-yarn.sh $ vim sbin/stop-yarn.sh 

顶部空白添加

      YARN_RESOURCEMANAGER_USER=root  HADOOP_SECURE_DN_USER=yarn  YARN_NODEMANAGER_USER=root

3)、启动验证:

执行jps命令,出现下图基本完成

备注:也可以使用下面命令同时启动HDFS和ResourceManager、NodeManager:

      #CD /usr/hadoop/hadoop-3.0.0#sbin/start-all.sh

Hadoop2.3-HA高可用集群环境搭建  http://www.linuxidc.com/Linux/2017-03/142155.htm

Hadoop项目之基于CentOS7的Cloudera 5.10.1(CDH)的安装部署  http://www.linuxidc.com/Linux/2017-04/143095.htm

Hadoop2.7.2集群搭建详解(高可用)  http://www.linuxidc.com/Linux/2017-03/142052.htm

使用Ambari来部署Hadoop集群(搭建内网HDP源)  http://www.linuxidc.com/Linux/2017-03/142136.htm

Ubuntu 14.04下Hadoop集群安装  http://www.linuxidc.com/Linux/2017-02/140783.htm

CentOS 6.7安装Hadoop 2.7.2  http://www.linuxidc.com/Linux/2017-08/146232.htm

Ubuntu 16.04上构建分布式Hadoop-2.7.3集群  http://www.linuxidc.com/Linux/2017-07/145503.htm

CentOS 7 下 Hadoop 2.6.4 分布式集群环境搭建  http://www.linuxidc.com/Linux/2017-06/144932.htm

Hadoop2.7.3+Spark2.1.0完全分布式集群搭建过程  http://www.linuxidc.com/Linux/2017-06/144926.htm

更多Hadoop相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

本文永久更新链接地址:http://www.linuxidc.com/Linux/2018-02/150812.htm

linux

转载于:https://www.cnblogs.com/itrena/p/8830051.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/414272.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Docker中Maven私服的搭建

为何用到Maven私服&#xff1f; 在实际开发中&#xff0c;项目中可能会用到第三方的jar、内部通讯的服务接口都会打入到公司的私服中。 我们从项目实际开发来看&#xff1a; 一些无法从外部仓库下载的构件&#xff0c;例如内部的项目还能部署到私服上&#xff0c;以便供其他依赖…

博客作业03--栈和队列

1.学习总结 2.PTA实验作业 题目1&#xff1a;jmu-字符串是否对称 1设计思路 for i 1 to 字符串str结束if 栈顶元素 ! str[i] 字符串不对称输出noendfor字符串对称输出yes 2代码截图 3PTA提交列表说明 前面几处错误都是因为输入用的是getchar(),后来改用gets就对了好像是因为这…

apollo报:系统出错,请重试或联系系统负责人

说明&#xff1a;基于 docker 搭建的 apollo&#xff0c;创建项目后一直报系统出错&#xff0c;请重试或联系系统负责人错误。 项目人员列表一直空白&#xff1a; 经排查是数据库配置参数不匹配&#xff0c;由于自己的虚拟机 ip 为 192.168.10.130 注意&#xff1a;修改完需要重…

关于Trie的一些算法

最近学习了一下关于Trie的一些姿势&#xff0c;感觉很实用。 终于不用每次看到字符串判重等操作就只想到hash了 关于Trie的定义&#xff0c;来自百度百科 在计算机科学中&#xff0c;Trie&#xff0c;又称前缀树或字典树&#xff0c;是一种有序树状的数据结构&#xff0c;用于保…

使用nginx搭建https服务器

最近在研究nginx&#xff0c;整好遇到一个需求就是希望服务器与客户端之间传输内容是加密的&#xff0c;防止中间监听泄露信息&#xff0c;但是去证书服务商那边申请证书又不合算&#xff0c;因为访问服务器的都是内部人士&#xff0c;所以自己给自己颁发证书&#xff0c;忽略掉…

分布式配置中心阿波罗的搭建与客户端的应用

为了统一管理微服务配置文件&#xff0c;实现动态化刷新配置文件&#xff0c;常见的两种方式为阿波罗、SpringCloudConfig&#xff0c;关于两者主要区别是&#xff1a; 阿波罗配置文件存放在数据库中&#xff0c;SpringCloudConfig存放在Git里面 一、搭建过程 本篇主要演示阿波…

PHP攻击防御

原文地址 有个朋友网站被攻击&#xff0c;刚好我们的网站有比较全面的攻击防御&#xff0c;了解了一下自己网站的防御&#xff0c;再上网搜了一些文章来看&#xff0c;觉得上面的文章写得很全面&#xff0c;特此备份。留着以后自己忘记的时候看看。

毕业一年的大专生程序员工作总结(java后台)

文章导读 一、回眸过去 – 闲扯的话 – 零碎的技术二、经验总结 – 沟通交流 – 贵在坚持 – 合理规划三、展望未来 – 积累行业背景 – 学习清单四、最后补充 一、 回牟过去 1、闲扯的话 大专生毕业一年工作总结&#xff0c;谈不上予人借鉴&#xff0c;算是对自己过去一年…

mysql自带加密解密字符集问题

由于公司业务需要&#xff0c;需要对已有的数据进行加密&#xff0c; 由于数据加密之后需要可逆的解密&#xff0c;最先考虑使用encode&#xff0c;decode函数&#xff1b;在实际使用的过程遇到加密数据解密之后得不到原本的值&#xff0c;后发现是由于字符集不正确&#xff0c…

重温类加载机制

前言 我们在学习 java 基础的时候&#xff0c;从宏观上了解一个类到运行大致是&#xff1a;.java 文件通过 javac 编译器编译得到 .class 文件&#xff0c;在用到该类时&#xff0c;jvm 会加载该 class 文件&#xff0c;并创建对应的 class 对象&#xff0c;将 class 文件加载…

微信团队分享:微信移动端的全文检索多音字问题解决方案

本文来自微信开发团队WeMobileDev公众号的技术分享。 1、前言 微信的移动客户端全文搜索中的多音字问题一直是搜索体验的痛点之一。微信客户端全文搜索在上线以后&#xff0c;也经常收到用户关于多音字问题的反馈。所以&#xff0c;微信全文搜索中的多音字搜索成了一个迫切需要…

PHP编译不成功

早上开机的时候运行本地网站&#xff0c;蹦出一个error: ERROR:syntax error, unexpected 92 (T_CONSTANT_ENCAPSED_STRING), expectin懵&#xff0c;昨天下班前不是还好好的吗&#xff08;其实我不知道下班前是不是好好的&#xff0c;因为下班前没跑程序好尴尬&#xff09;&am…

201571030128/201571030118《小学四则运算练习软件软件需求说明》结对项目报告

一、以实验二个人项目、实验三结对项目所开发的小学生四则运算练习软件作为原型&#xff0c;实施小学生四则运算练习软件用户调研活动具体过程。 1、真实的调研对象 对象性别年龄身份刘老师女23小学数学实习老师杨同学男12小学五年级学生杨家长女35杨同学的家长何老师男24小学数…