在Win7虚拟机下搭建Hadoop2.6.0伪分布式环境

近几年大数据越来越火热。由于工作需要以及个人兴趣,最近开始学习大数据相关技术。学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘。

第一篇,在win7虚拟机下搭建hadoop2.6.0伪分布式环境。

1. 所需要的软件

使用Vmware 11.0搭建虚拟机,安装Ubuntu 14.04.2系统。

Jdk 1.7.0_80

Hadoop 2.6.0

2. 安装vmware和ubuntu

3. 在ubuntu中安装JDK

将jdk解压缩到目录:/home/vm/tools/jdk

在~/.bash_profile中配置环境变量,并通过source ~/.bash_profile生效。

#java

export JAVA_HOME=/home/vm/tools/jdk

export JRE_HOME=/home/vm/tools/jdk/jre

export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

export CLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH

检验jdk安装是否成功。

4. 配置ssh信任关系,实现无密码登录

4.1 安装ssh

Ubuntu默认安装了ssh客户端,但没有安装ssh服务端,因此可以通过apt-get安装。

安装ssh-server:sudo apt-get install openssh-server

如果没有ssh客户端,也可以通过apt-get安装。

安装ssh-client:sudo apt-get install openssh-client

启动ssh-server:sudo service ssh start

启动以后,通过ps –aux | grep sshd查看ssh服务器是否安装成功。

4.2 配置ssh信任关系

生成机器A的公私密钥对:ssh-keygen -t rsa,之后一路回车。在~/.ssh目录下生成公钥id_rsa.pub,私钥id_ras。

拷贝机器A的id_rsa.pub到机器B的认证文件中:

cat id_rsa.pub >> ~/.ssh/authorized_keys

这时候机器A到机器B的信任关系就建立好了,此时在机器A可以不需要密码直接ssh登录机器B了。

本例中机器A和B是同一台机器,配置ssh信任关系以后可以使用ssh localhost或者ssh 机器IP地址来验证。

5. 安装hadoop2.6.0

5.1 解压hadoop2.6.0

从官网下载hadoop-2.6.0.tar.gz,解压到目录/home/vm/tools/hadoop,并配置~/.bash_profile环境变量。通过source ~/.bash_profile生效。

#hadoop

export HADOOP_HOME=/home/vm/tools/hadoop

export PATH=$HADOOP_HOME/bin:$PATH

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"

5.2 修改配置文件

修改$HADOOP_HOME/etc/hadoop/hadoop-env.sh和yarn-evn.sh,配置JAVA_HOME路径:

修改$HADOOP_HOME/etc/hadoop/slaves,增加本机IP地址:

cat "192.168.62.129" >> slaves

修改$HADOOP_HOME/etc/hadoop/下的几个重要的*-site.xml:

core-site.xml 192.168.62.129是我虚拟机的IP地址

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://192.168.62.129:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>file:/home/vm/app/hadoop/tmp</value>

<description>a base for other temporary directories.</description>

</property>

</configuration>

hdfs-site.xml

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:/home/vm/app/hadoop/dfs/nn</value>

</property>

<property>

<name>dfs.namenode.data.dir</name>

<value>file:/home/vm/app/hadoop/dfs/dn</value>

</property>

<property>

<name>dfs.permissions</name>

<value>false</value>

<description>

permission checking is turned off

</description>

</property>

</configuration>

mapred-site.xml

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>hdfs://192.168.62.129:9001</value>

</property>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

</configuration>

yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

5.3 格式化文件系统

在$HADOOP_HOME下执行bin/hdfs namenode format格式化文件系统

5.4 启停

$HADOOP_HOME下执行sbin/start-dfs.sh和sbin/start-yarn.sh启动hadoop集群,执行sbin/stop-dfs.sh和sbin/stop-yarn.sh停止hadoop集群。

启动过程例如:

启动完毕进程如下:

6. 查询集群信息

8088端口,查看All Applications信息:

50070端口,查看hdfs信息:

7. 验证hadoop环境搭建是否成功

7.1 验证hdfs是否正常

可以使用各种hdfs命令测试。例如:

hdfs dfs -ls ./

hdfs dfs -put file.1 ./

hdfs dfs -get ./file1

hdfs dfs -rm -f ./file.1

hdfs dfs -cat ./file1

hdfs dfs -df -h

7.2 验证map/reduce计算框架是否正常

在$HADOOP_HOME目录下执行:bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar wordcount ./count_in/ ./count_out/

其中./count_in/提前在hdfs集群创建,统计该目录下所有文件的单词数量,输出到./count_out/目录。

执行过程示例如下:

执行完毕生成结果:

至此,Hadoop2.6.0的伪分布式环境搭建完成。

转载于:https://www.cnblogs.com/simplestupid/p/4679016.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/419715.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

前端学习(1560):ng-class颜色切换

<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>ng-app指令</title><style>.red {backgr…

MVC常见的控制器,接口,数据层之间的操作

user_books_info 类 namespace CiWong.LearningLevel.Mapping {public class user_books_info{/// <summary>/// 使用对象ID,个人版存放会员ID&#xff0c;班级版存放班级ID&#xff0c;校园版存放校园ID/// </summary>public long user_id { get; set; }/// <s…

前端学习(1561):ng-class颜色切换

<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>ng-app指令</title><style>.red {color:…

S3C6410 裸机硬件JPEG解码(转)

源&#xff1a;S3C6410 裸机硬件JPEG解码转载于:https://www.cnblogs.com/LittleTiger/p/4681864.html

java layoutmanager_Java Swing 探索(一)LayoutManager

BorderLayout FlowLayout GridLayout GridBagLayout CardLayout BoxLayout1.BorderLayoutjava.lang.Object--java.awt.BorderLayout将版面划分成东、西、南、北、中五个区域&#xff0c;将添加的组件按指定位置放置。BorderLayout.EAST BorderLayout.WEST BorderLay…

解决虚拟机VMware安装CentOS7.0识别不到网卡

由于Vmware虚拟网卡和linux兼容问题导致驱动无法正常安装&#xff0c;默认的网卡类型不兼容. 解决方法 找到我们的Vmware虚拟机文件夹&#xff0c;将VMware 虚拟机配置 (.vmx)&#xff0c;追加一条设置我们网卡类型 ethernet0.virtualDev "e1000" 原因 VMware 都在虚…

前端学习(1562):ng-hide,ng-show

<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>ng-app指令</title><style>.red {color:…

java socat_socat安装使用方法

socat&#xff0c;一个多功能的网络工具&#xff0c;名字来源于SOcket CAT&#xff0c;是netcat的增强版&#xff0c;也就是netcat(扩展了设计&#xff0c;并有新的实现)。------------------------------------------------------------------------0x01 安装# debian/ubuntua…

前端学习(1563):ng-if

<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>ng-app指令</title><style>.red {color:…

java spring注入 静态方法_java相关:spring为类的静态属性实现注入实例方法

java相关&#xff1a;spring为类的静态属性实现注入实例方法发布于 2020-3-31|复制链接在本篇文章里小妖给大家整理的是关于spring为类的静态属性实现注入实例方法&#xff0c;有需要的朋友们可以参考下。我们知道&#xff0c;正常情况下&#xff0c;spring的一个bean要依赖其他…

java 实现超时_如何实现带有超时的Runnable? - java

我目前有一个相当简单的SSL服务器/客户端项目&#xff0c;其中涉及标准Java后端和Android前端。与客户端发送数据后&#xff0c;我想尝试从服务器读取响应。但是&#xff0c;我遇到了一个小问题。服务器并不总是响应&#xff0c;因此我不得不以某种方式尝试以异步方式获取响应。…

数据大并发处理

网站并发一类 java用 netty在iis前边加 nginx 做负载均衡 你的请求都堵在一起了 让 用户直接访问 nginx 然后我在nginx 把用户请求分配给不同的iis处理也可以分给不同的不同的服务器处理。nginx 可以打开多个iis转载于:https://www.cnblogs.com/userbibi/p/4688792.html

身份证校验(c++实现)

描述&#xff1a; 我国国标〖GB 11643-1999〗中规定&#xff1a;公民身份号码是18位特征组合码&#xff0c;由十七位数字本体码和一位数字校验码组成。排列顺序从左至右依次为&#xff1a;六位数字地址码&#xff0c;八位数字出生日期码&#xff0c;三位数字顺序码和一位数字校…

php 判断网络图片是否存,PHP判断远程图片或文件或url是否存在-180

PHP判断远程图片或文件或url是否存在-180我通常使用curl判断判断远程图片或文件是否存在&#xff1a;/*** link http://www.phpddt.com*/function url_exists($url) {$ch curl_init();curl_setopt ($ch, CURLOPT_URL, $url);//不下载curl_setopt($ch, CURLOPT_NOBODY, 1);//设…

js Date对象总结

Date在js中和Array类似&#xff0c;都是拥有自己的特殊方法的特殊对象。 由于平常用到Date着实不多&#xff0c;对它的了解颇浅。上周被问到怎么样获取某年某个月的天数&#xff0c;我当时想了一会儿&#xff0c;回答说有两种&#xff0c;一种自己写判断闰年的逻辑&#xff0c;…

php openssl做什么,php开启openssl的方法

php开启openssl的方法关注:294 答案:2 mip版解决时间 2021-02-02 21:13提问者笑低了眉眼2021-02-02 05:23我是一个小白&#xff0c;对于php完全不懂&#xff0c;所以希望大神能给我写一个傻瓜教程。php.ini在哪啊&#xff0c;怎么修改啊什么的都不懂。该用什么做什么&#xf…

LightOJ 1422 区间DP Halloween Costumes

d(i, j)表示第i天到第j天至少要穿多少件衣服。 先不考虑第i天和后面 i1 ~ j 天的联系&#xff0c;那就是至少要穿 1 d(i1, j)件衣服。 再看状态转移&#xff0c;如果后面第k(i1 ≤ k ≤ j)天所穿的衣服和第i天一样的话&#xff0c;那么完全可以把第i1~k-1天所穿的衣服脱下来。…

使用php创建一个注册表单,如何实现一个简单的注册表单

创建一个注册表单是非常容易的 - 它事实上意味着&#xff0c;你只需要创建一个表单&#xff0c;表单将更新一些User的模型对象(这个例子是一个Doctrine实体)并保存它。受欢迎的FOSUserBundle 提供了一个注册表单&#xff0c;重置密码表单和其他用户管理功能。如果你先前没有一个…

php 图片不让下载,php让图片可以下载的方法

php让图片可以下载的方法发布于 2014-10-04 11:16:18 | 102 次阅读 | 评论: 0 | 来源: 网友投递PHP开源脚本语言PHP(外文名: Hypertext Preprocessor&#xff0c;中文名&#xff1a;“超文本预处理器”)是一种通用开源脚本语言。语法吸收了C语言、Java和Perl的特点&#xff0c;…