hadoop windows

 

1、安装JDK1.6或更高版本

  官网下载JDK,安装时注意,最好不要安装到带有空格的路径名下,例如:Programe Files,否则在配置Hadoop的配置文件时会找不到JDK(按相关说法,配置文件中的路径加引号即可解决,但我没测试成功)。

2、安装Cygwin

  Cygwin是Windows平台下模拟Unix环境的工具,需要在安装Cygwin的基础上安装Hadoop,下载地址:http://www.cygwin.com/

  根据操作系统的需要下载32位或64的安装文件。

  1)、双击下载好的安装文件,点击下一步,选择install from internet

  
  2)、选择安装路径

  3)、选择local Package Directory

  4)、选择您的Internet连接方式

  5)、选择合适的安装源,点击下一步

  

  6)、在Select Packages界面里,Category展开net,选择如下openssh和openssl两项

  

    如果要在Eclipe上编译Hadoop,需要安装Category为Base下的sed

  

    如果想在Cygwin上直接修改hadoop的配置文件,可以安装Editors下的vim

  

  7)、点击“下一步”,等待安装完成。

3、配置环境变量

  在“我的电脑”上点击右键,选择菜单中的“属性",点击属性对话框上的高级页签,点击”环境变量"按钮,在系统变量列表里双击“Path”变量,在变量值后输入安装的Cygwin的bin目录,例如:D:\hadoop\cygwin64\bin

4、安装sshd服务

  双击桌面上的Cygwin图标,启动Cygwin,执行ssh-host-config -y命令

  

  执行后,会提示输入密码,否则会退出该配置,此时输入密码和确认密码,回车。最后出现Host configuration finished.Have fun!表示安装成功。

  输入net start sshd,启动服务。或者在系统的服务里找到并启动Cygwin sshd服务。

    可能会遇到无法安装和启动sshd服务的问题,可参考此连接http://www.cnblogs.com/kinglau/p/3261886.html。

  另外如果是Win8操作系统,启动Cygwin时,需要以管理员身份运行(右键图标,选择以管理员身份运行),否则会因为权限问题,提示“发生系统错误5”。

5、配置SSH免密码登录

  执行ssh-keygen命令生成密钥文件

  如下图所示,输入:ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa,注意-t -P -f参数区分大小写。

  ssh-keygen是生成密钥命令

  -t 表示指定生成的密钥类型(dsa,rsa)

  -P表示提供的密语

  -f指定生成的密钥文件。

  注意:~代表当前用户的文件夹,/home/用户名

  

  执行此命令后,在你的Cygwin\home\用户名 路径下面会生成.ssh文件夹,可以通过命令ls -a /home/用户名  查看,ssh -version命令查看版本。

  执行完ssh-keygen命令后,再执行下面命令,就可以生成authorized_keys文件了。

  cd ~/.ssh/

  cp id_dsa.pub authorized_keys

  如下图所示:

  

  然后执行exit命令,退出Cygwin窗口

6、再次在桌面上双击Cygwin图标,打开Cygwin窗口,执行ssh localhost命令,第一次执行该命令会有提示,输入yes后,回车即可。如下图所示

  

7、安装Hadoop

   hadoop官网下载http://hadoop.apache.org/releases.html。

  把hadoop压缩包解压到/home/用户名 目录下,文件夹名称更改为hadoop,可以不修改,但后边在执行命令时稍显麻烦。

  (1)单机模式配置方式

    单机模式不需要配置,这种方式下,Hadoop被认为是一个单独的Java进程,这种方式经常用来调试。

  (2)伪分布模式

    可以把伪分布模式看作是只有一个节点的集群,在这个集群中,这个节点既是Master,也是Slave,既是NameNode,也是DataNode,既是JobTracker,也是TaskTracker。

    这种模式下修改几个配置文件即可。

    配置hadoop-env.sh,记事本打开改文件,设置JAVA_HOME的值为你的JDK安装路径,例如:

    JAVA_HOME="D:\hadoop\Java\jdk1.7.0_25"    

    配置core-site.xml

按 Ctrl+C 复制代码
按 Ctrl+C 复制代码

配置hdfs-site.xml

按 Ctrl+C 复制代码
按 Ctrl+C 复制代码

配置mapred-site.xml

按 Ctrl+C 复制代码
按 Ctrl+C 复制代码

 

8、启动Hadoop

  打开Cgywin窗口,执行cd ~/hadoop命令,进入hadoop文件夹,如下图:

  

  启动Hadoop前,需要先格式化Hadoop的文件系统HDFS,执行命令:bin/hadoop namenode -format

  注意namenode要小些,否则如果输入NameNode,会提示错误,找不到或无法加载主类NameNode。执行正确命令后如下图所示:

  

  输入命令 bin/start-all.sh,启动所有进程,如下图:  

 

接下来,验证是否安装成功

打开浏览器,分别输入下列网址,如果能够正常浏览,说明安装成功。

http://localhost:50030,回车打开MapReduce的web页面,如下图(页面部分截图):

 

http://localhost:50070,回车打开HDFS的web页面,如下图(页面部分截图):

 

第一次启动后,如果都不能浏览,或不能浏览某一个,退出Cygwin,重新打开Cygwin,执行bin/start-all.sh命令。

如果只想启动MapReduce,可执行bin/start-mapred.sh命令。

如果只想启动HDFS,可执行bin/start-dfs.sh命令。

 

参考文献:

本文参考和引用了《Hadoop实战》(作者:陆嘉恒)中的章节“2.3在Windows上安装与配置Hadoop”。

特此声明,如果涉及到版权问题,请告知。

 

 

分类: Hadoop
绿色通道: 好文要顶 关注我 收藏该文与我联系
kinglau
关注 - 16
粉丝 - 42
+加关注
5
0
(请您对文章做出评价)
« 上一篇:Windows 平台下安装Cygwin后,sshd服务无法启动
» 下一篇:Hadoop的datanode无法启动
posted @ 2013-08-20 16:15 kinglau 阅读(34107) 评论(29) 编辑 收藏
#1楼 2014-03-14 14:52 lovetimi
你好,看过你的文章后,跟着你做到
8、启动Hadoop
小写namenode还是会提示错误,找不到或无法加载主类NameNode。
不知道是怎么回事。。
支持(0)反对(0)
#2楼 2014-03-24 16:32 清清2013
http://localhost:50079,回车打开HDFS的web页面,如下图(页面部分截图)

端口應該是http://localhost:50070
支持(0)反对(0)
#3楼 2014-04-02 15:52 jianshuang
Administrator@wx ~
$ net start sshd
CYGWIN sshd ▒▒▒▒▒▒▒▒▒▒▒▒ .
CYGWIN sshd ▒▒▒▒▒Ѿ▒▒▒▒▒▒ɹ▒▒▒


Administrator@wx ~


这表示启动服务成功了吧。
支持(0)反对(0)
#4楼 2014-04-05 17:50 KiwenLau
@jianshuang
cygwin中文乱码问题解决可以参见我的博客《Cygwin中文乱码》http://www.cnblogs.com/kiwenlau/p/3645752.html
支持(0)反对(0)
http://pic.cnblogs.com/face/569245/20150603225120.png
#5楼 2014-04-05 17:51 KiwenLau
@清清2013
我也发现这个问题了。还以为自己装错了,楼主修改一下吧!
支持(0)反对(0)
http://pic.cnblogs.com/face/569245/20150603225120.png
#6楼[楼主] 2014-05-23 11:22 kinglau
@清清2013
多谢,已修改。
支持(0)反对(0)
#7楼 2014-06-25 20:59 程序猿213
你好,我按照您的步骤做,在执行format的时候./hdfs namenode -format,报错如下:
错误: 找不到或无法加载主类 org.apache.hadoop.hdfs.server.namenode.NameNode

请问是什么原因呢
支持(0)反对(0)
#8楼 2014-07-02 11:54 364718323
遇到7楼问题 找不到解决方法吖
支持(0)反对(0)
#9楼 2014-08-13 19:36 changanlaosan
administrator@2012-20121224CP /cygdrive/d/hadoop-0.20.2
$ bin/hadoop namenode format
14/08/13 19:27:45 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG: host = 2012-20121224CP/192.168.131.182
STARTUP_MSG: args = [format]
STARTUP_MSG: version = 0.20.2
STARTUP_MSG: build = //svn.apache.org/repos/asf/hadoop/common/branches/branch-0.20 -r 911707; compiled by 'chrisdo' on Fri Feb 19 08:07:34 UTC 2010
************************************************************/
Usage: java NameNode [-format] | [-upgrade] | [-rollback] | [-finalize] | [-importCheckpoint]
14/08/13 19:27:45 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at 2012-20121224CP/192.168.131.182
************************************************************/
我崩溃了,到底怎么弄各种错误,求楼主这个问题怎么办,我是新手谢谢了怎么弄都不行了
支持(0)反对(0)
#10楼 2014-08-13 19:38 changanlaosan
最后格式化的时候出现了上边的原因,楼主求解答、、
支持(0)反对(0)
#11楼 2014-08-17 10:10 懂zj你
@lovetimi
请问这个问题你解决了吗?
支持(0)反对(0)
#12楼 2014-08-17 10:10 懂zj你
@changanlaosan
请问这个问题你解决了吗?
支持(0)反对(0)
#13楼 2014-08-17 10:11 懂zj你
@程序猿213
请问这个问题你解决了吗?
支持(0)反对(0)
#14楼[楼主] 2014-08-18 11:00 kinglau
@changanlaosan
$ bin/hadoop namenode -format
支持(0)反对(0)
#15楼 2014-10-31 13:40 孙畅
你好,我遇到问题Administrator@ks-zx-pc-100 ~
$ ssh-host-config -y

*** Info: Generating missing SSH host keys
*** Query: Overwrite existing /etc/ssh_config file? (yes/no) yes
*** Info: Creating default /etc/ssh_config file
*** Query: Overwrite existing /etc/sshd_config file? (yes/no) yes
*** Info: Creating default /etc/sshd_config file

*** Info: StrictModes is set to 'yes' by default.
*** Info: This is the recommended setting, but it requires that the POSIX
*** Info: permissions of the user's home directory, the user's .ssh
*** Info: directory, and the user's ssh key files are tight so that
*** Info: only the user has write permissions.
*** Info: On the other hand, StrictModes don't work well with default
*** Info: Windows permissions of a home directory mounted with the
*** Info: 'noacl' option, and they don't work at all if the home
*** Info: directory is on a FAT or FAT32 partition.
*** Query: Should StrictModes be used? (yes/no) yes

*** Info: Privilege separation is set to 'sandbox' by default since
*** Info: OpenSSH 6.1. This is unsupported by Cygwin and has to be set
*** Info: to 'yes' or 'no'.
*** Info: However, using privilege separation requires a non-privileged account
*** Info: called 'sshd'.
*** Info: For more info on privilege separation read /usr/share/doc/openssh/README.privsep.
*** Query: Should privilege separation be used? (yes/no) yes
*** Info: Updating /etc/sshd_config file

*** Info: Sshd service is already installed.

*** Info: Host configuration finished. Have fun!

Administrator@ks-zx-pc-100 ~
$
输入命令之后,并没有提示我输入密码
支持(0)反对(0)
#16楼 2014-11-03 16:28 孙畅
@changanlaosan
这个问题我也遇到的,现在解决了,之所以出现这样的问题,是因为配置那三个文件出错了,你试下这样的配置方法
修改 core-site.xml 为如下配置

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

修改 hdfs-site.xml 为如下配置

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

修改 mapred-site.xml 为如下配置

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/388105.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ocelot中文文档入门

入门 Ocelot仅适用于.NET Core&#xff0c;目前是根据netstandard2.0构建的&#xff0c;如果Ocelot适合您&#xff0c;这个文档可能会有用。 .NET Core 2.1 安装NuGet包 使用nuget安装Ocelot及其依赖项。 您需要创建一个netstandard2.0项目并将其打包到其中。 然后按照下面的“…

科学价值 社交关系 大数据_服务的价值:数据科学和用户体验研究美好生活

科学价值 社交关系 大数据A crucial part of building a product is understanding exactly how it provides your customers with value. Understanding this is understanding how you fit into the lives of your customers, and should be central to how you build on wha…

在Ubuntu下创建hadoop组和hadoop用户

一、在Ubuntu下创建hadoop组和hadoop用户 增加hadoop用户组&#xff0c;同时在该组里增加hadoop用户&#xff0c;后续在涉及到hadoop操作时&#xff0c;我们使用该用户。 1、创建hadoop用户组 2、创建hadoop用户 sudo adduser -ingroup hadoop hadoop 回车后会提示输入新的UNIX…

day06 hashlib模块

1.hashlib模块 import hashlib# password123456# print( password.encode()) #加密前先转成二进制# mhashlib.md5(password.encode())# print(dir(m)) #查询m的所有方法## print(m.hexdigest()) #使用hexdigest()方法加密&#xff0c;md5加密之后是不可逆&#xff0c;不可以解…

vs azure web_在Azure中迁移和自动化Chrome Web爬网程序的指南。

vs azure webWebscraping as a required skill for many data-science related jobs is becoming increasingly desirable as more companies slowly migrate their processes to the cloud.随着越来越多的公司将其流程缓慢迁移到云中&#xff0c;将Web爬网作为许多与数据科学相…

hadoop eclipse windows

首先说一下本人的环境: Windows7 64位系统 Spring Tool Suite Version: 3.4.0.RELEASE Hadoop2.6.0 一&#xff0e;简介 Hadoop2.x之后没有Eclipse插件工具&#xff0c;我们就不能在Eclipse上调试代码&#xff0c;我们要把写好的java代码的MapReduce打包成jar然后在Linux上运…

同步函数死锁现象

多线程&#xff1a;一个进程中有多个线程可以同时执行任务 多线程的好处&#xff1a; 1、解决一个进程中可以同时执行多个任务的问题。 2、提高了资源利用率 多线程的弊端&#xff1a; 1、增加了CPU的负担 2、降低了一个进程中线程的执行概率 3、出现了线程安全问题 4、会引发死…

netstat 在windows下和Linux下查看网络连接和端口占用

假设忽然起个服务&#xff0c;告诉我8080端口被占用了&#xff0c;OK&#xff0c;我要去看一下是什么服务正在占用着&#xff0c;能不能杀 先假设我是在Windows下&#xff1a; 第一列&#xff1a; Proto 协议 第二列&#xff1a; 本地地址【ip端口】 第三列&#xff1a;远程地址…

selenium 解析网页_用Selenium进行网页搜刮

selenium 解析网页网页抓取系列 (WEB SCRAPING SERIES) 总览 (Overview) Selenium is a portable framework for testing web applications. It is open-source software released under the Apache License 2.0 that runs on Windows, Linux and macOS. Despite serving its m…

表的设计与优化

单表设计与优化 1&#xff09;设计规范化表&#xff0c;消除数据冗余&#xff08;以使用正确字段类型最明显&#xff09;&#xff1a; 数据库范式是确保数据库结构合理&#xff0c;满足各种查询需要、避免数据库操作异常的数据库设计方式。满足范式要求的表&#xff0c;称为规范…

代理ARP协议(Proxy ARP)

代理ARP&#xff08;Proxy-arp&#xff09;的原理就是当出现跨网段的ARP请求时&#xff0c;路由器将自己的MAC返回给发送ARP广播请求发送者&#xff0c;实现MAC地址代理&#xff08;善意的欺骗&#xff09;&#xff0c;最终使得主机能够通信。 图中R1和R3处于不同的局域网&…

hive 导入hdfs数据_将数据加载或导入运行在基于HDFS的数据湖之上的Hive表中的另一种方法。

hive 导入hdfs数据Preceding pen down the article, might want to stretch out appreciation to all the wellbeing teams beginning from cleaning/sterile group to Nurses, Doctors and other who are consistently battling to spare the mankind from continuous Covid-1…

Java性能优化

一、避免在循环条件中使用复杂表达式 在不做编译优化的情况下&#xff0c;在循环中&#xff0c;循环条件会被反复计算&#xff0c;如果不使用复杂表达式&#xff0c;而使循环条件值不变的话&#xff0c;程序将会运行的更快。 例子&#xff1a; import java.util.vector; class …

对Faster R-CNN的理解(1)

目标检测是一种基于目标几何和统计特征的图像分割&#xff0c;最新的进展一般是通过R-CNN&#xff08;基于区域的卷积神经网络&#xff09;来实现的&#xff0c;其中最重要的方法之一是Faster R-CNN。 1. 总体结构 Faster R-CNN的基本结构如下图所示&#xff0c;其基础是深度全…

大数据业务学习笔记_学习业务成为一名出色的数据科学家

大数据业务学习笔记意见 (Opinion) A lot of aspiring Data Scientists think what they need to become a Data Scientist is :许多有抱负的数据科学家认为&#xff0c;成为一名数据科学家需要具备以下条件&#xff1a; Coding 编码 Statistic 统计 Math 数学 Machine Learni…

postman 请求参数为数组及JsonObject

2019独角兽企业重金招聘Python工程师标准>>> 1. (1)数组的请求方式(post) https://blog.csdn.net/qq_21205435/article/details/81909184 (2)数组的请求方式&#xff08;get&#xff09; http://localhost:port/list?ages10,20,30 后端接收方式&#xff1a; PostMa…

领扣(LeetCode)对称二叉树 个人题解

给定一个二叉树&#xff0c;检查它是否是镜像对称的。 例如&#xff0c;二叉树 [1,2,2,3,4,4,3] 是对称的。 1/ \2 2/ \ / \ 3 4 4 3但是下面这个 [1,2,2,null,3,null,3] 则不是镜像对称的: 1/ \2 2\ \3 3说明: 如果你可以运用递归和迭代两种方法解决这个问题&#…

python 开发api_使用FastAPI和Python快速开发高性能API

python 开发apiIf you have read some of my previous Python articles, you know I’m a Flask fan. It is my go-to for building APIs in Python. However, recently I started to hear a lot about a new API framework for Python called FastAPI. After building some AP…

Purley平台Linpak测试,从踏坑开始一步步优化

Purley平台Linpak测试&#xff0c;从踏坑开始一步步优化 #记2017年11月第一次踏坑事件 测试平台配置&#xff1a; 6nodes CPU: Intel Gold 6132 2.6GHz 14C RAM: 8G *12 2666MHz NET: Infiband FDR OS: centos7.2 mpi: Intel-mpi hpl: xhpl.intel 开始踏第一坑 现象&#xff1a…

基于easyui开发Web版Activiti流程定制器详解(一)——目录结构

&#xfeff;&#xfeff;题外话&#xff08;可略过&#xff09;&#xff1a; 前一段时间&#xff08;要是没记错的话应该是3个月以前&#xff09;发布了一个更新版本&#xff0c;很多人说没有文档看着比较困难&#xff0c;所以打算拿点时间出来详细给大家讲解一下&#xff0c;…