windows下hadoop的单机伪分布式部署(3)

下面介绍myeclipse与hadoop的集成。

我用的myeclipse版本是8.5.

1、安装hadoop开发插件

在hadoop1.2.1版本的安装包contrib/目录下,已经不再提供hadoop-eclipse-pligin-1.2.1.jar;

而是提供了源代码文件,需要我们自行重新编译成jar包文件;这里方便,大家可以从这里下载:

hadoop-eclipse-plugin-1.2.1.jar.pdf

由于博客上传文件的类型限制,故添加了pdf后缀,下载之后重命名,去掉".pdf"即可。

然后将该文件拷贝到myeclipse根目录下/dropins目录下。

2、设置myeclipse

启动myeclipse,打开Perspective;

【Window】->【Open Perspective】->【Other...】->【Map/Reduce】->【OK】

然后打开View:

【Window】->【Show View】->【Other...】->【MapReduce Tools】->【Map/Reduce Locations】->【OK】

然后,添加Hadoop location,在Map/Reduce locations下面的空白处单击右键:

(我这里已经建了一个,所以会有一条,第一次建,应该是空白的)

然后选择edit hadoop location

location name: 我填写的是:first-hadoop
Map/Reduce Master 这个框里
Host:就是jobtracker 所在的集群机器,这里写localhost
Hort:就是jobtracker 的port,这里写的是9001
这两个参数就是mapred-site.xml里面mapred.job.tracker里面的ip和port 

 
DFS Master 这个框里
Host:就是namenode所在的集群机器,这里写localhost
Port:就是namenode的port,这里写9000
这两个参数就是core-site.xml里面fs.default.name里面的ip和port


(Use M/R master host,这个复选框如果选上,就默认和Map/Reduce Master这个框里的host一样,如果不选择,就可以自己定义输入,这里jobtracker 和namenode在一个机器上,所以是一样的,就勾选上)

 user name:这个是连接hadoop的用户名,我的是ldm。
然后点击finish按钮,此时,这个视图中就有多了一条记录。

重启myeclipse并重新编辑刚才建立的那个连接记录,现在我们编辑advance parameters tab页

这里大部分的属性都已经自动填写上了,其实就是把core-defaulte.xml、hdfs-defaulte.xml、mapred-defaulte.xml里面的一些配置属性展示出来。

因为在安装hadoop的时候,其site系列配置文件里有改动,所以这里也要弄成一样的设置。

主要关注的有以下属性:
fs.defualt.name:这个在General tab页已经设置了
mapred.job.tracker:这个在General tab页也设置了
dfs.replication:这个这里默认是3,因为我在hdfs-site.xml里面设置成了1,所以这里也要设置成1 
然后点击finish,然后就连接上了(先要启动sshd服务,启动hadoop进程),连接上的标志如图:

3、wordcount实例

新建Map/Reduce Project:

【File】->【New】->【Project...】->【Map/Reduce】->【Map/Reduce Project】->

【Project name: WordCount】->【Configure Hadoop install directory...】->【Hadoop installation directory: c:\cygwin64\home\ldm\hadoop】

->【Apply】->【OK】->【Next】->【Allow output folders for source folders】->【Finish】

新建WordCount类

然后将hadoop安装包中实例WordCount.java类中的代码拷入。

接下来,新建一个文件夹input,新建两个文件input/file1,input/file2;

文件内容分别为Hello World Bye World和Hello Hadoop Goodbye Hadoop

然后在cygwin终端中运行命令:hadoop fs -put input input

文件夹input上传到分布式文件系统中,命令中的路径根据自己路径为准。

配置运行参数:

①在新建的项目WordCount,点击WordCount.java,右键-->Run As-->Run Configurations 
②在弹出的Run Configurations对话框中,点Java Application,右键-->New,这时会新建一个application名为WordCount 
③配置运行参数,点Arguments,在Program arguments中输入“你要传给程序的输入文件夹和你要求程序将计算结果保存的文件夹”,如:

然后点击run;

如果显示如下,说明已经成功在myeclipse下运行第一个MapReduce程序了。 

  1. Bye 1    
  2. Goodbye 1    
  3. Hadoop  2    
  4. Hello   2    
  5. World   2  

 4、问题解决

如果遇到Hadoop PriviledgedActionException: Failed to set permissions;

请下载hadoop-core-1.2.1.jar.pdf,替换掉hadoop目录下的hadoop-core-1.2.1 .jar文件,即可。

转载于:https://www.cnblogs.com/liudmblog/p/3920328.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/432367.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux修改grub权限,linux下肿么修改grub.cfg

一、grub2的启动配置文件grub.cfggrub2的启动配置文件grub.cfg是/boot/grub/grub.cfg,而不是以前的memu.lst。如果你是多系统,有Ubuntu和windows,那么用下面的命令,可以使grub2得到所以可以启动的系统。sudo update-grub实际就是让…

使用DBCA创建数据库

(1)选择“开始”—>“程序”—>Oracle-Oracle10g_home1—>配置和移植工具—>Database Configuration Assistant命令,启动DBCA,出现“欢迎使用”窗口,如图1:图1 (2)单击“…

TCL 中upvar 用法 (摘自http://www.cnblogs.com/kane1990/archive/2011/12/19/2293981.html)

可以用 upvar 命令模拟传引用调用的行为,这对数组特别有用。如果a是一个数组,就不能像myproc $a这样把它传给过程myproc,因为并没有 对应整个数组的值;只有对应各个数组元素的值。 但是可以把数组名传给过程,myproc a&…

linux-2.6.32.2内核在mini2440上的移植,Linux2.6.32.2移植到Mini2440

1.移植内核的准备工作(1)使用的环境操作系统:Fedora 10交叉编译工具使用:arm-linux-gcc-4.3.2(2)获取内核有很多方式可以获取 Linux 内核源代码,如果你的 Fedora10 平台可以上互联网,可以直接在命令行输入以下命令获取到最原汁原味的 Linux-2.6.32.2:#wg…

SliceProceduralMesh的使用

1. 构建一个actor,里面添加一个被切割的static mesh,比如一个立方体,再添加一个proceduralmesh。 然后在构造函数里面添加下面代码,将static mesh拷贝到proceduralmesh里。 另外将static mesh的hidden in game属性加上&#xff0c…

asp.net读取xml方法

这个适合刚学asp.net的同学,大神直接略过好了,asp.net经常会有很多用到XML的地方,比如全国省市的联动,以及一些菜单读取等等都有xml的影子,直接贴代码,以便我以后用到的时候忘了,注释我写得很清…

linux parallel 命令,Linux 并行处理神器 GNU Parallel 简明教程

Bash命令通常单线程运行,这意味着所有的处理工作只在单个 CPU 上执行。随着 CPU 规模的扩大以及核心数目的增加,这意味着只有一小部分的 CPU 资源用于处理任务,这样就造成了很大的资源浪费。 这种情况在进行多媒体转换(比如:图片和…

Sublime Text 2 VS Vim

说说我的开发工具Sublime Text 2和对Vim的研究 设置Sublime为VIM模式 Sublime Text 2 入门及技巧 sublime text2 使用技巧心得总结转载于:https://www.cnblogs.com/pengyou8696/p/3937089.html

Air Data System

总压 静压 动压 静压 飞机静止不动的气压 动压 飞机运动时气流对飞机产生的压力 空速管测量出来的速度并非是飞机真正相对于地面的速度,而只是相对于大气的速度,所以称为空速。如果有风,飞机相对地面的速度(称地速)还应加上风速(顺风飞…

linux 脚本 试题,10个Linux脚本面试题,看看你能答出几个?

1、写一个脚本,判断当前系统上所有用户的shell是否为可登录shell(即用户的shell不是/sbin/nologin);分别这两类用户的个数;通过字符串比较来实现;declare -a shelldeclare sum_login0declare sum_nologin0shell($(cat /etc/passwd…

鼠标

1. 在UE4窗口中显示或隐藏鼠标2. 默认状态下,鼠标移动会转动摄像机,调用下面这个函数后,只有鼠标左键按下并移动才可以移动摄像机, 这样就可以对UMG这样的菜单进行控制

Linux伪终端怎么退出,什么是linux里的终端和伪终端

1)、首先明确:控制终端(/dev/tty) 这是个在应用程序中的一个概念,前台进程有个控制终端,就对应这个。不过它并不指任何物理意义上的终端,其实/dev/tty会映射到当前的设备(通过tty命令可以看到),比如你如果在控制台界面…

UMG

1. 2D UMG2. 3D UMG 新建一个Actor,添加一个widget组件进去,设置其widget class即可3. pawn和3D UMG的交互 在pawn里面加一个widgetinteraction组件,设置交互距离和形态,然后使用press pointer key就可以给3DUMG设置鼠标 点击事件…

免费开通二级域名的论坛

支持绑定域名 支持挂广告 后台管理 官网:http://www.howbbs.com/转载于:https://www.cnblogs.com/lieyan/p/3940463.html

linux 内核 企鹅,Linux 内核 Makefile 体系简单分析

众所周知,Linux内核是使用make命令来配置并编译的,那必然少不了Makefile。在内核目录树中我们可以看到内核编译系统的顶层Makefile文件。但是如此复杂、庞大的内核源码绝不可能使用一个或几个Makefile文件来完成配置编译,而是需要一套同样复杂…

UWidgetBlueprintLibrary

使用UWidgetBlueprintLibrary类的绘制函数,可以在UMG里绘制二维图像。 做成静态函数后就可以在蓝图中直接调用 void AAGraphics::DrawLine(FPaintContext Context, FVector2D PositionA, FVector2D PositionB, FLinearColor Tint, bool bAntiAlias) {UWidgetBluepri…

UDP模式与TCP模式的区别

1、TCP有连接状态,而UDP没有。 2、TCP应用层使用无需考虑包的大小及发送情况,而UDP需要。 3、TCP中IP包大小的决定者是Socket,而UDP为应用层。转载于:https://www.cnblogs.com/xinxinboke/p/3944619.html

UProceduralMeshComponent

使用UProceduralMeshComponent可以自由的用三角星来绘制三维图形 1. 在actor的构造函数中添加UProceduralMeshComponent组件 mesh CreateDefaultSubobject<UProceduralMeshComponent>(TEXT("mesh")); Material LoadObject<UMaterial>(NULL, TEXT("…

[LeetCode] Search for a Range [34]

题目 Given a sorted array of integers, find the starting and ending position of a given target value. Your algorithms runtime complexity must be in the order of O(log n). If the target is not found in the array, return [-1, -1]. For example, Given [5, 7, 7…

linux ssh注册码,linux ssh -l 命令运用

ssh是远程登录命令&#xff0c;-l选项是最常用的选项&#xff0c;下面是我的一些总结远程登录&#xff1a;ssh -l userName ip# 远程登录到 10.175.23.9ssh -l root2 10.175.23.9执行远程命令(不登录)&#xff1a;ssh -l userName ip command# 不远程登录到 10.175.23.9…