hadoop 2.7.3伪分布式安装

hadoop 2.7.3伪分布式安装

hadoop集群的伪分布式部署由于只需要一台服务器,在测试,开发过程中还是很方便实用的,有必要将搭建伪分布式的过程记录下来,好记性不如烂笔头。
hadoop 2.7.3
JDK 1.8.91

到Apache的官网下载hadoop的二进制安装包。

cd /home/fuxin.zhao/soft
tar -czvf hadoop 2.7.3.tar.gz
cd hadoop-2.7.3
cd etc/hadoop/
pwd

1. 建立本机到本机的免密登录

ssh-keygen -t rsa -P ""
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
ssh localhost

1. 修改hadoop的配置文件

位于$HADOOP_HOME/conf目录下的修改四个配置文件:slaves、core-site.xml
hdfs-site.xml 、mapred-site.xml 、 yarn-site.xml

vi etc/hadoop/yarn-env.sh

export JAVA_HOME=/usr/local/jdk

vi etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/local/jdk

vi slaves

##加入本机的hostname
fuxin.zhao@ubuntuServer01:~/soft/hadoop-2.7.3/etc/hadoop$ vi slaves 
ubuntuServer01

vi core-site.xml

<configuration><property><name>fs.defaultFS</name><value>hdfs://ubuntuServer01:9000</value></property><property><name>hadoop.tmp.dir</name><value>file:/home/fuxin.zhao/hadoop/tmp</value><description>Abase for other temporary directories.</description></property>
</configuration>

vi hdfs-site.xml:

<configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><value>file:/home/fuxin.zhao/hadoop/tmp/dfs/name</value></property><property><name>dfs.datanode.data.dir</name><value>file:/home/fuxin.zhao/hadoop/tmp/dfs/data</value></property><property><name>dfs.block.size</name><value>67108864</value></property>
</configuration>

vi yarn-site.xml

<configuration>
<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value>
</property>
<property><name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property><name>yarn.scheduler.minimum-allocation-mb</name><value>512</value>
</property>
<property><name>yarn.scheduler.maximum-allocation-mb</name><value>2048</value>
</property>
<property><name>yarn.scheduler.minimum-allocation-vcores</name><value>1</value>
</property>
<property><name>yarn.scheduler.maximum-allocation-vcores</name><value>2</value>
</property>
</configuration>

vi mapred-site.xml

<configuration>
<property><name>mapreduce.framework.name</name><value>yarn</value>
</property>
<property><name>yarn.app.mapreduce.am.resource.mb</name><value>512</value>
</property>
<property><name>mapreduce.map.memory.mb</name><value>512</value>
</property>
<property><name>mapreduce.reduce.memory.mb</name><value>512</value>
</property>
</configuration>

vi .bashrc

export JAVA_HOME=/usr/local/jdk
export HADOOP_HOME=/home/fuxin.zhao/soft/hadoop-2.7.3
export PATH=${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:$PATH

配置完成后,执行 NameNode 的格式化:

./bin/hdfs namenode -format
./sbin/start-dfs.sh
./sbin/start-yarn.sh
mr-jobhistory-daemon.sh start historyserver

查看hdfs的web页面:
http://ubuntuserver01:50070/
http://ubuntuserver01:8088/

hadoop fs -ls /
hadoop fs -mkdir /user
hadoop fs -mkdir /user/fuxin.zhao
hadoop fs -touchz textFile

运行官方自带的测试job(teragen and terasort):

测试job(teragen and terasort)
#在/tmp/terasort/1000000下生成100M数据
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar teragen 1000000 /tmp/terasort/1000000-input#排序,输出到/tmp/terasort/1000000-output
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar terasort /tmp/terasort/1000000-input /tmp/terasort/1000000-output#删除临时文件
hadoop fs -rm -r /tmp/terasort/1000000-input
hadoop fs -rm -r /tmp/terasort/1000000-output

转载于:https://www.cnblogs.com/honeybee/p/6400709.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/572731.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

php 环境变量有什么用,什么是环境变量,Linux环境变量及作用

变量是计算机系统用于保存可变值的数据类型&#xff0c;我们可以直接通过变量名称来提取到对应的变量值。在 Linux 系统中&#xff0c;环境变量是用来定义系统运行环境的一些参数&#xff0c;比如每个用户不同的家目录(HOME)、邮件存放位置(MAIL)等。值得一提的是&#xff0c;L…

Web Api 转

GET&#xff1a;生到数据列表&#xff08;默认&#xff09;&#xff0c;或者得到一条实体数据 POST&#xff1a;添加服务端添加一条记录&#xff0c;记录实体为Form对象 PUT&#xff1a;添加或修改服务端的一条记录&#xff0c;记录实体的Form对象&#xff0c;记录主键以GET方式…

matlab 刻度非均匀控制,MATLAB 出一张好看的图

1、坐标轴的视点(viewpoint)&#xff1a;从哪个方向看整个坐标系统&#xff0c;这决定了坐标轴的方向和位置&#xff0c;通过view函数实现视点的设置&#xff1b;view([z y ])&#xff1a;(将坐标系统想象为一座房子&#xff0c;而自己是个会飞的天使&#xff0c;最初你在房子的…

weak_ptr打破环状引用

转自&#xff1a;http://blog.csdn.net/malong777/article/details/48974559 weak_ptr是一种不控制对象生存周期的智能指针&#xff0c;它指向一个shared_ptr管理的对象...它不会改变shared_ptr的引用计数——《C Primer .5th》。很明显&#xff0c;weak_ptr的特点是“弱引用”…

百度链接提交php获取状态码,新网站,在百度提交了首页链接,但是一直没有收录,也没有爬虫抓取,怎么回事呢?(悬赏1元) - 搜外SEO问答...

新站前期需要做哪些操作&#xff1a;1、上线前保证网站的内容已经有一定的丰富性&#xff0c;可供爬虫已经有20的主关键词相关的界面或文章&#xff0c;50为最佳。2、新站的标题不要堆彻关键词&#xff0c;以主关键词主关键词描述语句品牌词 这个类型的标题为最佳。3、标题中出…

使用 git-cherry-pick 迁移提交

参考 git-cherry-pick 后续补上

前端js模糊搜索(模糊查询)

1.html结构&#xff1a; <label for"searchShop" class"clear pos-a" style"top:17px;"> <input type"text" id"searchShop" placeholder"场所搜索"> <input type"but…

php代码审计思路,代码审计思路讨论

原标题&#xff1a;代码审计思路讨论前言首先感谢手电筒的建议&#xff0c;建议我从Bluecms来开始学习代码审计。感谢桑桑格&#xff0c;风哥的问题解答。文章主要是写下我自己在代码审计的时候所思所想。当然并不是太过严谨&#xff0c;也有可能存在错误。这里主要是写出了审计…

LinkedHashSet

特点: 有序 , 唯一 底层的数据结构为: 链表和哈希表 , 链表保证有序 , 哈希表保证唯一 import java.util.LinkedHashSet; public class Demo2_LinkedHashSet {/*** param args* LinkedHashSet* 底层是链表实现的,是set集合中唯一一个能保证怎么存就怎么取的集合对象* 因为是Has…

oracle如何自定义类型,Oracle 自定义类型

一、子类型这种类型最简单&#xff0c;类似类型的一个别名&#xff0c;主要是为了对常用的一些类型简单化&#xff0c;它基于原始的某个类型。如&#xff1a;有些应用会经常用到一些货币类型&#xff1a;number(16,2)。如果在全局范围各自定义这种类型&#xff0c;一旦需要修改…

Dubbo源码分析:ThreadPool

定义了通过URL对象作为参数获取Executor对象的get&#xff25;xecutor方法。所有实现ThreadPool接口的类都是基于ThreadPoolExecuotr对象来实现的。 类图 转载于:https://www.cnblogs.com/wspgbw/p/6409933.html

oracle查询并列,【问】oracle-查询各门课程的前2名和后2名

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼成绩表&#xff1a;studentscorecreate table studentScore(id int primary key not null,course varchar2(20),score int,studentname varchar2(20))数据&#xff1a;id course score studentname1 语文 100 张三2 语文 98 李四3 …

MySQL存储过程及触发器

一、存储过程 存储过程的基本格式如下&#xff1a; -- 声明结束符 -- 创建存储过程 DELIMITER $ -- 声明存储过程的结束符 CREATE PROCEDURE pro_test() --存储过程名称(参数列表) BEGIN-- 可以写多个sql语句; -- sql语句流程控制SELECT * FROM employee; END $ -- 结…

asp连接oracle6,asp下用OracleInProcServer完成对Oracle的连接和操作-ASP教程,数据库相关...

< % response.charset"gb2312"tblnamerequest("tb")dim objorasession,objoradbdim strdbuser,strdbpwd,strdbconncall connectdb()sub connectdb() 连接数据库on error resume nextstrdbuser "liujincai" 连接用户名strdbpwd "ljc100…

destoon 短信发送函数及短信接口修改

// $DT在common.inc.php中定义&#xff0c; $CACHE cache_read(module.php); $DT $CACHE[dt]; 从缓存里读取网站配置信息。 //$db 数据库类&#xff0c;$DT 全局配置&#xff0c;$DT[sms] 开启手机短信&#xff0c;$DT_TIME系统时间&#xff0c;$DT_IP 当前ip地址&#xff0…

linux系统电源时钟,linux电源管理的一些梳理

由于项目产品需要过能源之星3.0&#xff0c;所以最近做了一些电源管理低功耗方面的工作&#xff0c;抽个时间正好梳理一下。其实Linux 电源管理非常复杂&#xff0c;牵扯到很多方面&#xff0c;比如系统级的待机、频率电压变换、系统空闲时的处理以及每个设备驱动对于系统待机的…

linux命令行 基础,Linux命令行基础,关于Bash需要知道的一些常识

介绍Linux越来越重要&#xff0c;对于开发者来说学习必要的bash技术必不可少&#xff0c;对运维来说更是如此。学习shell可以参考很多学习材料和图书&#xff0c;比如ChinaUnix论坛网中人大哥总结的《Shell十三问》的帖子&#xff0c;《ABS 指导》(《Advanced Bash-Scripting G…

linux 删除单个创建文件夹,Linux 删除文件夹和创建文件的命令

VS中批注的使用SAL 是 Microsoft 源代码注释语言. 使用源代码批注,可以使代码背后的意图更加清晰. 这些注释还可以使用自动化的静态分析工具更准确地分析代码,显著减少误判.那么什么是批注,举个简单的例子, ...MVVM架构~knockoutjs系列之数组的&dollar;index和&dollar;…

安卓界面组件-文本框

前面三篇文章本质上是围绕着View类进行的。View是安卓UI的基础类&#xff0c;我们的安卓开发“千里之行”是从View开始的。 安卓界面UI有大量的组件&#xff0c;组件的继承和间接继承于View。有一类组件很基本&#xff0c;这就是TextView文本框&#xff0c;作用是显示文本。在T…

linux centos7重启路由命令行,centos7 永久添加静态路由

查看路由表ip route show|column -troute -n永久添加路由vim /etc/sysconfig/network-scripts/route-ens224./ via ../ via重启网络生效systemctl restart networkCentos6C、# vi /etc/sysconfig/static-routes (没有static-routes的话就手动建立一个这样的文件&#xff0c;推荐…