菜鸟也学hadoop(1)_搭建单节点的hadoop

其实跟官方的教程一样 只是 我想写下来 避免自己搞忘记了,,,,好记性不如烂笔头

首先确认自己是否安装了 java, ssh 以及 rsync 没有装的直接就 apt-get install 了嘛,,,java的不一定要用sun的  OPEN的也好  主要方便。。。。不是重点 看着搞啦

然后 就是ssh免密码登录  这点 主要是因为 hadoop 需要通过ssh来启动salve列表中的各个主机守护进程,因为 分布式集群管理的  所以不管你是用的单机伪分布 或是分布  它都不分管理模式的,因此这一步必须搞 也简单 就两道命令

/opt/hadoop# ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#后面学到的新的做法 记录一下
On source host:
    cd ~
    mkdir .ssh
    chmod 700 .ssh
    cd .ssh
    ssh-keygen -t rsa -b 1024
    cat id_rsa.pub
    copy contents of id_rsa.pub
    
On destination host:
    cd ~
    mkdir .ssh
    chmod 700 .ssh
    cd .ssh
    vi authorized_keys
    paste contents of id_rsa.pub from evnoltp9 into authorized keys
    :wq!
    #chmod 600 authorized_keys
    chmod og-rxw $HOME/.ssh $HOME/.ssh/authorized_keys


另外要注意请务必要将服务器上

~/.ssh权限设置为700

~/.ssh/authorized_keys的权限设置为600


试一试 是否可以免密码登录       ssh localhost

这样就完成了第一步

echo $JAVA_HOME

看看jdk安装在哪里  然后copy一下路径 一会用上

vim ./conf/hadoop-env.sh

当中大概第九条 把那里的JAVA_HOME 指定一下

export JAVA_HOME=/usr/lib/jdk/jdk1.7.0_07                ##保存

配置 hadoop核心配置文件 vim ./conf/core-site.xml

<configuration>
       <property>
               <name>fs.default.name</name>
               <value>hdfs://localhost:9000</value> ##hdfs入口
       </property>
</configuration>
配置 hadoop 的HDFS配置文件 vim ./conf/hdfs-site.xml

<configuration>
       <property>
               <name>dfs.replication</name>
               <value>1</value>  ##文件副本数量 但节点 一个就够了
       </property>
</configuration>

配置 hadoop 的 MapReduce配置文件  vim ./conf/mapred-site.xml

<configuration>
       <property>
               <name>mapred.job.tracker</name>
               <value>localhost:9001</value> 
       </property>
</configuration>

这样 一个单节点的Hadoop就配置成功了  剩下的就是格式下文件系统 然后 启动就OK 了

首先是格式文件系统  

hadoop namenode -format

接下来启动

start-all.sh

当然 你可以 单单启动 HDFS(start-dfs.sh)  也可以单单启动 MapReduce (start-mapred.sh)

验证是否成功 打开浏览器

localhost:50030    ##MapReduce WEB管理界面

localhost:50070    ##HDFS WEB管理界面

测试上传文件到 hdfs文件系统当中

hadoop fs -put 文件名 hdfs://localhost:9000/指定一个文件夹 或者 就放到根目录

刷新下 hdfs管理界面 就能看到那个文件了

测试 MapReduce 例子 用的 hadoop里面自带的例子 计算shell脚本当中的单词量

 首先先上传 要计算的sh文件 hadoop fs -mkdir /input   ##创建一个input文件夹

                                          hadoop fs -put *.sh /input/  ##上传当前文件夹下所有的*.sh文件 到 hdfs 的 input 文件夹下

hadoop jar hadoop-examples-i.0.3.jar wordcount /input /output

开始计算 过程省略  仅仅使用于测试的  

-----完成后 可以在 localhost:50070 文件管理系统当中发现一个output文件夹 点进入 在part-r-00000 当中记录了结果  前面是单词 后面是出现的次数

在localhost:50030 可以看到running jobs(这里显示 运行当中的)

                                         completed jobs (这里显示作业运行的统计)点进去可以看到一些 更详细的信息,自己研究啦


 由于在 UBUNTU当中截图麻烦 我就不发图了 按照步骤一步一步来 亲测OK   我用的 UBUNTU 12.04
 注:后面我看了书 hadoop实战 机械工业出版社的那本  说是不能用openJava  但是我原来看别人录制视频 说是可以, 我呢是用的 oracle的  大家如果用open的装不上 就用oracle的吧 没有实践过

本文转自    拖鞋崽      51CTO博客,原文链接:http://blog.51cto.com/1992mrwang/1011844


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/393150.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SP703 SERVICE - Mobile Service[DP]

题意翻译 Description   一个公司有三个移动服务员。如果某个地方有一个请求&#xff0c;某个员工必须赶到那个地方去&#xff08;那个地方没有其他员工&#xff09;&#xff0c;某一时刻只有一个员工能移动。只有被请求后&#xff0c;他才能移动&#xff0c;不允许在同样的位…

CF758 D. Ability To Convert 细节处理字符串

link 题意&#xff1a;给定进制数n及一串数字,问在此进制下这串数能看成最小的数&#xff08;10进制&#xff09;是多少&#xff08;如HEX下 1|13|11 475&#xff09; 思路&#xff1a;此题要仔细思考细节。首先要想使数最小那么必定有个想法是使低位的数尽可能大即位数尽可能…

java 可能尚未初始化变量,java - 局部变量“变量”可能尚未初始化-Java - 堆栈内存溢出...

我得到这个错误。线程“主”中的异常java.lang.Error&#xff1a;未解决的编译问题&#xff1a;rgb2无法解析为变量它总是导致错误的rgb2数组。 如何解决这个问题呢&#xff1f;BufferedImage img1 ImageIO.read(file1);BufferedImage img2 ImageIO.read(file2);int w img1.…

leetcode1249. 移除无效的括号(栈)

给你一个由 ‘(’、’)’ 和小写字母组成的字符串 s。 你需要从字符串中删除最少数目的 ‘(’ 或者 ‘)’ &#xff08;可以删除任意位置的括号)&#xff0c;使得剩下的「括号字符串」有效。 请返回任意一个合法字符串。 有效「括号字符串」应当符合以下 任意一条 要求&…

软件工程——个人课程总结

软件工程&#xff0c;我就是冲着软件这两个字来的&#xff0c;开始我觉得我们大多数人也是这样的&#xff0c;能开发一款属于自己的软件应该是我们人生中的第一个小目标八&#xff0c;在上学期学完java语言后&#xff0c;我们自认为自己已经具备了开发一款小软件的能力&#xf…

规则网络_实用的网络可访问性规则

规则网络by Tiago Romero Garcia蒂亚戈罗梅罗加西亚(Tiago Romero Garcia) 实用的网络可访问性规则 (Pragmatic rules of web accessibility that will stick to your mind) I first started to work with web accessibility back in 2015, at an American retail giant. It h…

8-python自动化-day08-进程、线程、协程篇

本节内容 主机管理之paramiko模块学习 进程、与线程区别python GIL全局解释器锁线程语法join线程锁之Lock\Rlock\信号量将线程变为守护进程Event事件 queue队列生产者消费者模型Queue队列开发一个线程池进程语法进程间通讯进程池 转载&#xff1a;  http://www.cnblogs.co…

部署HDFS HA的环境

> 环境架构部署规划&#xff1a; bigdata1 NameNode ResourceManager Zookeeper JournalNode failOverController bigdata2 NameNode ResourceManager Zookeeper JournalNode failOverController bigdata3 DataNode NodeManager Zookeeper bigdata4 DataNode NodeManager &g…

php layui 框架,Thinkphp5+Layui高颜值内容管理框架

Thinkphp5Layui高颜值内容管理框架TP5Layui高颜值内容管理框架&#xff0c;新增API模块Thinkphp5Layui响应式后台权限管理系统专注打造好用的框架&#xff0c;极速开发&#xff0c;高效灵活&#xff0c;从架构上兼顾系统复杂度的迭代与需求多变。代码结构清晰&#xff0c;接口开…

leetcode657. 机器人能否返回原点

在二维平面上&#xff0c;有一个机器人从原点 (0, 0) 开始。给出它的移动顺序&#xff0c;判断这个机器人在完成移动后是否在 (0, 0) 处结束。 移动顺序由字符串表示。字符 move[i] 表示其第 i 次移动。机器人的有效动作有 R&#xff08;右&#xff09;&#xff0c;L&#xff…

在Angular专家Dan Wahlin的免费33部分课程中学习Angular

According to the Stack Overflow developer survey 2018, Angular is one of the most popular frameworks/libraries among professional developers. So learning it increases your chances of getting a job as a web developer significantly.根据2018年Stack Overflow开…

select查询语句执行顺序

查询中用到的关键词主要包含六个&#xff0c;并且他们的顺序依次为 select--from--where--group by--having--order by 其中select和from是必须的&#xff0c;其他关键词是可选的&#xff0c;这六个关键词的执行顺序 与sql语句的书写顺序并不是一样的&#xff0c;而是按照下面的…

Python的Virtualenv(虚拟环境)的使用(Windows篇)2

Python的Virtualenv(虚拟环境)的使用&#xff08;Windows篇&#xff09; 2018年04月13日 11:35:01 D_FallMoon 阅读数 771 版权声明&#xff1a;版权所有 装载请注明 …

Loadrunner常用15种的分析点

1.Vusers&#xff1a;提供了生产负载的虚拟用户运行状态的相关信息&#xff0c;可以帮助我们了解负载生成的结果。 2.Rendezvous&#xff08;负载过程中集合点下的虚拟用户&#xff09;&#xff1a;当设置集合点后会生成相关数据&#xff0c;反映了随着时间的推移各个时间点上并…

leetcode1442. 形成两个异或相等数组的三元组数目

给你一个整数数组 arr 。 现需要从数组中取三个下标 i、j 和 k &#xff0c;其中 (0 < i < j < k < arr.length) 。 a 和 b 定义如下&#xff1a; a arr[i] ^ arr[i 1] ^ … ^ arr[j - 1] b arr[j] ^ arr[j 1] ^ … ^ arr[k] 注意&#xff1a;^ 表示 按位异…

matlab的独立样本t检验,独立双样本检验的Matlab实现

Independent two-samples test in MatlabYang Runhuai1杨润怀(1987-)&#xff0c;男&#xff0c;讲师&#xff0c;生物3D打印Zhang Zhen1Yang Siqiao1Liang Zhen1梁振(1981-)&#xff0c;男&#xff0c;副教授&#xff0c;临床工程1、Life Science School, Anhui medical unive…

bi可视化工具_适用于您的BI解决方案的最佳数据可视化和Web报告工具

bi可视化工具通过智能数据分析使复杂变得简单 (Making the complex simple with smart data analysis) It is hard to overestimate the value of insightful analytics nowadays. All business processes have become data-driven: marketing, accounting, human resources, c…

Python os 属性(便于跨平台开发)

1、有助于跨平台开发的os模块属性 >>> tmp os.linesep >>> tmp \n >>> tmp os.sep >>> tmp / >>> tmp os.pathsep >>> tmp : >>> tmp os.curdir >>> tmp . >>> tmp os.pardir >&g…

第一个Hibernate项目

一、构建Hibernate项目 1.新建Java项目HibernateDemo1 2.导入Hibernate下的jar包&#xff08;lib->required下的所有jar包&#xff09;jdbc驱动包 3.导入hibernate.cfg.xml文件到src目录下&#xff08;在Hibernate文件目录中搜索*.cfg.xml&#xff09; 配置该文件如下&#…

前端面试常见逻辑题收集及分析

前端面试中常出现一些有趣的逻辑题,初见的时候有可能会手足无措,但实际多看几个题之后就会有一定的思考逻辑,有种打通任督二脉的感觉.以下是我个人面试经历以及网络上收集来的一些经典题目. 题目: 1.现有一个装有无限水的池塘,你手里有两个空壶,一个容积为6升,一个为5升,请问你…