Hadoop环境搭建

1 Hadoop集群环境搭建概述

所谓集群,就是一组通过网络互联的计算机,集群中的每一台计算机称作一个节点,Hadoop集群搭建就是在这个物理集群之上安装部署Hadoop相关的软件,然后对外提供大数据存储和分析等相关服务。

一个前提:Hadoop是为了在Linux平台上使用而开发的
一个现实:我们的电脑不是Linux系统
如何解决???搭建虚拟机,在虚拟机上安装Linux操作系统
虚拟机是什么?
虚拟的计算机,功能和真实计算机几乎完全一样
如何搭建虚拟机?
在真实电脑上安装虚拟化软件来实现虚拟机的搭建
虚拟化软件有哪些?
VMware workstation和Virtualbox
版本选择及注意事项
12,13,14,15,16,17都可以,但是要注意输入对应版本的序列号
Linux运行环境的部署: 搭建一个虚拟机,然后再在这个虚拟机上直接安装部署Linux操作系统
来实现Linux运行环境。

2 Hadoop分布式环境搭建

(0)准备模板虚拟机

配置(依情况而定,太小跑程序会有问题),例如:
主机名称:hadoop100(可以自己起,仅仅在Vmware中显示)
内存:2G
硬盘:20G
IP 地址:192.168.10.100
作用:安装分布式节点所需的软件并进行配置

(1)hadoop100 虚拟机配置要求如下:

yum 安装需要虚拟机可以正常上网,首先 确保虚拟机能够联网
(yum就是去找服务器,把你要的资源拉下来)
安装epel-release
注1:Extra Packages for Enterprise Linux 是为“红帽系”的操作系统提供额外的软件包,适用于RHEL、CentOS 和 Scientific Linux。相当于 是一个软件仓库,大多数rpm 包在官方repository 中是找不到的)
注2:如果Linux 安装的是最小系统版,还需要手动安装net-tools、vim 等工具(最好不要最小化安装)

(2)关闭防火墙,关闭防火墙开机自启动

[root@hadoop100 ~]# systemctl stop firewalld
[root@hadoop100 ~]# systemctl disable firewalld
[root@hadoop100 ~]# systemctl status firewalld
为什么要关掉防火墙?因为他们之间要进行互通,关闭防火墙是为了他们之间在构建集群的时候不会因为防火墙和端口的限制

(3)创建hadoop 用户,并修改hadoop 用户的密码

[root@hadoop100 ~]# useradd hadoop
[root@hadoop100 ~]# passwd hadoop

(4)配置hadoop 用户具有root 权限,方便后期加sudo 执行root 权限的命令

[root@hadoop100 ~]# vim /etc/sudoers
## Allow root to run any commands anywhere
root ALL=(ALL) ALL
hadoop ALL=(ALL) ALL
注意:基本配置用hadoop,安装软件,启动服务都用hadoop

(5)在/opt目录下创建文件夹,并修改所属主和所属组

1)在/opt目录下创建 module、software文件夹
2)修改 module、software文件夹的所有者和所属组均为hadoop用户
3)查看 module、software文件夹的所有者和所属组
[root@hadoop100 ~]# chown hadoop:hadoop /opt/module
[root@hadoop100 ~]# chown hadoop:hadoop /opt/software
为什么要创建这些文件夹?为了使目录结构更加规整  /opt是第三方管理软件,为什么要修改文件夹和所属组为root用户?这涉及到权限问题,要求有写的权限
你没有就自己创建,我用我自己创建的普通用户

(6)卸载自带jdk(最小化安装不需要)

[root@hadoop100 ~]# rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps

rpm -qa :查询所安装的所有 rpm 软件包
grep -i :忽略大小写
xargs -n1 :表示每次只传递一个参数
rpm -e –nodeps :强制卸载软件
这个步骤很重要,以后如果涉及到开发运维这些都是最基本的
为什么要强制卸载java呢?因为可能版本不兼容,所以要卸载,因为可能有依赖关系,所以强制卸

(7)配置静态ip

1)配置虚拟机IP

这里我写的比较简略,因为我已经很熟练了,这个是我当时学配置静态ip的博客,会改就行

虚拟机配置静态IP(NAT模式)_nat子网的准入_阿祖,收手吧的博客-CSDN博客

[root@hadoop100 ~]# vi /etc/sysconfig/network-scripts/ifcfg-ens33
[root@hadoop100 ~]# vi /etc/sysconfig/network-scripts/ifcfg-ens33 
OWSER_ONLY=no
BOOTPROTO=static
……
NAME=ens33
UUID=9473daea-1240-40a7-ada1-a2aa06f7b09d
DEVICE=ens33
ONBOOT=yes
IPADDR=192.168.133.100
PREFIX=24
GATEWAY=192.168.133.2
DNS1=192.168.133.2

上面是我之前的ip地址,下面这个是我配置的ip地址

重启一下网络,发现ip变成自己改的ip

(8)修改主机名称

1)修改主机名称
[root@hadoop100 ~]# vim /etc/hostname
hadoop100
里面的内容删了就行,这里建议直接改配置文件,因为fhostname hadoop100只会维护一段时间
2)修改主机名称
[root@hadoop100 ~]# vim /etc/hosts
192.168.10.100
hadoop100
192.168.10.101
hadoop101
192.168.10.102
hadoop102
192.168.10.103 hadoop103
(9)重启虚拟机hadoop100
[root@hadoop100 ~]# reboot
(10)修改windows主机的hosts文件,添加以下内容
192.168.10.100
hadoop100
192.168.10.101
hadoop101
192.168.10.102
hadoop102
192.168.10.103 hadoop103
经过上述步骤系统相关设置基本完成。接下来需要安装软件:
1)JDK
2)Hadoop
上述系统配置使用root用户完成,比较方便。以下软件安装步骤统一使用上
述创建的 hadoop用户完成
伪分布式的配置
伪分布式我配了五六遍了,发现老师给的ppt里面配置文件写错了
Web端查看HDFS的NameNode,浏览器输入http://hadoop102:9870
Web端查看YARN的ResourceManager,在浏览器输入http://hadoop102:8088

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/130435.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

设置IDEA快捷生成方法头,类头注释

1.File->settings->editor->live templates进入Live Template界面进行设置: 下一步: 下一步: /*** Title: $title$* author: sunyanzeng* date: $datatime$*/在需要添加文件头的地方打出“aa”,回车,会自…

postgresql 触发器如何生成递增序列号,从1开始,并且每天重置

大家好,我是三叔,许久不见,这期给大家介绍一下笔者在开发中遇到的业务处理:pgsql 创建触发器生成每日递增序列,并且第二天重置,根据不同的用户进行不同的控制。 1.创建生成递增序列的 table 表 -- 创建us…

MySQL8.0.26-unbuntu版安装

MySQL8.0.26-ubuntu版安装 在这里会有一个坑,就是我在安装的时候,是按照另外一种版本的安装,报错没有rpm这个包,然后我就去下载,然后就报错 E: 无法定位软件包 ,害的我找了好久的资料,一直没有解决&#x…

喜报|英码科技荣登“广州首届百家新锐企业名单”、“2022年度中国好技术项目库名单”榜单

近日,英码科技喜报连连,在刚刚公布的2022年度“中国好技术”项目库入选名单和广州首届百家新锐企业名单中,英码科技凭借出色的技术创新能力和优秀的企业竞争力荣登榜单。 2022年度“中国好技术” 近期,2022年度“中国好技术”征集…

iOS开发 Command PhaseScriptExecution failed with a nonzero exit code

解决步骤: 1.重启电脑 2.把xcode项目Build Setting中的Sandboxing置为No 3.重跑项目

大数据毕业设计选题推荐-收视点播数据分析-Hadoop-Spark-Hive

✨作者主页:IT研究室✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…

Java web(六):FilterListenerAJAX

文章目录 一、Filter1.1 基本介绍1.2 过滤器的执行流程1.3 拦截路径配置1.4 过滤器链1.5 案例 二、Listener三、AJAX3.1 快速入门3.2 Axios异步框架 四、 JSON4.1 JSON基础语法4.2 Fastjson 五、 案例JSONAxiosServlet Java web的三大组件:Servlet、Filter、Listene…

Linux Crontab 定时任务

crond 服务 Linux 通过 crond 服务来支持 crontab。 查看 crond 服务是否已经安装 输入下面命令确认 crond 服务是否已安装。 systemctl list-unit-files | grep crond 如果为 enabled,表示服务正运行。 crontab 文件 crontab 要执行的定时任务都被保存在 /etc…

基于单片机的衣物消毒清洗机系统设计

收藏和点赞,您的关注是我创作的动力 文章目录 概要 一、系统总体设计2.2 功能分析2.3 系统框架设计 二、硬件电路设计3.1 电源模块的设计 三、 软件设计4.1 系统整体流程4.4 软件整体流程实物图 四、 结论五、 文章目录 概要 基于单片机的衣物消毒清洗机可以应用在…

一篇文章带你学会MybatisPlus~

实现MybatisPlus的简单使用: 数据库准备部分: //创建名为mybatisPlus的数据库 create database mybatisPlus;//使用该数据库 use mybatisPlus;//创建user表 CREATE TABLE user( id bigint(20) NOT NULL COMMENT 主键ID , name varchar(30) DEFAULT NUL…

Sqoop的安装和使用

目录 一.安装 二.导入 1.全量导入 一.MySQL导入HDFS 二.MySQL导入Hive 2.增量导入 一.过滤导入hdfs/hive 二.导出 一.安装 1.下载地址:sqoop下载地址 2.解压 tar -zxvf ./sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C ../module/ 3.改名和配置归属权限 #改名…

首发scitb包,一个为制作统计表格而生的R包

目前,本人写的第3个R包scitb包已经正式在R语言官方CRAN上线,scitb包是一个为生成专业化统计表格而生的R包。 可以使用以下代码安装 install.packages("scitb")scitb包对我而言是个很重要的R包,我的很多想法需要靠它做平台来实现&a…

软件测试/测试开发丨利用ChatGPT 生成自动化测试脚本

点此获取更多相关资料 简介 自动化测试脚本可以模拟用户与应用程序的交互,例如点击按钮、输入数据、导航到不同的页面等等,以验证应用程序的正确性、性能和稳定性。 自动化测试在回归测试、冒烟测试等测试流程中都可以极大地起到节省时间、节省人力的作…

【主题教育】民革达州市委会开展“践诺我与民革共成长“讲述活动

【主题教育】民革达州市委会开展“践诺,我与民革共成长“讲述活动 10月28日,民革达州市委会开展“践诺,我与民革共成长——我是民革‘螺丝钉’讲述活动”,有序推进民革四川省委会“重温加入民革承诺、守护民革精神家园”专项活动往心里走、往深里走、往实里走。达州市人大常委会…

计算机组成与结构-安全性和可靠性

系统可靠性分析 概念 平均无故障时间 MTTF 1/失效率 平均故障修复时间 MTTR1/修复率 平均故障间隔时间 MTBFMTTFMTTR 系统可用性 MTTF/(MTTFMTTR)*100% 计算 串联系统 一个设备不可靠,整个系统崩溃RR1R2Rn 并联系统 所有设备不可靠,整个系统崩溃R1-(1…

Vue 官网使用与环境搭建

vue官网网址:https://cn.vuejs.org/vue脚手架文档网址:https://cli.vuejs.org/zh/ vue团队为了使得vue更加好的使用,维护了一些文档。 API是vue的字典,在编写vue的时候,遇到了一些不会的方法那么就去找API&#xff0c…

Visual Studio 2010 软件安装教程(附下载链接)——计算机二级专用编程软件

下载链接: 提取码:2wAKhttps://www.123pan.com/s/JRpSVv-9injv.html 安装步骤如下: 1.如图所示,双击打开【Visual Studio 2010简体中文旗舰版】文件夹 2.如图所示,找到“Setup”文件夹打开,双击运行“setup” 3.如图…

Datawhale-AIGC实践

Datawhale-AIGC实践 部署ChatGLM3-6B平台 clone 项目,配置环境 git clone https://github.com/THUDM/ChatGLM3.git cd ChatGLM3 pip install -r requirement.txt修改web_demo.py, web_demo2.py 设置加载模型的路径修改启动代码: demo.queue().launch(shareFalse…

SpringMVC简单介绍与使用

目录 一、SpringMVC介绍 二、SpringMVC作用 三、SpringMVC核心组件 四、SpringMVC快速体验 一、SpringMVC介绍 Spring Web MVC是基于Servlet API构建的原始Web框架,从一开始就包含在Spring Framework中。正式名称“Spring Web MVC”来自其源模块的名称&#xff…

计算虚拟化3——I/O设备虚拟化

目录 I/O基本概念 I/O设备与CPU连接图 CPU与I/O设备的交互 访问I/O设备(IO Access) 数据传输(Data Tronhsfer) I/O设备虚拟化技术 软件辅助全虚拟化 半虚拟化 Virtio协议基本概念 Virtqueue讲解 硬件辅助全虚拟化 I/O…