Hadoop生态圈框架部署 - Windows上部署Hadoop

文章目录

  • 前言
  • 一、下载Hadoop安装包及bin目录
    • 1. 下载Hadoop安装包
    • 2. 下载Hadoop的bin目录
  • 二、安装Hadoop
    • 1. 解压Hadoop安装包
    • 2. 解压Hadoop的Windows工具包
  • 三、配置Hadoop
    • 1. 配置Hadoop环境变量
      • 1.1 打开系统属性设置
      • 1.2 配置环境变量
      • 1.3 验证环境变量是否配置成功
    • 2. 修改Hadoop配置文件
      • 2.2 修改 core-site.xml 配置文件
      • 2.3 修改 hdfs-site.xml 配置文件
      • 3.4 修改 mapred-site.xml 配置文件
      • 3.5 修改 yarn-site.xml 配置文件
    • 3. 格式化HDFS(Hadoop分布式文件系统)
    • 4. 复制timelineservice目录
    • 5. Hadoop启动和停止
      • 5.1 启动 Hadoop
      • 5.2 停止 hadoop 集群


前言

Hadoop作为大数据领域的基石框架,在数据存储与处理方面展现出了卓越的性能与强大的扩展性,为海量数据的高效管理与分析提供了有力支撑。在当今数字化浪潮席卷全球,数据量呈爆发式增长的时代背景下,掌握Hadoop的安装与配置技能显得尤为重要,它是开启大数据世界大门的一把关键钥匙。无论是企业希望从繁杂的数据中挖掘商业价值,还是科研人员致力于数据分析以推动学术研究进展,Hadoop都能发挥其独特的优势。本文将以清晰明了的步骤,详细阐述在特定环境下Hadoop的安装与配置过程,旨在帮助读者顺利搭建起Hadoop运行环境,为后续深入探索大数据技术奠定坚实基础。


一、下载Hadoop安装包及bin目录

1. 下载Hadoop安装包

华为云镜像站下载:https://mirrors.huaweicloud.com/repository/apache/hadoop/common/hadoop-3.3.0/hadoop-3.3.0.tar.gz

2. 下载Hadoop的bin目录

下载Hadoop的bin目录地址:https://gitcode.com/gh_mirrors/wi/winutils/tree/master/hadoop-3.0.0/bin

进入下载网站后,点击下载当前目录,如下图所示。

在这里插入图片描述


二、安装Hadoop

1. 解压Hadoop安装包

双击下载好的安装包,点击解压,选则解压路径,然后点击确定,如下图所示。

在这里插入图片描述

2. 解压Hadoop的Windows工具包

解压Hadoop的Windows工具包到下载目录,如下图所示。

在这里插入图片描述

把Hadoop的Windows工具包中的bin目录复制到解压后的Hadoop目录,覆盖原有的bin目录,如下图所示。

在这里插入图片描述


三、配置Hadoop

1. 配置Hadoop环境变量

1.1 打开系统属性设置

  • 右键点击“此电脑”,选择“属性”,点击“高级系统设置”。
  • 在弹出的“系统属性”窗口中,点击“环境变量”。
    在这里插入图片描述

1.2 配置环境变量

在环境变量页面点击新建,输入变量名和变量值(变量名为HADOOP_HOME,变量值为解压后的hadoop目录),然后点击确定,如下图所示。

在这里插入图片描述

路径变量配置步骤如下图所示。

在这里插入图片描述

1.3 验证环境变量是否配置成功

打开一个新的命令提示符窗口(cmd),输入 hadoop version 来验证hadoop环境变量是否正确配置。如果显示了版本信息,则说明环境变量配置成功。

配置成功如下图所示:

在这里插入图片描述

注意:
如出现如下图所示的异常,说明jdk路径在C盘,需要使用C:\PROGRA~1"C:\Program Files"代替C:\Program Files

在这里插入图片描述

解决方法:
D:\development\hadoop-3.3.0\etc\hadoop\hadoop-env.cmd文件中set JAVA_HOME=%JAVA_HOME%修改为set JAVA_HOME=C:\PROGRA~1\Java\jdk-1.8

2. 修改Hadoop配置文件

2.2 修改 core-site.xml 配置文件

修改hadoop核心配置文件D:\development\hadoop-3.3.0\etc\hadoop\core-site.xml,内容如下所示。

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><!-- 指定Hadoop集群的默认文件系统名称 --><property><name>fs.defaultFS</name><value>hdfs://127.0.0.1:9000</value></property>
</configuration>

2.3 修改 hdfs-site.xml 配置文件

修改hdfs的配置文件D:\development\hadoop-3.3.0\etc\hadoop\hdfs-site.xml,内容如下所示。

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.secondary.http-address</name><value>127.0.0.1:9868</value></property><property>    <name>dfs.namenode.name.dir</name>    <value>/D:/development/hadoop-3.3.0/data/namenode</value>    </property>    <property>    <name>dfs.datanode.data.dir</name>    <value>/D:/development/hadoop-3.3.0/data/datanode</value>  </property>
</configuration>

3.4 修改 mapred-site.xml 配置文件

修改mapreduce的配置文件D:\development\hadoop-3.3.0\etc\hadoop\mapred-site.xml,内容如下所示。

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>

3.5 修改 yarn-site.xml 配置文件

修改yarn的配置文件D:\development\hadoop-3.3.0\etc\hadoop\yarn-site.xml,内容如下所示。

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value></property><property><name>yarn.nodemanager.resource.memory-mb</name><value>1024</value></property><property><name>yarn.nodemanager.resource.cpu-vcores</name><value>1</value></property></configuration>

3. 格式化HDFS(Hadoop分布式文件系统)

执行如下命令格式化Hadoop分布式文件系统HDFS。

hdfs namenode -format

格式化成功如下图所示,会提示我们存储目录 D:\development\hadoop-3.3.0\data\namenode 已经成功格式化

在这里插入图片描述

4. 复制timelineservice目录

D:\development\hadoop-3.3.0\share\hadoop\yarn\timelineservice目录下的jar包复制到上级目录,如下图所示。

在这里插入图片描述

5. Hadoop启动和停止

5.1 启动 Hadoop

在cmd中执行如下命令启动Hadoop。

start-all.cmd

在这里插入图片描述

访问 HDFS(NameNode)的 Web UI 页面
在启动hadoop集群后,在浏览器输入http://127.0.0.1:9870进行访问,如下图。
在这里插入图片描述

检查DataNode是否正常,正常如下图所示。
在这里插入图片描述

访问 YARN 的 Web UI 页面
在启动hadoop集群后,在浏览器输入http://127.0.0.1:8088进行访问,如下图。
在这里插入图片描述

5.2 停止 hadoop 集群

在cmd中执行如下命令启动Hadoop。

stop-all.cmd

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/78131.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

搜广推校招面经八十一

OPPO搜广推一面面经 一、介绍一下PLE模型 在多任务学习&#xff08;Multi-Task Learning, MTL&#xff09;中&#xff0c;多个任务共享部分模型结构&#xff0c;以提升整体效果。然而&#xff0c;不同任务间存在 任务冲突&#xff08;Task Conflict&#xff09; 问题&#xf…

LangChain 中主流的 RAG 实现方式

文章目录 **一、基础流程实现**1. **全自动索引构建&#xff08;VectorstoreIndexCreator&#xff09;**2. **标准问答链&#xff08;RetrievalQA&#xff09;**3. **Document Chain 手动检索**4. **load_qa_chain&#xff08;传统方式&#xff09;** **二、高级定制化实现**1…

解决:springmvc工程 响应时,将实体类对象 转换成json格式数据

问题&#xff1a;一直无法将user对象转成json格式 按理来说&#xff0c;我在类上使用RestController注解&#xff0c;就可以实现将实体类对象写入响应体中&#xff0c;并作为json格式传递到客户端&#xff0c;但现实是没有生效&#xff0c;并且出现404&#xff0c;406&#xf…

【踩坑记录】stm32 jlink程序烧录不进去

最近通过Jlink给STM32烧写程序时一直报错&#xff0c;但是换一个其他工程就可以烧录&#xff0c;对比了一下jink配置&#xff0c;发现是速率选太高了“SW Device”&#xff0c;将烧录速率调整到10MHz以下就可以了

运维打铁:Mysql 分区监控以及管理

文章目录 一、简介二、设计逻辑1、配置文件检查2、创建逻辑3、 删除逻辑4、重建表分区逻辑5、recognize maxvalue分区表逻辑6、创建多个未来分区逻辑7、定时检测分区是否创建成功&#xff0c;否则发送告警邮件。 三、解决的问题四、配置例子与介绍 一、简介 操作数据库&#xf…

Appium自动化开发环境搭建

自动化 文章目录 自动化前言 前言 Appium是一款开源工具&#xff0c;用于自动化iOS、Android和Windows桌面平台上的本地、移动web和混合应用程序。原生应用是指那些使用iOS、Android或Windows sdk编写的应用。移动网页应用是通过移动浏览器访问的网页应用(appum支持iOS和Chrom…

《R语言SCI期刊论文绘图专题计划》大纲

今天开始&#xff0c;我将和大家分享系统且详细的《R语言SCI期刊绘图专题教程》&#xff0c;内容会从基础到高阶应用&#xff0c;从配色美学到顶刊风格复现&#xff0c;确保大家可以学到高质量内容&#xff01;下面是大纲。 &#x1f4da;《R语言SCI期刊论文绘图专题计划》 第…

STUN协议 与 TURN协议

STUN&#xff08;Session Traversal Utilities for NAT&#xff0c;NAT会话穿越应用程序&#xff09;是一种网络协议&#xff0c; STUN&#xff08;Simple Traversal of User Datagram Protocol through Network Address Translators (NATs)&#xff0c;NAT的UDP简单穿越&#…

在vscode终端中运行npm命令报错

解决方案 这个错误信息表明&#xff0c;你的系统&#xff08;可能是 Windows&#xff09;阻止了 PowerShell 执行脚本&#xff0c;这是由于 PowerShell 的执行策略导致的。PowerShell 的执行策略控制着在系统上运行哪些 PowerShell 脚本。默认情况下&#xff0c;Windows 可能…

手搓雷达图(MATLAB)

看下别人做出来什么效果 话不多说&#xff0c;咱们直接开始 %% 可修改 labels {用户等级, 发帖数, 发帖频率, 点度中心度, 中介中心度, 帖子类型计分, 被列为提案数}; cluster_centers [0.8, 4.5, 3.2, 4.0, 3.8, 4.5, 4.2; % 核心用户0.2, 0.5, 0.3, 0.2, 0.1, 0.0, 0.0;…

ViViT: 一种视频视觉Transformer

摘要 我们提出了基于纯transformer的视频分类模型,借鉴了这种模型在图像分类中的成功经验。我们的模型从输入视频中提取时空token,然后通过一系列transformer层进行编码。为了处理视频中遇到的长序列token,我们提出了几种高效的模型变种,这些变种将输入的空间和时间维度进…

嵌入式鸿蒙系统环境搭建与配置要求实现01

各位开发者大家好,今天主要给大家分享一下,鸿蒙系统的环境配置实现。 第一:鸿蒙配置基本要求 对电脑的要求,虚拟机配置建议 200GB 硬盘大小,10GB 内存,4*2CPU。 安装必要的依赖文件方法: sudo apt-get update && sudo apt-get install binutils git git-lfs g…

【多目标进化算法】常见多目标进化算法一览

算法全称核心特点备注NSGA-IINon-dominated Sorting Genetic Algorithm II非支配排序 拥挤度最经典&#xff0c;应用最广NSGA-IIINon-dominated Sorting Genetic Algorithm III支撑向量引导&#xff0c;适合高维&#xff08;3目标以上&#xff09;NSGA-II 的高维扩展版MOEA/DM…

创意无限,从这些视频素材开始你的创作!

在视频创作的世界里&#xff0c;找到合适的素材就像是挖掘宝藏&#xff0c;不仅能节省时间&#xff0c;还能让作品瞬间提升一个档次。今天&#xff0c;就来给大家分享一些超实用的视频素材网站&#xff0c;无论是国内的宝藏平台&#xff0c;还是国外的优质资源&#xff0c;都能…

QT创建新项目(13)

文章目录 一、本章说明二、QT组件简介及相关笔记三、项目创建四、QT学习建议一、本章说明 注:本节为【基于STM的环境监测系统(节点+云服务器存储+QT界面设计)】项目第13篇文章,前面已安装了QT软件,本章主要介绍新项目创建及注意事项,QT的初学者相关学习资料 二、QT组件…

Langgraph实战-Agent-ReAct(Reason+Act)概述

Langgraph实战-Agent-ReAct&#xff08;ReasonAct&#xff09;概述 概述 ReAct 架构将推理与动作相结合&#xff0c;使Agent能够通过生成想法并基于这些想法执行动作。这种决策透明度使Agent能够更负责地执行任务&#xff0c;因为它会记录每一步的推理过程。 这种架构最适合…

论文笔记(七十九)STOMP: Stochastic Trajectory Optimization for Motion Planning

STOMP: Stochastic Trajectory Optimization for Motion Planning 文章概括摘要一、引言二、相关工作三、STOMP 算法A. 探索B. 轨迹更新 四、机械臂的运动规划A. 设置B. 代价函数1&#xff09;障碍物代价&#xff1a;2&#xff09;约束代价&#xff1a;3&#xff09;扭矩代价&a…

MCU开发学习记录9 - 通用定时器学习与实践(HAL库) -RGBLED控制、定时器输入捕获、主从定时器移相控制-STM32CubeMX

本文将介绍通用定时器的概念、相关函数以及STM32CubeMX生成定时器的配置函数以及对生成定时器的配置函数进行分析&#xff08;包括结构体配置、相关寄存器配置&#xff09;。 本文以TIM2/TIM5、TIM3/TIM4为基础介绍通用定时器&#xff08;包含通用定时器全部功能&#…

Java学习手册:TCP 协议基础

一、TCP 协议概述 TCP&#xff08;Transmission Control Protocol&#xff0c;传输控制协议&#xff09;是一种面向连接的、可靠的、基于字节流的传输层通信协议&#xff0c;它在 IP 协议的基础上提供了可靠的 数据传输服务。TCP 通过三次握手建立连接&#xff0c;通过四次挥手…

删除排序数组中的重复项--LeetCode

题目 给你一个非严格递增排列的数组 nums &#xff0c;请你原地删除重复出现的元素&#xff0c;使每个元素 只出现一次 &#xff0c;返回删除后数组的新长度。元素的 相对顺序 应该保持 一致 。然后返回 nums 中唯一元素的个数。 考虑 nums 的唯一元素的数量为 k &#xff0c…