物联网架构之 Hadoop

修改/etc/hosts文件
192.168.107.197 node1
192.168.107.196 node2
192.168.107.195 node3

创建用户并加入组
groupadd hadoop
useradd -g hadoop hduser
passwd hduser
vim /etc/sudoers
hduser ALL=(ALL) ALL

安装JDK
rpm -ivh jdk-8u171-linux-x64.rpm

vim /etc/profile
export JAVA_HOME=/usr/java/jdk1.8.0_171-amd64
export CLASSPATH= J A V A H O M E / l i b : JAVA_HOME/lib: JAVAHOME/lib:CLASSPATH
export PATH= J A V A H O M E / b i n : JAVA_HOME/bin: JAVAHOME/bin:PATH

source /etc/profile

java -version

配置本机SSH免密码登录
ssh-keygen -t rsa
ssh-copy-id node1
ssh-copy-id node2
ssh-copy-id node3

hadoop完全分布式安装

cd /home/hduser
tar zxf hadoop-2.6.5.tar.gz
mv hadoop-2.6.5 hadoop

hadoop的环境变量
vim /etc/profile
#hadoop
export HADOOP_HOME=/home/hduser/hadoop
export PATH= H A D O O P H O M E / b i n : HADOOP_HOME/bin: HADOOPHOME/bin:PATH
source /etc/profile

配置Hadoop:
vim /home/hduser/hadoop/etc/hadoop/hadoop-env.sh
export JAVA_HOME=/usr/java/jdk1.8.0_171-amd64

vim /home/hduser/hadoop/etc/hadoop/yarn-env.sh
export JAVA_HOME=/usr/java/jdk1.8.0_171-amd64

vim /home/hduser/hadoop/etc/hadoop/slaves
node2
node3

vim /home/hduser/hadoop/etc/hadoop/core-site.xml


fs.defaultFS
hdfs://node1:9000


hadoop.tmp.dir
file:/home/hduser/hadoop/tmp

vim /home/hduser/hadoop/etc/hadoop/hdfs-site.xml


dfs.namenode.secondary.http-address
node1:50090


dfs.namenode.name.dir
file:/home/hduser/hadoop/dfs/name


dfs.datanode.data.dir
file:/home/hduser/hadoop/dfs/data


dfs.replication
2


dfs.webhdfs.enabled
true

vim /home/hduser/hadoop/etc/hadoop/mapred-site.xml


mapreduce.framework.name
yarn


mapreduce.jobhistory.address
node1:10020


mapreduce.jobhistory.webapp.address
node1:19888

vim /home/hduser/hadoop/etc/hadoop/yarn-site.xml


yarn.nodemanager.aux-services
mapreduce_shuffle


yarn.nodemanager.aux-services.mapreduce.shuffle.class
org.apache.hadoop.mapred.ShuffleHandler


yarn.resourcemanager.address
node1:8032


yarn.resourcemanager.scheduler.address
node1:8030


yarn.resourcemanager.resource-tracker.address
node1:8035


yarn.resourcemanager.admin.address
node1:8033


yarn.resourcemanager.webapp.address
node1:8088

scp -r /home/hduser/hadoop node2:/home/hduser
scp -r /home/hduser/hadoop node3:/home/hduser

验证安装配置:
cd /home/hduser/hadoop
bin/hdfs namenode -format
sbin/start-dfs.sh

jps

sbin/start-yarn.sh

sbin/start-all.sh

bin/hdfs dfsadmin -report
http://192.168.107.197:50070
sbin/stop-all.sh

mkdir file
cd file
echo “Hello World hi HADOOP” > file1.txt
echo “Hello hadoop hi CHINA” > file2.txt
sbin/start-all
bin/hadoop fs -mkdir /input2
bin/hadoop fs -put file* /input2
bin/hadoop fs -ls /input2
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar wordcount /input2/ /output2/wordcount1
bin/hadoop fs -cat /output2/wordcount1/*

HDFS的相关命令:
hdfs fsck / -files -blocks
sbin/start-balancer.sh
hadoop fs -mkdir /user
hadoop fs -mkdir /user/hadoop/dir1 /user/hadoop/dir2
hadoop fs -ls /input2/file1.txt
hadoop fs -ls /input2/
hadoop fs -cat /input2/file1.txt /input2/file2.txt
文件转移
hadoop fs -put /home/hduser/file/file1.txt /input2
hadoop fs -put /home/hduser/file/file1.txt /home/hduser/file/file2.txt /input2
hadoop fs -get /input2/file1.txt $HOME/file.txt
hadoop fs -mv /input2/file1.txt /input2/file2.txt /user/hadoop/dir1
hadoop fs -cp /input2/file1.txt /input2/file2.txt /user/hadoop/dir1
hadoop fs -cp file:///file1.txt file:///file2.txt file:///tmp
hadoop fs -rm /input2/file3.txt
hadoop fs -rmr /input2#现在推荐使用 hadoop fs -rm -r /input2 命令
hadoop fs -test -e /input2/file3.txt
hadoop fs -test -z /input2/file1.txt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/219882.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Hadoop学习总结(Hive的安装)

Hive的安装模式分为3种,分别是嵌入模式、本地模式、远程模式。 (1)嵌入模式:使用内嵌的 Derby 数据库存储元数据,这种方式是 Hive 的默认安装方式,配置简单,但是一次只能连接一个客户端&#xf…

MATLAB算法实战应用案例精讲-【图像处理】图像特征提取(附MATLAB代码实现)

目录 前言 知识储备 提取图像文本的Python 库 1. pytesseract 2. EasyOCR 3. Keras-OCR 4. TrOCR 5. docTR

模块一——双指针:18.四数之和

文章目录 题目描述算法原理排序双指针 代码实现排序双指针复杂度分析时间复杂度:O(N^3^)空间复杂度:O(log⁡N)或者O(N) 题目描述 题目链接:18.四数之和 算法原理 排序双指针 依次固定⼀个数a ;在这个数a 的后⾯区间上&#x…

C#实现支付宝转账功能

环境 .net 6 AlipaySDKNet.OpenAPI 2.4.0 申请证书 登录支付宝开放平台https://open.alipay.com/ 进入控制台 授权回调地址也设置一下,加密方式AES 新建.net 6空白的web项目 证书除了java都需要自己生成一下pkcs1的密钥 privatekey.txt就是根据应用私钥生成…

玩转大数据16:大数据存储与文件格式优化

随着大数据时代的到来,存储和处理海量数据成为了一个重要的挑战。在大数据存储中,选择合适的文件格式对数据的压缩率、读写性能和扩展性起着关键作用。本文将介绍大数据存储的挑战,探讨常见的文件格式,并深入讨论文件格式优化的策…

低代码开发:现实挑战与发展前景

低代码开发是近年来迅速崛起的软件开发方法,让编写应用程序变得更快、更简单。有人说它是美味的膳食,让开发过程高效而满足,但也有人质疑它是垃圾食品,缺乏定制性与深度。 一、什么是低代码 低代码开发是一种基于图形用户界面&…

小新Air-14 Plus 2021款AMD ACN版(82L7)原装出厂Win11系统镜像

LENOVO联想笔记本开箱状态原厂Windows11系统包 链接:https://pan.baidu.com/s/1D_sYCJAtOeUu9RbTIXgI3A?pwd96af 提取码:96af 联想小新AIR14笔记本电脑原厂系统自带所有驱动、出厂主题壁纸、Office办公软件、联想电脑管家等预装程序 所需要工具&am…

Mapreduce小试牛刀(1)

1.与hdfs一样,mapreduce基于hadoop框架,所以我们首先要启动hadoop服务器 --------------------------------------------------------------------------------------------------------------------------------- 2.修改hadoop-env.sh位置JAVA_HOME配…

MBR30300FCT-ASEMI高耐压肖特基MBR30300FCT

编辑:ll MBR30300FCT-ASEMI高耐压肖特基MBR30300FCT 型号:MBR30200FCT 品牌:ASEMI 封装:TO-220F 最大平均正向电流:30A 最大重复峰值反向电压:300V 产品引线数量:3 产品内部芯片个数&…

***Cpolar配置外网访问和Dashy

Dashy是一个开源的自托管的导航页配置服务,具有易于使用的可视化编辑器、状态检查、小工具和主题等功能。你可以将自己常用的一些网站聚合起来放在一起,形成自己的导航页。一款功能超强大,颜值爆表的可定制专属导航页工具 结合cpolar内网工具,我们实现无需部署到公网服务器…

android 13.0 Launcher3禁止拖动图标到Hotseat功能实现

1.概述 在13.0系统Launcher3进行定制化开发中,对于hotseat的开发中,由功能需求要求禁止拖动图标到Hotseat的功能,而拖拽也是在workspace.java中处理的 接下来就从workspace.java 开始找解决的办法 2.Launcher3禁止拖动图标到Hotseat相关代码分析 packages/apps/Launcher3/…

一文1000字基于Jenkins实现接口自动化持续集成!

一、JOB项目配置 1、添加描述 可选选项可填可不填 2、限制项目的运行节点 节点中要有运行环境所需的配置 节点配置教程:https://blog.csdn.net/YZL40514131/article/details/131504280 3、源码管理 需要将脚本推送到远程仓库中 4、构建触发器 可以选择定时构建…

ARM MMU简介

MMU内存保护场景 ARM MMU能够针对多种场景进行内存保护,包括以下几个常见的例子: 1. 操作系统级别的内存隔离 ARM MMU可以将不同的进程或线程的虚拟地址映射到不同的物理地址空间,实现进程间的内存隔离。这样可以确保一个进程无法访问或篡…

vite 打包图标icon ,content 内容乱码

问题描述:本地开发环境icon 显示正常,打包后发布线上环境icon乱码,而且具有偶发性,刷新页面乱码又正常了。 找问题:观察发现是content 内容没有编译成功导致乱码 解决:vite.config.ts / vite.config.js 文件…

计算机网络期末考试A卷及答案

一、选择题(30分,每题1分) 世界上第一个网络系统是( C )。 A、ENIAC B、以太网 C、ARPANET D、DECNET 2.在常用的传输介质中,( C )的带宽最宽、信号传输衰减最小、抗干扰能力最强。 A.双绞线 …

Facebook运营技巧详解,Facebook多店铺如何运营?

在前不久的文章中就讲过Facebook养号和广告的投放技巧,今天东哥就趁热打铁来接着讲讲Facebook的运营技巧,现在做外贸和跨境电商的人基本上都用过Facebook,像在流量这么庞大的平台上想要抓住更多机遇,懂得一些运营技巧是必不可少的…

数据可视化作用探析

数据可视化是一种将数据转化为图表、图形或其他视觉形式的过程,旨在更直观、更易于理解地展示数据信息。它不仅仅是对数据的简单呈现,更是一种利用视觉化手段帮助人们理解数据、发现模式、分析趋势和做出决策的强大工具。今天,我就从可视化从…

设计模式之开篇

在软件开发的世界里,设计模式有如一本精妙的工程艺术指导准则,为我们提供了解决常见问题的优雅实现方案。然而,有些程序员可能会认为设计模式太过繁琐,一个简单的 if/else 语句就能解决问题,何必费心去学习这些看似复杂…

input 获取焦点后样式的修改

一、实现目标 1.没有获取焦点时样子 2.获取焦点时 代码&#xff1a; <input class"input"placeholder"请输入关键字" input"loadNode" />css .input {border-radius: 14px;border:1px solid #e4e4e4;margin: 5px;margin-top: 10px;wi…

小程序开发实战案例四 | 小程序标题栏如何设置

上一期我们了解了 小程序底部导航栏 的实现效果&#xff0c;今天一起来了解下如何设置小程序标题栏&#xff5e; 基础标题栏 小程序标题栏主要包含返回、标题、收藏、菜单、收起 5 个模块&#xff0c;其中能够调整的部分只有标题和背景色。 另外 IDE上无法展示收藏按钮&#…