hadoop单机配置(非分布式)

1.1 环境
使用deepin系统、Hadoop3.1.3和Java环境jdk-8u162-linux-x64.tar.gz。
https://pan.baidu.com/s/1K1U1dypbgJeFvjHIGPcMqQ
提取码: 2vsi

1.2 准备

1.创建用户hadoop,按ctrl+alt+t打开终端,输入如下命令,并使用/bin/bash作为shell。

$ sudo useradd -m hadoop -s /bin/bash

2.设置用户密码。

$ sudo passwd hadoop

3.为用户增加管理员权限。

$ sudo adduser hadoop sudo

创建完用户后,切换到hadoop用户。

4.更新apt,需要使用apt安转软件。

$ sudo apt-get update

5.安装vim,便于后面使用

$ sudo apt-get install vim

1.3 安装SSH、配置SSH无密码登录

1.集群、单节点模式都需要要用到SSH登录。

$ sudo apt-get install openssh-server

2.安装后,可以使用如下命令有密码(yes)登录

$ ssh localhost

3.配置无密码登录,后可以使用上述命令无密登录。

$ exit                                   # 退出刚才的 ssh localhost
$ cd ~/.ssh/                             # 若没有该目录,请先执行一次ssh localhost
$ ssh-keygen -t rsa                      # 会有提示,都按回车就可以
$ cat ./id_rsa.pub >> ./authorized_keys  # 加入授权

1.4 安转Java环境

1.登录到hadoop用户,创建安装环境的文件夹

$ cd /usr/lib
$ sudo mkdir jvm

2.通过cd命令进入Hadoop3.1.3和Java环境jdk-8u162-linux-x64.tar.gz所在文件夹Personal File(根据每个人的实际位置)。解压Java环境

$ sudo tar -zxvf ./jdk-8u162-linux-x64.tar.gz -C /usr/lib/jvm  #把JDK文件解压到/usr/lib/jvm目录下

3.可以看到/usr/lib/jvm下具有一个jdk1.8.0_162目录。下面通过vim进行环境配置。

$ cd ~
$ vim ~/.bashrc

4.按i键,进入vim的输入模式,在文件开头添加如下语句。

export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

5.按Esc,然后输入:wq 保存退出。通过如下命令让配置生效。

$ source ~/.bashrc

6.查看是否安转成功。

$ java -version

在这里插入图片描述
出现如上信息表示安装成功。

1.5 安装hadoop

1.通过cd命令进入hadoop3.1.3的所在目录文件夹Personal File(根据每个人的实际位置)。

$ sudo tar -zxf ./hadoop-3.1.3.tar.gz -C /usr/local #解压到/usr/local中

2.进入安装目录更改文件夹名称为hadoop。

$ cd /usr/local/
$ sudo mv ./hadoop-3.1.3/ ./hadoop
$ sudo chown -R hadoop ./hadoop  #修改文件权限

3.检查hadoop安装是否可用,显示hadoop版本信息则可用。

$ cd /usr/local/hadoop
./bin/hadoop version

在这里插入图片描述

1.6 Hadoop单机配置(非分布式)
1.hadoop默认模式为分布式模式,可以直接运行如下命令,可以看到Hadoop自带的例子,包括wordcount、terasort、join、grep 等。

$ ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar 

2.我们运行grep例子,将input文件中的所有文件作为输入,筛选符合表达式dfs[a-z.]+的单词并统计出现的次数,输出到output文件夹。

$ cd /usr/local/hadoop
$ mkdir ./input
$ cp ./etc/hadoop/*.xml ./input   # 将配置文件作为输入文件
$ ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep ./input ./output 'dfs[a-z.]+'
$ cat ./output/*                  # 查看运行结果

在这里插入图片描述
3.下次运行需要删除./output文件,Hadoop不会默认覆盖结果文件。

$ rm -r ./output

源文档
http://dblab.xmu.edu.cn/blog/2441-2/#more-2441

常识和常用技能:
1.终端复制粘贴快捷键:ctrl+shift+V
2.在linux中,~代表的使用户主文件夹,即“/home/用户名”这个目录
3. 相对路径和绝对路径:相对路径:./bin/… 、./etc/… ,包含./的路径为相对路径,它会将当前路径替换./组合成完整的路径( 绝对路径)来执行。因此需要时刻注意自己的路径是否正确。
4.linux的主目录如下:home下包含所有的用户,每个用户有自己的所属文件。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484218.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AlphaFold2爆火背后,人类为什么要死磕蛋白质?

来源: 脑极体近期在生命科学领域,有一则爆炸性的新闻,DeepMind 的Al phaFold2模型,将人类的98.5%的蛋白质,全部预测了一遍,并且做成了数据集免费开源,供科研圈的人使用。开放的数据集不仅包括人…

hadoop伪分布式配置

1.1 准备 通过gedit编辑器修改比较方便&#xff0c;因此需先安装gedit。 sudo apt-get install gedit1.2 修改配置文件core-site.xml和hdfs-site.xml(如下注释部分需要删除) gedit打开core-site.xml $ gedit ./etc/hadoop/core-site.xml<configuration>#在该语句对中添…

实现AGI,强化学习就够了?Sutton、Silver师徒联手:奖励机制足够实现各种目标...

来源&#xff1a;机器学习研究组订阅通用人工智能&#xff0c;用强化学习的奖励机制就能实现吗&#xff1f;几十年来&#xff0c;在人工智能领域&#xff0c;计算机科学家设计并开发了各种复杂的机制和技术&#xff0c;以复现视觉、语言、推理、运动技能等智能能力。尽管这些努…

这可能是十年来最酷的神经科学发现

© Designer Shit Documentary来源&#xff1a;Diego Salinas翻译&#xff1a;Rachel校对&#xff1a;Yord原文&#xff1a;medium.com/artificial-intelligence-and-cognition/what-makes-emotions-feel-good-or-bad-9bdcd0a81afc过去的十年是神经科学史上极不平凡的十年&…

计算机网络(二十一)-数据链路层设备

1.1 物理层扩展以太网 扩展添加了主干集线器&#xff0c;信道的冲突概率增大&#xff0c;冲突域增加&#xff0c;效率降低。 1.2 链路层扩展以太网 可以通过网桥和交换机来实现。 网桥&#xff1a;根据MAC帧的目的地址对帧进行转发和过滤。当网桥接收到一个帧时&#xff0…

计算机网络(十八)-以太网

一.概述 1.1 以太网指的是由Xerox公司创建并由Xerox、Intel和DEC公司联合开发的基带总线局域网规范&#xff0c;是当今现有局域网采用的最通用的通信协议标准。以太网络使用CSMA/CD技术。 1.2 以太网在局域网各种技术中占统治性地位。 造价低;是应用最广泛的局域网技术。比令…

Cell颠覆性发现:中脑神经元的新作用

来源&#xff1a;生物通除了颠覆长期以来关于中脑运动区域作用的观点&#xff0c;这项研究还可能缓解对药物无效的帕金森病患者的姿势和步态问题具有启示意义。中脑运动区是中脑的一部分&#xff0c;参与调节许多动物的行走和其他形式的运动。但是大脑这一区域神经元的功能仍然…

计算机网络(十九)-IEEE802.11无线局域网

IEEE802.11是无线局域网的通用的标准&#xff0c;它是由IEEE所定义的无线网络通信的标准。 802.11的MAC帧头格式 3.无线局域网分类 有固定基础设施无线局域网 wifi名称其实就是服务集标识符。无固定基础设施无线局域网的自组织网络

谷歌用量子计算机造出「时间晶体」,挑战热力学第二定律

来源&#xff1a;新智元近日&#xff0c;谷歌联合几十位物理学家&#xff0c;用量子计算机造出了「时间晶体」。你能想象得到&#xff0c;有这样一个物体&#xff0c;竟然跳出了经典的热力学第二定律&#xff1f;没错&#xff0c;这就是「时间晶体」。然而&#xff0c;时间晶体…

7、JPA-映射-双向一对多

一个用户对应多个订单&#xff0c;多个订单对应一个用户&#xff0c;不管查哪一边都可以得到另一边的信息 实体类 Customer package com.jpa.yingshe;import javax.persistence.*; import java.util.HashSet; import java.util.Set;Table(name "JPA_CUTOMERS") Enti…

计算机网络(二十)-广域网-PPP协议和HDLC协议

一.广域网 广域网&#xff0c;通常跨接很大的物理范围&#xff0c;所覆盖的范围从几十公里到几千公里&#xff0c;它能连接多个城市或国家&#xff0c;远距离通信&#xff0c;形成国际性的远程网络。 广域网的通信子网主要使用分组交换技术。广域网的通信子网可以利用分组交换…

导弹防御系统,如何跟蜻蜓的大脑学习计算?

来源&#xff1a;大数据文摘作者&#xff1a;Frances Chance多雨的夏季&#xff0c;蜻蜓最为常见&#xff0c;这些美丽的生物的飞行速度极快&#xff0c;狩猎能力也极为出色&#xff1a;蜻蜓狩猎的成功率捕获了高达95% &#xff0c;它们一天可以吃掉数百只蚊子。这种狩猎能力吸…

分布式文件系统HDFS

1.HDFS简介 1.1 Hadoop Distributed File System&#xff0c;简称HDFS。解决海量数据的分布式存储。 1.2 分布式文件系统 计算机集群中内部机器通过光纤高速交换机进行连接&#xff0c;机架之间通过宽带更高的光纤交换机连接。 有一个主节点机器其他的为从节点机器&#xff…

小程序开发初体验,从静态demo到接入Bmob数据库完全实现

之前我胖汾公司年会、问我能不能帮忙搞个小程序方便他们进行游戏后的惩罚/抽奖使用、出了个简单的设计图、大概三天左右做了个简单的小程序、目前提交审核了。对于写过一小段时间vue来说小程序很容易上手、写法和结构差不多。 ----------------- 这里整理的内容大致划分四个部分…

演讲实录丨徐宗本院士:如何突破机器学习的先验假设?

来源&#xff1a;中国人工智能学会2021年6月5日至6日&#xff0c;由中国科学技术协会、中国科学院、中国工程院、浙江省人民政府指导&#xff0c;中国人工智能学会、杭州市人民政府主办&#xff0c;杭州市余杭区人民政府筹备组承办&#xff0c;浙江杭州未来科技城管理委员会具体…

hbase单机模式配置

1.软件 https://pan.baidu.com/s/1mgPA8s02FFyPqcc9DmR-FA 提取码: 337t 2.在安装hbase之前&#xff0c;确保你的电脑已经安装Hadoop3.1.3&#xff0c;hbase对Hadoop具有版本依赖。 3.将hbase压缩文件解压到/usr/local目录下&#xff0c;先切换到压缩文件所在目录&#xff0…

QT QTransform与QMatrix 有啥区别?

刚开始学习QT&#xff0c;我使用的是QT5.12进行开发&#xff0c;要不时地查阅QT的官方帮助文档~ 仔细阅读QT官方帮助QTransform类以及QMatrix类&#xff0c;发现两个类的作用描述一模一样&#xff08;“The QTransform class specifies 2D transformations of a coordinate sys…

hbase伪分布式配置

1.在单机模式的基础上进行配置&#xff0c;打开hbase-env.sh。 vim /usr/local/hbase/conf/hbase-env.sh2.配置HBASE_CLASSPATH为hadoop安装目录下的conf目录&#xff0c;即 /usr/local/hadoop/conf。JAVA_HOME、HBASE_MANAGES_ZK之前已经配置好了。 export HBASE_CLASSPATH/…

机器学习是科学还是“炼金术”?

作者:Samuel Flender译者:王强策划: 刘燕在实证领域&#xff0c;科学的严谨性是从假设开始塑造的。业界对机器学习研究的科学严谨性的质疑声越来越多了。在 2017 年 NIPS 会议上的一场 演讲 中&#xff0c;当时就职于谷歌 AI 的 Ali Rahimi 和 Ben Recht 认为 ML 已经成为了一种…

谷歌发布史上最强人类大脑「地图」,在线可视3D神经元「森林」!

来源&#xff1a;机器学习研究组订阅突触&#xff0c;是神经网络的「桥梁」。我们知道&#xff0c;人类大脑有860亿个神经元&#xff0c;因为有了突触&#xff0c;才可以把神经元上的电信号传递到下一个神经元。长久以来&#xff0c;科学家们一直梦想通过绘制完整的大脑神经网络…