零障碍入门：SSH免密登录与Hadoop生态系统的完美搭档【实训Day02】

一、 SSH免密登录配置

1 生成公钥和秘钥(在hadoop101上)

# su star 
# cd /home/star/.ssh
# ssh-keygen -t rsa

2 公钥和私钥

公钥id_rsa.pub
私钥id_rsa

3 将公钥拷贝到目标机器上(在hadoop101上)

# ssh-copy-id hadoop101
# ssh-copy-id hadoop102
# ssh-copy-id hadoop103

4 生成后将公钥拷贝到目标机器上(在hadoop102上)

# ssh-keygen -t rsa
# ssh-copy-id hadoop101
# ssh-copy-id hadoop102
# ssh-copy-id hadoop103

5 生成后将公钥拷贝到目标机器上(在hadoop103上)

# ssh-keygen -t rsa
# ssh-copy-id hadoop101
# ssh-copy-id hadoop102
# ssh-copy-id hadoop103

6 生成后将公钥拷贝到目标机器上(在hadoop101上)

生成root用户的公钥和私钥

# su root
# ssh-keygen -t rsa
# ssh-copy-id hadoop101
# ssh-copy-id hadoop102
# ssh-copy-id hadoop103

7 测试免密登录(在hadoop101上)

# su star
# ssh hadoop102
# ssh hadoop103
# ssh hadoop101

8 .ssh文件夹下的文件解释

==========================
           authorized_keys 存放授权过的免密登录的服务器公钥
           id_rsa 生成的私钥
           id_rsa.pub 生成的公钥
           known_hosts 记录ssh访问过的计算机的公钥
           ====================================

二、Hadoop集群配置

1 配置core-site.xml(在hadoop101上)

   # cd $HADOOP_HOME/ect/hadoop/
           # vim core-site.xml
           ==========配置内容如下=================

<!--1.指定 NameNode 的地址--><property><name>fs.defaultFS</name><value>hdfs://hadoop101:9820</value></property><!--2.指定 hadoop 数据的存储目录--><property><name>hadoop.tmp.dir</name><value>/opt/module/hadoop-3.1.3/data</value></property><!--3.配置 HDFS 网页登录使用静态用户为 star--><property><name>hadoop.http.staticuser.user</name><value>star</value></property><!--4.配置 star(superUser)允许通过代理访问的主机节点--><property><name>hadoop.proxyuser.star.hosts</name><value>*</value></property><!--5.配置 star(superGroup)允许通过代理用户所属组--><property><name>hadoop.proxyuser.star.groups</name><value>*</value></property><!--6.配置 star(superUser)允许通过代理的用户--><property><name>hadoop.proxyuser.star.groups</name><value>*</value></property>

==================================================

2 配置yarn-site.xml(在hadoop101上)

           # cd $HADOOP_HOME/ect/hadoop/
           # vim yarn-site.xml
           =========配置内容如下=============

<!--1.指定 MR 走 shuffle 机制--><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><!--2.指定 ResourceManager 的地址--><property><name>yarn.resourcemanager.hostname</name><value>hadoop102</value></property><!--3.环境变量的继承--><property><name>yarn.nodemanager.env-whitelist</name><value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value></property><!--4.yarn 容器允许分配的最大最小内存--><property><name>yarn.scheduler.minimum-allocation-mb</name><value>512</value></property><property><name>yarn.scheduler.maximum-allocation-mb</name><value>4096</value></property><!--5.yarn 容器允许管理的物理内存大小--><property><name>yarn.nodemanager.resource.memory-mb</name><value>4096</value></property><!--6.关闭 yarn 对物理内存和虚拟内存的限制检查--><property><name>yarn.nodemanager.pmem-check-enabled</name><value>false</value></property><property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value></property>

====================================================

3 配置hfds-site.xml(在hadoop101上)

           # cd $HADOOP_HOME/ect/hadoop/
           # vim hdfs-site.xml
           ===========配置内容如下==========

 <!--1.NameNode nn web 端访问地址--><property><name>dfs.namenode.http-address</name><value>hadoop101:9870</value></property><!--2.SecondaryNameNode 2nn web 端访问地址--><property><name>dfs.namenode.secondary.http-address</name><value>hadoop103:9868</value></property><!--3.设置 HDFS 不启动权限检查--><property><name>dfs.permissions</name><value>false</value></property>

==========================================

4 配置mapred-site.xml(在hadoop101上)

           # cd $HADOOP_HOME/ect/hadoop/
           # vim mapred-site.xml
           ==========配置内容如下=========

<!--1.指定 Mapreduce 程序运行在 Yarn 之上--><property><name>mapreduce.framework.name</name><value>yarn</value></property>

=============================

5 将集群文件进行分发(在hadoop101上)

# xsync.sh /opt/module/

6 查看分发配置文件的情况

           在hadoop102上
           # cd /opt/module/hadoop-3.1.3/etc/hadoop
           # cat core-site.xml

           在hadoop103上
           # cd /opt/module/hadoop-3.1.3/etc/hadoop
           # cat core-site.xml

三、 Hadoop集群部署

1 配置works(在hadoop101上)

           # cd /opt/module/hadoop-3.1.3/ect/hadoop/
           # vim workers
           =========配置内容如下(删除原先内容)====
           hadoop101
           hadoop102
           hadoop103
           =====注意保存时不允许有空格以及空行====
           将该文件进行分发
           # xsync.sh /opt/module/hadoop-3.1.3/ect/hadoop/workers

2.Hadoop集群格式化（在hadoop101上)

# su star

#hdfs namenode -format

注意事项：

1.各种端口号是用.表示

2.各种配置文件tag写错了

3.若需要再次格式化则需要

先删除hadoop-3.1.3文件夹下的data和logs文件夹

4.必须使用star用户进行格式化

当格式化之后就会产生data 和 logs 文件

3 环境变量的分发及生效(在hadoop101上)

           # sudo xsync.sh /etc/profile.d/my_env.sh

           在hadoop102上
           # source /etc/profile.d/my_env.sh
           # java -version
           # hadoop version

           在hadoop103上
           # source /etc/profile.d/my_env.sh
           # java -version
           # hadoop version

4 Hadoop分布式集群启动(在hadoop101上)

           启动Hadoop集群
           # cd $HADOOP_HOME/sbin
           # start-dfs.sh
           # jps

5 Yarn的启动(在hadoop102上)

           启动Yarn
           # cd $HADOOP_HOME/sbin
           # start-yarn.sh
           # jps

6 WEB端查看HDFS(需先启动HDFS)

http://hadoop101:9870

7 WEB端查看YARN(需先启动YARN）

http://hadoop102:8088

四、MySQL安装

1 查看是否安装过

# rpm -qa | grep mariadb mariadb-libs-5.5.56-2.el7.x86_64
# sudo rpm -e ---nodeps

2 MySQL安装包上传(在hadoop101上)

       # cd /opt/software

       上传到该目录mysql-5.7.28-1.el7.x86_64.rpm-bundle.tar

3 解压缩第一层包(在hadoop101上)

# cd /opt/software
# tar -xf mysql-5.7.28-1.el7.x86_64.rpm-bundle.tar

4 安装MySQL文件(必须按照顺序安装在hadoop101上)

        # cd /opt/software# sudo rpm -ivh mysql-community-common-5.7.28-1.el7.x86_64.rpm# sudo rpm -ivh mysql-community-libs-5.7.28-1.el7.x86_64.rpm --force --nodeps# sudo rpm -ivh mysql-community-libs-compat-5.7.28-1.el7.x86_64.rpm --force --nodeps# sudo rpm -ivh mysql-community-client-5.7.28-1.el7.x86_64.rpm# sudo yum install -y libaio# sudo rpm -ivh mysql-community-server-5.7.28-1.el7.x86_64.rpm --force --nodeps

5 删除配置文件(在hadoop101上)

       查看mysql所安装的目录(查看datadir的目录结果)
       # vim /etc/my.cnf
       删除datadir指向的目录所有文件内容
       # cd /var/lib/mysql
       # sudo rm -rf ./*

6 初始化数据库(在hadoop101上)

# sudo mysqld --initialize --user=mysql

7 查看初始化密码(在hadoop101上 -localhost后面)

# sudo cat /var/log/mysqld.log

8 启动MySQL的服务(在hadoop101上)

# sudo systemctl start mysqld

9 登录MySQL数据库(在hadoop101上)

# mysql -u root -p
Enter password:输入mysqld.log中的密码

10 修改数据库密码

mysql>set password = password("123456");

11 修改数据库任意连接(在hadoop101上)

       mysql>update mysql.user set host='%' where
               user='root';
       mysql>flush privileges;
       mysql>quit;

12 测试mysql数据库(在hadoop101上)

       # mysql -u root -p
       Enter password:123456
       mysql>quit;

数据库删除操作

五、Hive安装

1 上传安装包(在hadoop101上)

# cd /opt/software
上传apache-hive-3.1.2-bin.tar.gz压缩包

2 解压缩安装包(在hadoop101上)

# cd /opt/software
# tar -zxvf apache-hive-3.1.2-bin.tar.gz -C /opt/module/

3 修改hive的文件夹名称(在hadoop101上)

# cd /opt/module/
# mv apache-hive-3.1.2-bin hive

4 添加hive的环境变量(在hadoop101上)

       # sudo vim /etc/profile.d/my_env.sh
       =======添加内容如下======
       #HIVE_HOME
       export HIVE_HOME=/opt/module/hive
       export PATH=$PATH:$HIVE_HOME/bin
       ===============================
       # soruce /etc/profile.d/my_env.sh
       # cd $HIVE_HOME

cd $HIVE_HOME/conf
vim hive-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration><!--1.jdbc连接的URL--><property><name>javax.jdo.option.ConnectionURL</name><value>jdbc:mysql://hadoop101:3306/hivedb?useSSL=false</value></property><!--2.jdbc连接的Driver--><property><name>javax.jdo.option.ConnectionDriverName</name><value>com.mysql.jdbc.Driver</value></property><!--3.jdbc连接username--><property><name>javax.jdo.option.ConnectionUserName</name><value>root</value></property><!--4.jdbc连接password--><property><name>javax.jdo.option.ConnectionPassword</name><value>123456</value></property><!--5.hive默认在HDFS的工作目录--><property><name>hive.metastore.warehouse.dir</name><value>/user/hive/warehouse</value></property><!--6.hive元数据存储的验证--><property><name>hive.metastore.schema.verification</name><value>false</value></property><!--7.元数据存储授权--><property><name>hive.metastore.event.db.notification.api.auth</name><value>false</value></property></configuration>

cd /opt/software/