spark的安装与使用：一键自动安装

使用shell脚本一键下载、安装、配置spark（单机版）

1. 把下面的脚本复制保存为/tmp/install_spark.sh文件

#!/bin/bash# sprak安装版本
sprak_version="2.4.0"
# sprak安装目录
sprak_installDir="/opt/module"
# hadoop安装路径，修改为自己的
HADOOP_HOME=/opt/module/hadoop-3.1.3
# java安装路径，修改为自己的
JAVA_HOME=/opt/module/jdk1.8.0_381install_spark() {local version=$1local installDir=$2# 下载地址local downloadUrl="https://archive.apache.org/dist/spark/spark-$version/spark-$version-bin-hadoop2.7.tgz"# 检查安装目录是否存在，不存在则创建if [ ! -d "${installDir}" ]; thenecho "创建安装目录..."sudo mkdir -p "${installDir}"fiif test -f /tmp/spark-"$version"-bin-hadoop2.7.tgz; thenecho "/tmp/spark-$version-bin-hadoop2.7.tgz文件已存在"else# 下载并解压 sparkecho "开始下载spark..."wget "$downloadUrl" -P /tmpfiecho "开始解压spark..."tar -zxvf "/tmp/spark-$version-bin-hadoop2.7.tgz" -C "${installDir}"mv "${installDir}/spark-${version}-bin-hadoop2.7" "${installDir}/spark-${version}"if test -n "$(grep '#SPARK_HOME' ~/.bashrc)"; thenecho "SPARK_HOME已存在"else# 设置spark用户环境变量echo >> ~/.bashrcecho '#SPARK_HOME' >> ~/.bashrcecho "export SPARK_HOME=${installDir}/spark-${version}" >> ~/.bashrcecho 'export PATH=$PATH:$SPARK_HOME/bin' >> ~/.bashrcfi# 配置 sparkecho "配置spark运行环境"cp "${installDir}/spark-${version}/conf/spark-env.sh.template" "${installDir}/spark-${version}/conf/spark-env.sh"echo 'export SPARK_DIST_CLASSPATH=$('"$HADOOP_HOME"'/bin/hadoop classpath)' >> "${installDir}/spark-${version}/conf/spark-env.sh"echo "spark日志级别配置"cp "${installDir}/spark-${version}/conf/log4j.properties.template" "${installDir}/spark-${version}/conf/log4j.properties"sed -i "s|^log4j.rootCategory=.*|log4j.rootCategory=WARN, console|" "${installDir}/spark-${version}/conf/log4j.properties"echo "配置spark单机模式"echo "export SPARK_MASTER_HOST=$(hostname)    #设置主节点地址" >> "${installDir}/spark-${version}/conf/spark-env.sh"echo 'export SPARK_WORKER_MEMORY=1g           #设置节点内存大小' >> "${installDir}/spark-${version}/conf/spark-env.sh"echo 'export SPARK_WORKER_CORES=1             #设置节点参与计算的核心数' >> "${installDir}/spark-${version}/conf/spark-env.sh"echo 'export SPARK_WORKER_INSTANCES=1         #设置节点实例数' >> "${installDir}/spark-${version}/conf/spark-env.sh"echo "export JAVA_HOME=$JAVA_HOME" >> "${installDir}/spark-${version}/conf/spark-env.sh"echo "export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop" >> "${installDir}/spark-${version}/conf/spark-env.sh"echo "设置spark节点"echo "$(hostname)" > "${installDir}/spark-${version}/conf/slaves"echo "删除spark安装包"rm -rf /tmp/spark-"$version"-bin-hadoop2.7.tgzecho "spark 安装完成！"
}install_spark "$sprak_version" "$sprak_installDir"

2. 增加执行权限

chmod a+x /tmp/install_spark.sh

3. 执行/tmp/install_spark.sh

/tmp/install_spark.sh

执行之后等待下载、安装、配置完成，如下图：
在这里插入图片描述

4. 加载环境变量

source ~/.bashrc

进入spark交互界面

spark-shell

如下图：
在这里插入图片描述

5. 启动/停止spark

启动spark

/opt/module/spark-2.4.0/sbin/start-all.sh

查看是否启动成功

jps | awk '$NF == "Master" || $NF == "Worker" { print $NF }'

启动成功如下图：
在这里插入图片描述

浏览器访问sparkUI界面：http://192.168.145.103:8080/
如下图：
在这里插入图片描述
停止spark

/opt/module/spark-2.4.0/sbin/stop-all.sh

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/191957.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

spark的安装与使用：一键自动安装

使用shell脚本一键下载、安装、配置spark（单机版）

1. 把下面的脚本复制保存为/tmp/install_spark.sh文件

2. 增加执行权限

3. 执行/tmp/install_spark.sh

4. 加载环境变量

5. 启动/停止spark

相关文章

测试类运行失败：TestEngine with ID ‘junit-jupiter‘ failed to discover tests

org.springframework.security.crypto.bcrypt.BCryptPasswordEncoder 实现密码加密验证代码示例

索引器【C#】

idea 插件开发日志绑定问题

【QT5】QT5安装

【数组和函数实战: 斗地主游戏】

Java数据结构之《希尔排序》题目

CGAL的四叉树、八叉树、正交树

前端打包添加前缀

vue面试题整理（1.0）

Kali 修改IP地址和DNS 开启SSH和远程桌面

爬虫-xpath篇

TLS协议握手流程

常用数据预处理方法 python

Linux CentOS搭建NGINX环境

【网络协议】聊聊网络ReadTimeout和ConnectTimeout

目标检测YOLO系列从入门到精通技术详解100篇-【目标检测】缺陷检测

vue项目node-sass^4.14.1 python gyp 报错解决办法

LabVIEW在不同操作系统上使VI、可执行文件或安装程序

elk:filebeat也是一个日志收集工具