Spark 集群搭建

文章目录

    • 搭建前准备
    • 安装搭建
      • 解压并重命名
      • 环境变量配置
      • 配置文件
        • yarn-site.xml
        • spark-env.sh
    • 官网求 π(PI) 案例
    • 启动spark-shell
    • 通过浏览器查看显示
      • 查看 Spark 的网页信息展示

搭建前准备

下载地址:Index of /dist/spark (apache.org)

配置好 hadoop 环境,hdfsyarn 服务正常可以启动

start-dfs.sh
start-yarn.sh

安装搭建

解压并重命名

Spark 压缩包解压,解压后重命名

tar -zxvf software/spark-3.5.0-bin-hadoop3.tgz -C /opt/
mv /opt/spark-3.5.0-bin-hadoop3 /opt/spark-3.5.0

环境变量配置

vim /etc/profile.d/spark.sh

配置内容:

# SPARK_HOME
export SPARK_HOME=/opt/spark-3.5.0
export PATH=$PATH:$SPARK_HOME/bin

刷新一下环境变量

source /etc/profile

配置文件

# 进入到 hadoop 配置目录下
cd $HADOOP_HOME/etc/hadoop/
# 对 yarn-site.xml 文件进行配置
vim yarn-site.xml
yarn-site.xml
	<!--是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉默认是true --><property><name>yarn.nodemanager.pmem-check-enabled</name><value>false</value></property><!--是否启动一个线程检查每个任务正使用的虚拟内存量,如果任务超出分配值,则直接将其杀掉,默认是true --><property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value></property>
image-20230512032510375
spark-env.sh
# 进入到 hadoop 配置目录下
cd $SPARK_HOME/conf
# 复制配置文件模板
cp spark-env.sh.template spark-env.sh
# 编辑配置文件 
vim spark-env.sh

配置内容:(添加到末尾处,也可也直接输入 O 在第二行添加)

YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop/

官网求 π(PI) 案例

启动 yarn

start-dfs.sh
start-yarn.sh

进入到 Spark 目录下

cd $SPARK_HOME

执行 sparkπ 案例

bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode client \
./examples/jars/spark-examples_2.12-3.5.0.jar 10

运行成功可以看到

Pi is roughly 3.1425711425711427

启动spark-shell

提示:启动后不要关闭

 # 进入到 spark 文件路径下bin/spark-shell

通过浏览器查看显示

查看 Spark 的网页信息展示

浏览器地址:hadoop102:4040 (为配置 IP 映射填 hadoop102 地址)

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/590036.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HttpClient入门

HttpClient入门 简介 HttpClient 是 Apache HttpComponents 项目中的一个开源的 Java HTTP 客户端库&#xff0c;用于发送 HTTP 请求和处理 HTTP 响应。它提供了一组强大而灵活的 API&#xff0c;使得在 Java 程序中执行 HTTP 请求变得相对简单 maven依赖 org.apache.httpco…

【BIG_FG_CSDN】C++ 数组与指针 (个人向——学习笔记)

一维数组 在内存占用连续存储单元的相同类型数据序列的存储。 数组是静态存储器的块&#xff1b;在编译时确定大小后才能使用&#xff1b; 其声明格式如下&#xff1a; 元素类型 数组名[常量]&#xff1b;元素类型&#xff1a;数组中元素的数据类型&#xff1b; 常量&#…

租房数据分析可视化大屏+58同城 Django框架 大数据毕业设计(附源码)✅

毕业设计&#xff1a;2023-2024年计算机专业毕业设计选题汇总&#xff08;建议收藏&#xff09; 毕业设计&#xff1a;2023-2024年最新最全计算机专业毕设选题推荐汇总 &#x1f345;感兴趣的可以先收藏起来&#xff0c;点赞、关注不迷路&#xff0c;大家在毕设选题&#xff…

【力扣题解】P105-从前序与中序遍历序列构造二叉树-Java题解

&#x1f468;‍&#x1f4bb;博客主页&#xff1a;花无缺 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! 本文由 花无缺 原创 收录于专栏 【力扣题解】 文章目录 【力扣题解】P105-从前序与中序遍历序列构造二叉树-Java题解&#x1f30f;题目描述&#x1f4a1;题…

Node.js+Express 路由配置,实现接口分类管理

首先创建一个路由目录及文件 routes/user.js代码 const express require(express); const router express.Router(); // 使用express提供的router对象 const db require(../dbserver/mysql);router.get(/api/user, (req, res) > {const sqlStr SELECT * FROM sys_user;…

StratifiedKFold解释和代码实现

StratifiedKFold解释和代码实现 文章目录 一、StratifiedKFold是什么&#xff1f;二、 实验数据设置2.1 实验数据生成代码2.2 代码结果 三、实验代码3.1 实验代码3.2 实验结果3.3 结果解释3.4 数据打乱对这种交叉验证的影响。 四、总结 一、StratifiedKFold是什么&#xff1f; …

SpringBoot 中获取 Request 的四种方法

SpringBoot 中获取 Request 的四种方法 方法1、Controller中加参数来获取request方法2、自动注入来获取request方法3&#xff1a;基类中自动注入&#xff08;推荐&#xff09;方法4&#xff1a;从RequestContextHolder中获取request 方法1、Controller中加参数来获取request 一…

Eclipse汉化

目录 一、首先电脑已经下载好Eclipse 二、打开Eclipse Babel 三、打开Eclipse 1、工具栏——>Help——> Install New Software 2、 点击Add 3、添加复制的链接&#xff0c;点击Add 4、等待加载 5、勾选Chinese&#xff08;Simpliied&#xff09;&#xff0c;而后Next&…

动画墙纸:将视频、网页、游戏、模拟器变成windows墙纸——Lively Wallpaper

文章目录 前言下载github地址&#xff1a;网盘 关于VideoWebpagesYoutube和流媒体ShadersGIFs游戏和应用程序& more:Performance:多监视器支持&#xff1a;完结 前言 Lively Wallpaper是一款开源的视频壁纸桌面软件&#xff0c;类似 Wallpaper Engine&#xff0c;兼容 Wal…

算法题明明的随机数

第一行先输入随机整数的个数 N 。 接下来的 N 行每行输入一个整数&#xff0c;代表明明生成的随机数。 具体格式可以参考下面的"示例"。 import java.util.Iterator; import java.util.Scanner; import java.util.TreeSet; // 注意类名必须为 Main, 不要有任何 pa…

HarmonyOS 组件通用属性之通用事件 文档参数讲解(触摸事件)

好 本文 我们来说说触摸事件 字面意思也非常好理解 就是我们手机手指触摸物体触发 我们先在编辑器组件介绍中 找到这个东西的基本用法 Button("跳转").onTouch((event: TouchEvent) > {})最明显的就是 event 的类型变了 点击事件的是 ClickEvent 而这里是 Touc…

CMake入门教程【基础篇】开关(option)

文章目录 1.概述2.定义简单选项3.使用选项控制宏4.设置缓存变量5.设置高级选项6.使用选项设置变量 1.概述 option 是 CMake 中用于定义选项的命令。选项可以用来控制代码的编译行为&#xff0c;允许用户在构建过程中进行配置选择。 option 命令的语法如下&#xff1a; option(&…

PID为1的僵尸进程的产生及清理

父进程PID为1的僵尸进程通常是由init系统&#xff08;在Linux系统中通常是systemd&#xff09;产生的。这种情况通常发生在以下几种情况&#xff1a; 子进程结束&#xff0c;但其父进程没有正确地调用wait()或waitpid()系统调用来获取子进程的退出状态。在这种情况下&#xff0…

主成分分析(PCA):探索数据的核心

文章目录 前言1. 什么是 PCA &#xff1f;2. PCA 的原理2.1 协方差和方差2.2 核心思想2.3 步骤 3. PCA 的应用场景4. PCA 的优缺点5. 示例&#xff1a;人脸识别5.1 完整代码5.2 运行结果 结语 前言 当今社会&#xff0c;数据无处不在。从社交媒体到金融交易&#xff0c;从医疗…

十大排序算法——排序算法效率比较——选择排序、冒泡排序、选择排序、希尔排序、归并排序、快速排序、堆排序、计数排序、桶排序、基数排序

都2024年了&#xff0c;就不要看这种纯文字的教程了吧。一文包含十大排序算法。作者把算法原理和代码实现分为两个链接&#xff0c;如果想挑战一下自己的代码能力&#xff0c;可以选择只学习算法原理&#xff0c;代码完全由自己实现。 算法名称教程地址选择排序选择排序算法原…

【代码解析】代码解析之生成token(1)

本篇文章主要解析上一篇&#xff1a;代码解析之登录&#xff08;1&#xff09;里的第8行代码调用 TokenUtils 类里的genToken 方法 https://blog.csdn.net/m0_67930426/article/details/135327553?spm1001.2014.3001.5501 genToken方法代码如下&#xff1a; public static S…

一篇文章学会如何使用 NestJS 的 Guards 守卫实现系统用户身份验证和授权

前言 当我们基于NestJS框架构建和管理应用程序时&#xff0c;为了保障其安全性&#xff0c;我们常常需要对某些敏感操作或敏感信息的访问进行限制&#xff0c;这是我们需要使用到 守卫 的地方。它作为一种可以阻止未经授权的访问的机制&#xff0c;对我们的应用程序起到了守护…

基于C#的机械臂欧拉角与旋转矩阵转换

欧拉角概述 机器人末端执行器姿态描述方法主要有四种&#xff1a;旋转矩阵法、欧拉角法、等效轴角法和四元数法。所以&#xff0c;欧拉角是描述机械臂末端姿态的重要方法之一。 关于欧拉角的历史&#xff0c;由来已久&#xff0c;莱昂哈德欧拉用欧拉角来描述刚体在三维欧几里…

Android 13屏蔽Activity或包的手势禁止滑动退出

在Android设备中&#xff0c;左/右滑两次会出现一个箭头然后退出Activity页面&#xff0c;有些Activity页面不想出现箭头及退出&#xff0e; 以下是对项目中的别人已实现的代码解析&#xff0e; 在config.xml中配置要禁用的Activity packages/apps/Launcher3/quickstep/res/v…

如何找到并杀掉占用显存的僵尸进程

如何找到并杀掉占用显存的僵尸进程 nvitop 命令发现占用显存的僵尸进程 nvitop 命令可以实时监控显卡显存的占用&#xff0c;CPU 的占用&#xff0c;以及占用显卡的进程信息等&#xff08;如下图&#xff09;。nvitop 中显示 No Such Process 的进程&#xff0c;且它的 CPU 使…