搭建 Spark YARN 模式集群指南

在大数据处理领域,Apache Spark 凭借其卓越的性能和易用性广受青睐。而 YARN(Yet Another Resource Negotiator)作为 Hadoop 的资源管理框架,能高效管理集群资源。将 Spark 与 YARN 结合,以 YARN 模式搭建集群,可充分发挥两者优势,实现高效的大数据处理。以下将详细介绍搭建 Spark YARN 模式集群的全过程。

一、前期准备

在开始搭建 Spark YARN 模式集群之前,确保您的环境满足以下要求:

  1. 硬件环境 :准备多台物理机或虚拟机,每台配置满足一定要求,如 CPU 至少 4 核、内存 8GB 及以上,确保有一定磁盘空间用于存储数据和日志。

  2. 软件基础 :确保所有节点安装相同版本的 Linux 操作系统,如 CentOS 7。同时,安装配置好 Java 运行环境,因为 Spark 和 Hadoop 均基于 Java 开发,Java 版本要与 Spark 和 Hadoop 的要求相匹配,一般建议 Java 8 或以上。

  3. Hadoop 集群 :预先搭建并运行稳定的 Hadoop 集群,Hadoop 版本选择 2.x 及以上,且已完成 HDFS(Hadoop Distributed File System)和 YARN 的基础配置,包括 NameNode、DataNode、ResourceManager、NodeManager 等角色的正确部署与启动,可通过 Hadoop 提供的命令行工具验证 HDFS 和 YARN 的基本功能是否正常,如使用hdfs dfs -ls /查看 HDFS 根目录内容,使用yarn node -list查看 YARN 中的节点状态。

二、安装配置 Spark

  1. 下载与解压 :从 Apache Spark 官方网站(https://spark.apache.org/downloads.html)下载与 Hadoop 版本兼容的 Spark 二进制包。通过wgetcurl命令下载,例如wget https://downloads.apache.org/spark/spark-3.3.0/spark-3.3.0-bin-hadoop3.2.tgz(版本号根据实际需求选择)。下载完成后,在各节点的合适目录(如/opt/spark)下,使用tar -zxvf spark-3.3.0-bin-hadoop3.2.tgz命令解压安装包。

  2. 配置环境变量 :在每台节点的~/.bashrc文件中添加 Spark 环境变量,如:

    • export SPARK_HOME=/opt/spark/spark-3.3.0

    • export PATH=$SPARK_HOME/bin:$PATH 执行source ~/.bashrc命令使环境变量生效,方便后续使用 Spark 命令。

三、配置 Spark 以适应 YARN 模式

  1. 修改conf/spark-defaults.conf文件

    • 指定 YARN 作为资源管理器 :添加spark.master yarn,明确告知 Spark 使用 YARN 模式运行,这是关键配置之一,让 Spark 能正确连接到 YARN 进行资源申请等操作。

    • 设置 Hadoop 配置文件路径 :通过spark.hadoop.fs.defaultFS hdfs://<namenode_host>:<port>指定 HDFS 的访问地址,例如hdfs://nn.example.com:9000,让 Spark 能访问 HDFS 上的数据;同时,添加spark.yarn.dist.files等配置,可指定分发到各个节点的文件,如 Spark 应用所需的配置文件等。

    • 资源相关配置 :根据集群节点的硬件资源情况,合理设置spark.executor.memory(每个 executor 的内存大小)、spark.executor.cores(每个 executor 使用的 CPU 核心数)、spark.driver.memory(driver 程序的内存大小)等参数,例如spark.executor.memory 4gspark.executor.cores 2,以优化 Spark 应用的性能,充分利用集群资源。

  2. 修改conf/spark-env.sh文件

    • 指定 Java 安装路径 :添加export JAVA_HOME=/usr/lib/jvm/java-8-openjdk(根据实际 Java 安装路径修改),确保 Spark 使用正确的 Java 环境。

    • 其他可选配置 :如export SPARK_DAEMON_MEMORY=2g可设置 Spark 守护进程的内存大小,根据集群规模和实际需求进行调整。

四、验证 Spark YARN 模式集群

  1. 启动 Spark 历史服务器(可选但推荐) :在一台节点上执行start-history-server.sh命令启动 Spark 历史服务器,它能记录和展示 Spark 应用的历史运行信息,便于后续分析和调试。确保该服务器能正常访问 HDFS,因为历史数据存储在 HDFS 指定目录下。

  2. 运行示例程序测试 :进入 Spark 安装目录,在bin目录下运行spark-submit --master yarn --class org.apache.spark.examples.SparkPi --num-executors 2 --driver-memory 512m --executor-memory 512m --executor-cores 1 examples/jars/spark-examples_2.12-3.3.0.jar 100(具体参数根据实际情况调整)命令,提交一个 SparkPi 示例程序到 YARN 集群运行。观察程序运行过程,通过 YARN 的资源管理界面(一般访问http://<resourcemanager_host>:8088)查看该 Spark 应用是否正常申请到资源并运行,同时在 Spark 历史服务器界面(若已启动,访问http://<historyserver_host>:18080)检查该应用的历史记录是否正确显示,从而验证 Spark YARN 模式集群搭建是否成功。

五、维护与优化

  1. 性能监控与调优 :利用 Spark 自带的监控工具(如 Web UI,访问http://<driver_host>:4040)和 YARN 的监控功能,持续监控 Spark 应用的运行性能,如任务执行时间、资源利用率等。根据监控数据调整 Spark 配置参数,如增加 executor 内存、优化并行度等,以提升整体性能。

  2. 集群扩容与升级 :随着业务发展,可能需要对集群进行扩容,添加新的节点时,只需在新节点上按照上述步骤安装配置 Spark,并确保其能正确接入 YARN 集群。同时,关注 Spark 和 YARN 的版本更新,适时进行升级,以获取新功能和性能改进,但要注意升级过程中的兼容性问题,做好充分测试。

六、总结与展望

搭建 Spark YARN 模式集群为处理大规模大数据提供了强大的支持。通过合理的配置和优化,可以充分发挥 Spark 和 YARN 的优势,实现高效、稳定的数据处理。在实际应用中,不断探索和尝试新的配置策略和优化方法,以适应不断变化的业务需求。同时,随着技术的发展,关注 Spark 和 YARN 的最新动态,及时引入新的特性和功能,进一步提升集群的性能和可靠性。

如果你在搭建过程中遇到任何问题,可以参考 Spark 和 Hadoop 的官方文档,或者在相关的技术社区寻求帮助。希望这篇博客能为你搭建 Spark YARN 模式集群提供有价值的指导。

在撰写这篇博客时,我主要参考了 Spark 和 Hadoop 的官方文档,以及一些技术社区中关于集群搭建的经验分享。这些资料为我提供了详细的步骤和关键的配置要点,确保了博客内容的准确性和实用性。

如果你对 Spark YARN 模式集群的搭建有更深入的见解,或者在实践过程中有独特的经验,欢迎在评论区分享,共同促进技术交流和进步。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/80810.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

WPF之Label控件详解

文章目录 1. 引言2. Label控件基础2.1 类继承结构2.2 Label类定义 3. Label控件的核心属性3.1 Content属性3.2 Target属性3.3 其他常用属性 4. 标签样式与模板自定义4.1 简单样式设置4.2 使用Style对象4.3 触发器使用4.4 使用ControlTemplate完全自定义 5. Label与表单控件交互…

一种改进的YOLOv11网络,用于无人机视角下的小目标检测

大家读完觉得有帮助记得关注和点赞&#xff01;&#xff01;&#xff01; 摘要 随着无人机&#xff08;UAV&#xff09;和计算机视觉技术的快速发展&#xff0c;从无人机视角进行目标检测已成为一个重要的研究领域。然而&#xff0c;无人机图像中目标像素占比极小、物体尺度变…

Adobe Lightroom Classic v14.3.0.8 一款专业的数字摄影后期处理软件

软件介绍 Adobe Lightroom Classic 2025中文激活版&#xff08;Adobe桌面照片编辑软件&#xff09;LRC2025&#xff08;LR2025本地离线版&#xff09;是一款桌面照片编辑器和相册管理软件的raw格式编辑软件&#xff0c;支持各种RAW图像相机配置&#xff0c;HDR全景照片&#x…

【Statsmodels和SciPy介绍与常用方法】

Statsmodels库介绍与常用方法 Statsmodels 是一个强大的 Python 库&#xff0c;专注于统计建模和数据分析&#xff0c;广泛应用于经济学、金融、生物统计等领域。它提供了丰富的统计模型、假设检验和数据探索工具&#xff0c;适合进行回归分析、时间序列分析等任务。本文将介绍…

【Rust通用集合类型】Rust向量Vector、String、HashMap原理解析与应用实战

✨✨ 欢迎大家来到景天科技苑✨✨ &#x1f388;&#x1f388; 养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; &#x1f3c6; 作者简介&#xff1a;景天科技苑 &#x1f3c6;《头衔》&#xff1a;大厂架构师&#xff0c;华为云开发者社区专家博主&#xff0c;…

SoapUi测试1——REST(WebAPi、Json协议/HTTP、Post通讯方式)接口测试

文章目录 1背景1.1接口测试工具SoapUi产生背景1.2常见接口类型1.3接口包含内容1.4请求格式 2软件使用3http、webservice、webapi如何测试3.1REST&#xff08;WebAPi、JSON/HTTP、POST&#xff09;3.2SOAP&#xff08;Webserver、XML/HTTP、POST&#xff09; 1背景 1.1接口测试…

Linux按键驱动测试

文章目录 一、设备节点添加 二、创建驱动文件代码 2.1 核心数据结构 2.2 按键值定义 2.3 关键函数实现 三、创建测试文件 四、测试 一、设备节点添加 首先在设备树文件中添加pinctrl以及在根目录下添加设备节点。如下&#xff1a; //创建按键输入的pinctrlpinctrl_key: keygrp…

5000元可以运行32B大模型的笔记本

5000元可以运行32B 大模型的笔记本 荣耀笔记本 X14 Plus 锐龙版 R7-8845HS -32G -1T 模型名称 模型大小 tokens/s qwq-32b-q4 19GB 2.4 Qwen2.5-Coder-14B- Q8 16GB 4 DeepSeek-R1-Distill-Qwen-7B-Q8 8GB 8.1 DeepSeek-R1-Distill-Llama-8B-Q4 5GB 11.7

arm设备树基础知识

文章目录 前言dts片段通用属性介绍地址大小中断phandlecompatible mmc节点介绍 前言 arm开发&#xff0c;早晚要了解设备树 dts片段 interrupt-parent <0x8005>; model "linux,dummy-virt"; #size-cells <0x02>; #address-cells <0x02>; co…

【C++ 核心知识点面试攻略:从基础到实战(上位机开发视角)】

一、命名空间&#xff08;Namespace&#xff09;相关问题 问题1&#xff1a;C引入命名空间的核心目的是什么&#xff1f;如何通过命名空间解决命名冲突&#xff1f; 答案&#xff1a; C引入命名空间的核心目的是 避免全局作用域中的命名冲突&#xff0c;通过将变量、函数、类…

线性代数与数据学习

The Functions of Deep Learning (essay from SIAM News, December 2018) Deep Learning and Neural Nets

phpstorm用php连接数据库报错

项目场景&#xff1a; phpstorm用php连接数据库 问题描述 用php使用mysql_connect 的时候报错了&#xff0c;没有这个函数 原因分析&#xff1a; php解释器问题&#xff0c;后来查资料得知mysql_connct只适用于php5.5以下解释器。一开始用的7&#xff0c;改成5.3以后还是报…

51c大模型~合集122

我自己的原文哦~ https://blog.51cto.com/whaosoft/13877107 #PHYBench 北大物院200人合作&#xff0c;金牌得主超50人&#xff01;PHYBench&#xff1a;大模型究竟能不能真的懂物理&#xff1f; 本项目由北京大学物理学院朱华星老师、曹庆宏副院长统筹指导。基准设计、…

单片机 + 图像处理芯片 + TFT彩屏 触摸滑动条控件

触摸滑动条控件使用说明 一、项目概述 本项目基于单片机和RA8889/RA6809图形处理芯片的TFT触摸屏滑动条控件。该控件支持水平和垂直滑动条&#xff0c;可自定义外观和行为&#xff0c;并支持回调函数进行值变化通知。 硬件平台&#xff1a;51/ARM均可(测试时使用STC8H8K64U单…

linux离线安装zsh

下载zsh 下载仓库后解压 下载地址&#xff1a;https://github.com/zsh-users/zsh 离线安装 安装方法见INSTALL文件 ./configure --prefix[/usr/local] make make install

机器学习中的数据转换:关键步骤与最佳实践

机器学习中的数据转换&#xff1a;关键步骤与最佳实践 摘要 &#xff1a;在机器学习领域&#xff0c;数据是模型的核心&#xff0c;而数据的转换是构建高效、准确模型的关键步骤之一。本文深入探讨了机器学习中数据转换的重要性、常见的数据类型及其转换方法&#xff0c;以及在…

TDR阻抗会爬坡? 别担心,不是你的错,你只是不够了解TDR!

在背板系统或任何长走线设计里&#xff0c;你大概都碰过这画面&#xff1a; TDR 曲线一开始乖乖在 92 Ω&#xff0c;但越往末端、阻抗越爬越高&#xff0c;来到最高 97 Ω&#xff0c;心里瞬间凉半截 &#x1f612; &#xff0c;「难不成... 板厂又翻车了吗&#xff1f;」 然…

在另外一台可以科学下载的电脑用ollama下载模型后,怎么导入到另外一台服务器的ollama使用

环境&#xff1a; Win10专业版 Ubuntu20.04 问题描述&#xff1a; 在另外一台可以科学下载的电脑用ollama下载模型后&#xff0c;怎么导入到另外一台服务器的ollama使用&#xff0c;原电脑win10上的ollama下载的模型,复制到ubuntu20.04的ollama上推理 解决方案&#xff1a;…

Ethan独立开发产品日报 | 2025-04-27

1. CreateWise AI 旨在提升你工作效率的AI播客编辑器 人工智能播客编辑器&#xff0c;让你的播客制作速度提升10倍&#xff01;它可以自动去除口头语和沉默&#xff0c;生成节目笔记和精彩片段&#xff0c;还能一键制作适合社交媒体分享的短视频——所有这些功能都只需一次点…

解决 shadui组件库Popover 点击后会消失

react用了shadui组件库 <Popover><PopoverTrigger><div className"text-operation-item" onClick{props.callback}><img src{props.imgSrc} width{20} height{20} /></div></PopoverTrigger><PopoverContent className"…