spark集群,Stand alone,Hadoop集群有关启动问题

你的问题是因为 start-all.sh 是 Hadoop 的启动脚本(用于启动 HDFS 和 YARN),而不是 Spark 的启动脚本。而你已经通过 start-cluster.sh 启动了 Hadoop 相关服务(HDFS/YARN),再次执行 start-all.sh 会导致服务重复启动冲突。以下是解决方法:


1. 如果想启动 Spark 集群(Standalone 模式)

Spark 有自己独立的启动脚本,与 Hadoop 无关。你需要使用 Spark 的脚本:

步骤 1:停止 Hadoop 相关服务(如果不需要运行 Hadoop)

bash复制代码

# 停止 Hadoop 服务(根据你的 start-cluster.sh 逻辑,可能需要自定义停止脚本)
stop-cluster.sh
# 或者手动停止 Hadoop 服务(如果 stop-cluster.sh 不存在)
stop-dfs.sh && stop-yarn.sh
步骤 2:启动 Spark 独立集群

bash复制代码

# 启动 Spark Master 和 Worker
# 进入 Spark 的 sbin 目录(根据你的安装路径调整)
cd /bigdata/spark/sbin# 启动 Spark 的 Master 和所有 Worker(需提前配置 workers 文件)
./start-all.sh
检查 Spark 集群状态

bash复制代码

# 查看 Master 和 Worker 进程
jps | grep -E 'Master|Worker'# 访问 Spark Web UI(默认端口 8080)
http://master:8080

2. 如果要在 Hadoop YARN 上运行 Spark(推荐)

如果已经启动了 Hadoop YARN,无需单独启动 Spark 集群,直接以 YARN 模式提交 Spark 任务即可:

提交 Spark 任务到 YARN

bash复制代码

spark-submit \--class your.main.class \--master yarn \--deploy-mode client \/path/to/your-spark-job.jar
检查 YARN 上的 Spark 任务

bash复制代码

# 查看 YARN 任务列表
yarn application -list# 访问 YARN Web UI(默认端口 8088)
http://master:8088

3. 总结:关键区别

脚本/命令归属作用使用场景
start-cluster.sh自定义启动 Hadoop(HDFS/YARN)和 Zookeeper需要 Hadoop 环境时
start-all.shHadoop启动 HDFS 和 YARN已废弃,建议用 start-dfs.sh 和 start-yarn.sh
spark/sbin/start-all.shSpark启动 Spark 独立集群的 Master 和 Worker需要 Spark Standalone 集群时
spark-submit --master yarnSpark在 YARN 上运行 Spark 任务已启动 Hadoop YARN 时

你的操作建议

  1. 如果想用 Spark Standalone 集群

    • 停止 Hadoop 服务:stop-cluster.sh 或 stop-dfs.sh && stop-yarn.sh
    • 启动 Spark 集群:/bigdata/spark/sbin/start-all.sh
  2. 如果已启动 Hadoop YARN

    • 直接提交 Spark 任务到 YARN,无需启动 Spark 独立集群:

      bash复制代码

      spark-submit --master yarn ...
  3. 避免混淆脚本

    • 将 Hadoop 和 Spark 的 sbin 目录加入环境变量,或使用全路径执行脚本(如 /bigdata/spark/sbin/start-master.sh)。

补充:停止冲突的 Hadoop 服务

如果已经误启动了重复的 Hadoop 服务,手动停止它们:

bash复制代码

# 停止 HDFS
stop-dfs.sh# 停止 YARN
stop-yarn.sh# 停止 Zookeeper(根据你的脚本路径)
/bigdata/zookeeper/zookeeper-3.8.0/bin/zkServer.sh stop

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/900920.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Kotlin 通用请求接口设计:灵活处理多样化参数

在 Kotlin 中设计一个通用的 ControlParams 类来处理不同的控制参数,有几种常见的方法:方案1:使用密封类(Sealed Class) sealed class ControlParamsdata class LightControlParams(val brightness: Int,val color: S…

aspark 配置2

编写Hadoop集群启停脚本 1.建立新文件,编写脚本程序 在hadoop101中操作,在/root/bin下新建文件:myhadoop,输入如下内容: 2.分发执行权限 保存后退出,然后赋予脚本执行权限 [roothadoop101 ~]$ chmod x /r…

Webstorm 使用搜不到node_modules下的JS内容 TS项目按Ctrl无法跳转到函数实现

将node_modules标记为不排除,此时要把内存改大,不然webstorm中途建立索引时,会因为内存不足,导致索引中途停止,造成后续搜索不出来 更改使用内存设置 内存调为4096 若出现搜不出来js内容时,请直接重启下该项…

vue-element-plus-admin的安装

文档链接:开始 | vue-element-plus-admin 之前尝试按照官方文档来安装,运行npm run dev命令却不能正常打开访问浏览器,换一个方式 首先在目录下打开命令窗口 1、克隆项目 从 GitHub 获取代码 # clone 代码 git clone https://github.com…

【windows10】基于SSH反向隧道公网ip端口实现远程桌面

【windows10】基于SSH反向隧道公网ip端口实现远程桌面 1.背景2.SSH反向隧道3.远程连接电脑 1.背景 ‌Windows 10远程桌面协议的简称是RDP(Remote Desktop Protocol)‌。 RDP是一种网络协议,允许用户远程访问和操作另一台计算机。 远程桌面功…

软考系统架构设计师之大数据与人工智能笔记

一、大数据架构设计 1. 核心概念与挑战 大数据特征:体量大(Volume)、多样性(Variety)、高速性(Velocity)、价值密度低(Value)。传统数据库问题:数据过载、性…

【数据结构 · 初阶】- 单链表

目录 一.相关指针知识点 二.链表 1.为什么学了顺序表还要学链表 2.优点 三.实现 1.链表的打印 —— 理解链表结构 (2) 物理结构图 2.链表的尾插 —— 入门 错误写法:tail ! NULL 总结: 正确代码物理图解: (2) 尾插整体代码 (思考…

按键消抖(用状态机实现)

基于状态机的设计代码 module key_filter(clk,rst,key,key_p_flag,key_r_flag,key_state);input clk,rst;input key;output reg key_p_flag;output reg key_r_flag;output reg key_state;reg [1:0]r_key; //后面用来判断什么时候pedge,什么时候nedgealways…

大数据(7.2)Kafka万亿级数据洪流下的架构优化实战:从参数调优到集群治理

目录 一、海量数据场景下的性能之殇1.1 互联网企业的数据增长曲线1.2 典型性能瓶颈分析 二、生产者端极致优化2.1 批量发送黄金法则2.1.1 分区选择算法对比 2.2 序列化性能突破 三、消费者端并发艺术3.1 多线程消费模式演进3.1.1 消费组Rebalance优化 3.2 位移管理高阶技巧 四、…

MyBatis深度解析与实战指南:细节完整,从入门到精通

MyBatis深度解析与实战指南:细节完整,从入门到精通 整理这份笔记,是因为学习 MyBatis 时发现很多教程要么只讲基础 CRUD,要么直接跳到 Spring 整合,对 MyBatis 核心特性讲解不全面,基础部分也不够完整。实…

【科学技术部政务服务平台-用户注册/登录安全分析报告】

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…

【Audio开发三】音频audio中帧frameSize ,周期大小periodsize,缓冲区buffer原理详解以及代码流程分析

一、基础概述 在分析获取最小帧数前,我们先来了解几个相关的概念。 1,帧 帧(frame):表示一个完整的声音单元,所谓的声音单元是指一个采样样本。如果是双声道,那么一个完整的声音单元就是 2 个样…

K8S学习之基础七十五:istio实现灰度发布

istio实现灰度发布 上传镜像到harbor 创建两个版本的pod vi deployment-v1.yaml apiVersion: apps/v1 kind: Deployment metadata:name: appv1labels:app: v1 spec:replicas: 1selector:matchLabels:app: v1apply: canarytemplate:metadata:labels:app: v1apply: canaryspec…

C++蓝桥杯填空题(攻克版)

片头 嗨~小伙伴们,咱们继续攻克填空题,先把5分拿到手~ 第1题 数位递增的数 这道题,需要我们计算在整数 1 至 n 中有多少个数位递增的数。 什么是数位递增的数呢?一个正整数如果任何一个数位不大于右边相邻的数位。比如&#xf…

【Python】数据结构

【Python】数据结构: Series:1、通过列表创建Series类对象2、显示地给数据指定标签索引3、通过字典创建Series类对象4、获取索引5、获取数据 DataFrame:1、通过数组创建一个DataFrame类对象2、指定列索引3、指定行索引4、获取列的数据5、查看…

Android XML布局与Compose组件对照手册

下面我将详细列出传统 XML 布局中的组件与 Compose 组件的对应关系,帮助您更好地进行迁移或混合开发。 基础布局对应 XML 布局Compose 组件说明LinearLayout (vertical)Column垂直排列子项LinearLayout (horizontal)Row水平排列子项FrameLayoutBox层叠子项Relativ…

云原生运维在 2025 年的发展蓝图

随着云计算技术的不断发展和普及,云原生已经成为了现代应用开发和运维的主流趋势。云原生运维是指在云原生环境下,对应用进行部署、监控、管理和优化的过程。在 2025 年,云原生运维将迎来更加广阔的发展前景,同时也将面临着一系列…

js day5

复习模板字符串: 在输出语句里面 document.write(我今年${a}岁了)中间是反引号;里面是${变量}; 复习基本类型 number String null undefined boolean 检测数据类型输出typedf 变量则可; 添加链接描述 复习样式变量table什么的边…

SmolVLM2: The Smollest Video Model Ever(三)

这是对《SmolLM2: When Smol Goes Big — Data-Centric Training of a Small Language Model》的翻译阅读 摘要 虽然大语言模型在人工智能的许多应用中取得了突破,但其固有的大规模特性使得它们在计算上成本高昂,并且在资源受限的环境中部署具有挑战性。…

汽车软件开发常用的需求管理工具汇总

目录 往期推荐 DOORS(IBM ) 行业应用企业: 应用背景: 主要特点: Polarion ALM(Siemens) 行业应用企业: 应用背景: 主要特点: Codebeamer ALM&#x…