Spark分布式集群的搭建和运行

Spark分布式集群的搭建和运行

news/2025/4/19 15:31:06/文章来源:https://blog.csdn.net/weixin_33966365/article/details/86236201

集群共三台CentOS虚拟机，一个Matser，主机名为master；三个Worker，主机名分别为master、slave03、slave04。前提是Hadoop和Zookeeper已经安装并且开始运行。

1. 在master上下载Scala-2.11.0.tgz，复制到/opt/下面，解压，在/etc/profile加上语句：

export SCALA_HOME=/opt/scala-2.11.0
export PATH=$PATH:$SCALA_HOME/bin

然后运行命令：

source /etc/profile

在slave03、slave04上也执行相同的操作。

2. 在master上下载spark-2.1.0-bin-hadoop2.6，复制到/opt/下面。解压，在/etc/profile加上语句：

export SPARK_HOME=/opt/spark-2.1.0-bin-hadoop2.6
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

然后运行命令：

source /etc/profile

3. 编辑${SPARK_HOME}/conf/spark-env.sh文件，增加下面的语句：

# JAVA_HOME
export JAVA_HOME=/opt/jdk1.8.0_121
# SCALA_HOME
export SCALA_HOME=/opt/scala-2.11.0
# SPARK_HOME
export SPARK_HOME=/opt/spark-2.1.0-bin-hadoop2.6
# Master主机名
export SPARK_MASTER_HOST=master
# Worker的内存大小
export SPARK_WORKER_MEMORY=1g
# Worker的Cores数量
export SPARK_WORKER_CORES=1
# SPARK_PID路径
export SPARK_PID_DIR=$SPARK_HOME/tmp
# Hadoop配置文件路径
export HADOOP_CONF_DIR=/opt/hadoop-2.6.0-cdh5.9.0/etc/hadoop
# Spark的Recovery Mode、Zookeeper URL和路径
export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=master:12181,slave03:12181,slave04:12181 -Dspark.deploy.zookeeper.dir=/spark"

在${SPARK_HOME}/conf/slaves中增加：

matser
slave03
slave04

这样就设置了三个Worker。

修改文件结束以后，将${SPARK_HOME}用scp复制到slave03和slave04。

4. 在master上进入${SPARK_HOME}/sbin路径，运行：

./start-master.sh

这是启动Master。

再运行：

./start-slaves.sh

这是启动Worker。

5. 在master上运行jps，如果有Master和Worker表明启动成功：

在slave03、slave04上运行jps，有Worker表明启动成功：

6. 访问http://master:8081，出现下面的页面表明启动成功：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/456786.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Hive2.1.1的安装教程（元数据放在本地Mysql）

Hive2.1.1的安装教程（元数据放在本地Mysql）

目录1.上传tar包2.解压3. 设置环境变量4.设置Hive的配置文件5.启动Hive6.安装MySQL7.下载MySQL的驱动包8.修改Hive的配置文件9.启动Hive10.查看MySQL数据库目录 1.上传tar包 jar包地址：http://hive.apache.org/downloads.html 2.解压 tar -zxvf apache-hive-2…

阅读更多...

App性能优化之内存优化

App性能优化之内存优化

2019独角兽企业重金招聘Python工程师标准>>> 为什么要进行内存优化呢？其实我们可以反过来想。如果不进行内存优化会产生什么样的问题？ App的运行是有内存限制的，超过限制会产生OOM，导致App崩溃。如果内存不进行优化&am…

阅读更多...

python+Tesseract-OCR实现图片识别（只适合新手）

python+Tesseract-OCR实现图片识别（只适合新手）

1.首先准备环境： python版本：2.7/3.6 操作系统：windows系统 2.准备工具： tesseract-ocr 安装后设置好环境变量链接: https://pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw 提取码: 2med Pycharm 3.安装相关python包&#xf…

阅读更多...

Linux 网络编程详解四（流协议与粘包）

Linux 网络编程详解四（流协议与粘包）

TCP/IP协议是一种流协议，流协议是字节流，只有开始和结束，包与包之间没有边界，所以容易产生粘包，但是不会丢包。 UDP/IP协议是数据报，有边界，不存在粘包，但是可能丢包。产生粘包问题…

阅读更多...

解决selenium.common.exceptions.WebDriverException: Message: unknown error: call function result missin

解决selenium.common.exceptions.WebDriverException: Message: unknown error: call function result missin

(Session info: chrome73.0.3683.103)(Driver info: chromedriver2.30.477700 (0057494ad8732195794a7b32078424f92a5fce41),platformWindows NT 10.0.17134 x86_64)报错如上，由于版本不兼容下面是谷歌浏览器与chromedriver的版本对应关系，供参考&#…

阅读更多...

执行Hive语句报错：FAILED: Error in metadata: javax.jdo.JDOFatalDataStoreException: Access denied for user '

执行Hive语句报错：FAILED: Error in metadata: javax.jdo.JDOFatalDataStoreException: Access denied for user '

安装个Hive真不省心，各种问题。最近安装好Hive后执行Hive语句时碰到这样的错误： hive> show databases; FAILED: Error in metadata: javax.jdo.JDOFatalDataStoreException: Access denied for user rootlocalhost (using password: YES) NestedThr…

阅读更多...

GPU

GPU

import tensorflow as tf a tf.constant([1.0,2.0,3.0,4.0,5.0,6.0],shape[2,3],namea) b tf.constant([1.0,2.0,3.0,4.0,5.0,6.0],shape[3,2],nameb) c tf.matmul(a,b)sess tf.Session(configtf.ConfigProto(log_device_placementTrue)) print sess.run(c)

阅读更多...

阿里云部署django项目流程【centos7+python3+mysql】

阿里云部署django项目流程【centos7+python3+mysql】

购买阿里云服务器到[阿里云官网]，选择轻量应用服务器， 步骤如图所示： 地域随便选择哪一个，镜像的话，对比了CentOS，Debian，Ubuntu，我最终选择了CentOS，因为流行嘛&…

阅读更多...

XidianOJ 1123 K=1 Problem of Orz Pandas

XidianOJ 1123 K=1 Problem of Orz Pandas

题目描述 One panda named orz is playing a interesting game, he gets a big integer Num and an integer K. In this game, he can exchange two single numbers in Num. For example, he can get 1243 from 3241 by exchange 1 and 3.But orz can exchange at most K times…

阅读更多...

对于频繁的写数据处理方式

对于频繁的写数据处理方式

添加一个新的表情的时候调用 recentEmotions方法将所有表情写入数组每次都是添加一个新的表情进来要将沙盒中的所有表情首先加载进数组，然后将表情添加到数组里面然后在将数组写入沙盒处理方式没有必要每次都要到沙盒里面读取数组文件类方法不能访问成员…

阅读更多...

在Mysql中显示所有用户的操作教程（Linux环境下）

在Mysql中显示所有用户的操作教程（Linux环境下）

1.登录数据库首先，你需要使用如下命令登录到数据库，注意，必须是root用户哦~ mysql -u root -p 2.查询用户表在Mysql中其实有一个内置且名为mysql的数据库，这个数据库中存储的是Mysql的一些数据，比如用户、权限信…

阅读更多...

Scrapy 框架【学习笔记01】

Scrapy 框架【学习笔记01】

Scrapy 框架 Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架，用途非常广泛。框架的力量，用户只需要定制开发几个模块就可以轻松的实现一个爬虫，用来抓取网页内容以及各种图片，非常之方便。 Scra…

阅读更多...

通过profile 用maven命令打不同配置的变量包

profiles定义如下<profiles><profile><id>local</id><properties><deploy.type>local</deploy.type></properties></profile><profile><id>dev</id><properties><deploy.type>dev</de…

阅读更多...

执行Hive的查询语句报错：java.lang.IllegalArgumentException: Does not contain a valid host:port authority: loca

执行Hive的查询语句报错：java.lang.IllegalArgumentException: Does not contain a valid host:port authority: loca

好不容易把Hive装完了，结果一执行Hive的查询语句运行MapReduce程序立马报错。。。 log详细信息如下： Job running in-process (local Hadoop) Hadoop job information for null: number of mappers: 1; number of reducers: 0 2017-10-21 21:54:15,503…

阅读更多...

scrapy startproject【学习笔记02】

scrapy startproject【学习笔记02】

入门案例学习目标创建一个Scrapy项目定义提取的结构化数据(Item)编写爬取网站的 Spider 并提取出结构化数据(Item)编写 Item Pipelines 来存储提取到的Item(即结构化数据) 一. 新建项目(scrapy startproject) 在开始爬取之前，必须创建一个新的Scrapy项目。进入…

阅读更多...

开始把其他的博客搬家到这里了

开始把其他的博客搬家到这里了

今天，用一晚上的时间进行一下文章的迁移吧。这样以后查询就可以在自己的博客中查找了，也算是给自己一个写作的规律。从很多个大牛的博客中都阅读到，写博客对于一个coder的重要性。希望这次可以坚持。转载于:https://www.cnblogs.com/cyforev…

阅读更多...

java系统高并发解决方案（转载）

java系统高并发解决方案（转载）

转载博客地址：http://blog.csdn.net/zxl333/article/details/8685157 一个小型的网站，比如个人网站，可以使用最简单的html静态页面就实现了，配合一些图片达到美化效果，所有的页面均存放在一个目录下，这样的…

阅读更多...

Request/Response【学习笔记03】

Request/Response【学习笔记03】

Request Request 部分源码： # 部分代码 class Request(object_ref):def __init__(self, url, callbackNone, methodGET, headersNone, bodyNone, cookiesNone, metaNone, encodingutf-8, priority0,dont_filterFalse, errbackNone):self._encoding encoding # t…

阅读更多...

TotoiseSVN的上手教程

TotoiseSVN的上手教程

本文转自：http://www.cnblogs.com/xilentz/archive/2010/05/06/1728945.html TotoiseSVN的基本使用方法： 一、签入源代码到SVN服务器假如我们使用Visual Studio在文件夹StartKit中创建了一个项目，我们要把这个项目的源代码签入到SVN Serv…

阅读更多...

ALV可输入状态下输入金额字段变小数的问题

ALV可输入状态下输入金额字段变小数的问题

http://blog.163.com/mxb_sapyeah/blog/static/10335262520167109022155/ 小数位数两位当我在给ALV上给该字段输入整数 ‘1234 ‘ 时，该数据居然会默认变成‘12.34’ 可以在这里解决这个问题。就是定义字段目录的时候，对于金额字段指定参考数据类型就…

阅读更多...

最新文章