大数据——Spark学习笔记(配置)

Spark运行环境

spark ui web http://hadoop102:8080

历史服务器 http://hadoop102:18080

一. 本地模式(Local)——单机运行

本地模式:运行

bin/spark-shell

提交应用:运行

bin/spark-submit
--class org.apache.spark.examples.SparkPi              //待执行程序的主类
--master local[2]                                 		//部署模式以及虚拟核数
./examples/jars/spark-examples_2.12-3.0.0.jar           //主类所在的Jar包
10                                              		//程序的入口参数

二. 独立部署(StandAlone)——只使用Spark自身节点运行
在这里插入图片描述

1. 修改conf/slaves
在这里插入图片描述

2. 修改conf/spark-env.sh
在这里插入图片描述

提交应用:运行

bin/spark-submit
--class org.apache.spark.examples.SparkPi              //待执行程序的主类
--master spark://linux:7070                            //部署模式以及虚拟核数
./examples/jars/spark-examples_2.12-3.0.0.jar          //主类所在的Jar包
10    

启动历史服务器

1. 修改conf/spark-defaults.conf
在这里插入图片描述

2. 修改spark-env.sh文件
在这里插入图片描述

重启集群

三. 配置高可用(HA)——多个Master节点保障主Maste故障时有备用Master节点
在这里插入图片描述

1. 启动zookeeper

2. 修改conv/spark-env.sh

注释如下内容:
\#SPARK_MASTER_HOST=linux1
\#SPARK_MASTER_PORT=7077
添加如下内容: 
\#Master监控页面默认访问端口为8080,但是可能会和Zookeeper冲突,所以改成 8989,也可以自 定义,访问UI监控页面时请注意 
SPARK_MASTER_WEBUI_PORT=8989
export SPARK_DAEMON_JAVA_OPTS="  
-Dspark.deploy.recoveryMode=ZOOKEEPER
-Dspark.deploy.zookeeper.url=linux1,linux2,linux3
-Dspark.deploy.zookeeper.dir=/spark"

3. 启动spark集群

linux1 中sbin/start-all.sh linux2 中sbin/start-master.sh 此时就有了两个master节点

4. 提交应用:

bin/spark-submit
--class org.apache.spark.examples.SparkPi 
--master spark://linux1:7077,linux2:7077 
./examples/jars/spark-examples_2.12-3.0.0.jar 
10 

四. YARN模式

Spark 主要是计算框架,而不是资源调度框架,所以本身提供的资源调度并不是它的强项。一般会结合Yarn框架使用

1. 修改hadoop配置文件yarn-site.xml
在这里插入图片描述
2. 修改conf/spark-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_144 YARN_CONF_DIR=/opt/module/hadoop/etc/hadoop 

3. 提交应用

bin/spark-submit 
--class org.apache.spark.examples.SparkPi 
--master yarn 
--deploy-mode client / cluster     # 本地运行Driver与集群运行Driver./examples/jars/spark-examples_2.12-3.0.0.jar 10

总结:几种模式下的对比
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/263426.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux软件安装——安装软件的命令

Linux软件安装——安装软件的命令 摘要:本文主要学习了如何在Linux系统中安装、更新、卸载软件。 rpm命令 rpm命令用来在Linux系统上进行软件的安装。 基本语法 安装命令: 1 rpm -ivh 包全名 如果没有安装则安装,如果已经安装则升级&#xff…

JavascriptHelp

阅读全文:http://www.cckan.net/forum.php?modviewthread&tid147usingSystem;usingSystem.Data;usingSystem.Configuration;usingSystem.Web;usingSystem.Web.Security;usingSystem.Web.UI;usingSystem.Web.UI.WebControls;usingSystem.Web.UI.WebControls.Web…

GoLang之方法与接口

GoLang之方法与接口 Go语言没有沿袭传统面向对象编程中的诸多概念,比如继承、虚函数、构造函数和析构函数、隐藏的this指针等。 方法 Go 语言中同时有函数和方法。方法就是一个包含了接受者(receiver)的函数,receiver可以是内置类…

孙继海化装

于输得太惨,中国球员怕回国被球迷打,孙继海决定化装成“乞丐”。化好之后遇到一个老太太,他想看看自己化装的效果,就给了老太太100块钱,问:“你知道我是谁吗?”老太太看了看说:“你是…

sql 时间函数

1. 当前系统日期、时间 select getdate() 2. dateadd 在向指定日期加上一段时间的基础上,返回新的 datetime 值 例如:向日期加上2天 select dateadd(day,2,’2004-10-15′) –返回:2004-10-17 00:00:00.000 3. datediff 返回跨两个指定日期的…

大数据——Hive学习笔记

具体代码可以参考: https://github.com/Ostrich5yw/java4BigData

Eclipse 常用快捷键

Eclipse 常用快捷键 快捷键 描述 编辑 Ctrl1 快速修复(最经典的快捷键,就不用多说了,可以解决很多问题,比如import类、try catch包围等) CtrlShiftF 格式化当前代码 CtrlShiftM 添加类的import导入 CtrlShiftO 组织类的…

[Story]狗尾草花园

不知道为什么,很多年过去,我却依然记得这个故事。很小的时候,大概四、五岁吧,在河滩上和几个姐姐,一起玩过家家。他们大概十三,四岁吧,反正比我大好多。分成两组,我在我们一组当然是…

UML各种图

转载自: https://www.cnblogs.com/jiangds/p/6596595.html UML(Unified Modeling Language)是一种统一建模语言,为面向对象开发系统的产品进行说明、可视化、和编制文档的一种标准语言。下面将对UML的九种图包图的基本概念进行介绍…

Interactive Reflection Editing (SIGGRAPH ASIA 09)

讓使用者可以將reflection做editing 以達到使用者想要的結果INPUT: a 3d scene大部分是針對卡通等NPR的場景 對於reflection做editing利用shader也可以控制reflection這篇可以讓使用者做更動沒有使用BRDF做reflection的計算转载于:https://www.cnblogs.com/GameJan/archive/201…

大数据——Hive学习笔记(配置)

具体代码可以参考: https://github.com/Ostrich5yw/java4BigData

CSDN-markdown编辑器语法——字体、字号与颜色

Markdown是一种可以使用普通文本编辑器编写的标记语言,通过类似HTML的标记语法,它可以使普通文本内容具有一定的格式。但是它本身是不支持修改字体、字号与颜色等功能的! CSDN-markdown编辑器是其衍生版本,扩展了Markdown的功能&a…

思科携手中兴掌握3G话语权 剑指华为3COM组合

思科携手中兴掌握3G话语权 剑指华为3COM组合 中国电信市场又迎来了一次中外巨头的牵手。昨日,思科系统公司和中兴通讯股份有限公司共同宣布,双方已签署了一份战略合作协议,将进行范围广泛的合作。这也是林正刚上任思科系统中国总裁后,祭出的首个“中国攻略”。 根据协议,两家公…

JS服务器端开发基础篇(Array.slice方法和splice方法)

Array.slice方法和splice方法在众多的JS数组中属于比较复杂的一个方法,而且容易记混。搜索网络上很多资料都没有发现系统的总结。特别归纳如下,不完全处还希望各位批评指正。一、slice方法格式:arrayObj.slice(start, [end])功能:…

HashMap(摘)

1.HashMap简介 HashMap基于哈希表的Map接口实现,是以key-value存储形式存在。(除了不同步和允许使用 null 之外,HashMap 类与 Hashtable 大致相同。)HashMap 的实现不是同步的,这意味着它不是线程安全的。它的key、value都可以为n…

LeetCode—274. H 指数

274. H 指数 题目描述: 给你一个整数数组 citations ,其中 citations[i] 表示研究者的第 i 篇论文被引用的次数。计算并返回该研究者的 h 指数。 根据维基百科上 h 指数的定义:h 代表“高引用次数”,一名科研人员的 h指数是指他…

【创业】创业团队的那些事(二)

在上一篇(创业团队的那些事(一))从邮件中看到很多博友的评论,很行赏他们的观点,关于创业团队,我们都有说不完的理论,想不完的创意,干不完的事情,永远无法预知…

日常经典用语、成语及谚语

cross your heart 你发誓       gate - crasher 不请自来的不速之客      take it easy 凡事看开些, 不要太冲动, 不要看得那么重       make yourself comfortable 不用约束 (招待客人时说的话)       you are all wet 你完全误会了       she …

JavaScript复制数组

转载于:https://blog.51cto.com/5880861/1651346

面向对象基础(一)

我想在这个园子里面的新人,还是"掌门人",都对"面向对象"这几字非常的耳熟了或者有一定的了解。 但当一个初学都在学习面向对象的时候,会遇到一些瓶颈和麻烦,认为面向对象非常的难以理解。 那么本章节主要是让…