4、2 核心组件

 

1、Stage:虚的
  一组RDD构成的链条并行的task集合,同一Stage的所有任务有着相同的Shuffle依赖。阶段的划分按照shuffle标记来进行的。一个阶段含多个RDD,先有RDD后有Stage一个阶段含多个taskstage通过ShuffleDependency划分,一个stage都是NarrowDependency阶段类型有两种,ShuffleMapStage和ResultStage。
- ShuffleMapStage
     中间环节该阶段任务的结果是下一个阶段任务的输入。需要跟踪每个分区所在的节点。任务执行期间的中间过程,保存task的输出数据供下一个reduce进行fetch。该阶段可以单独提交。
- ResultStage结果阶段直接执行rdd的action操作。对一些分区应用计算函数(不一定需要在所有分区进行计算,比如说first(),take(3))。2、Task:运行在一个节点上,实的 一个task包含一个RDD整个的变换的过程从最后一个RDD的每个分区往前找他的依赖,就是它的任务;最后一个RDD的分区数就是该阶段的task数是spark执行单位,有两种类型。- ShuffelMapTask在ShuffleMapStage由多个ShuffleMapTask组成。- ResultTaskResultStage由多个ResultTask组成,结果任务直接task后,将结果回传给driver。3、job一个action就是一个job4、Application一个应用可含多个job。

 5、SparkContext

spark上下文是spark程序的主入口点,表示到spark集群的连接。可以创建RDD、累加器和广播变量。
每个jvm只能有个active的上下文,如果要创建新的上下文,必须stop掉原来的。

 

转载于:https://www.cnblogs.com/lybpy/p/9769913.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/451044.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

狗窝里的小日子- 2 ...

来,把平时作的菜菜整理下: 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.

优秀程序员必备素质——快速调试

你是否有过这些经历: 1.代码敲完了,刚想松口气,一运行程序,满满的Bug。 2.找啊找啊找,怎么找都找不到哪里出了问题。 3.调试了半天出不来,就开始便得心烦气躁。 4.一天连一个Bug也没调出来,…

Java程序编译运行过程

整体流程 1.首先由源程序文件编译成class文件。注意这里的源程序并不仅限于java程序,其他语言如果能够编译成class文件,并且符合jvm规范也能够在jvm上运行。 2.jvm将class文件拷贝到内存,解释成相应的机器语言运行。我们常用的hotspot虚拟机…

【TeeChart .NET教程】(七)使用函数

2019独角兽企业重金招聘Python工程师标准>>> 上一篇:【TeeChart .NET教程】(六)使用系列 【下载TeeChart.Net最新版本】 (一)功能类型 1.1 功能类型 TeeChart Pro功能是一个系列,几乎可以是任何…

Django的简介

一.MTV模型 Django的MTV模式: Model(模型):和数据库相关的.负责业务对象与数据库的对象(ORM) Template(,模板):放所有的HTML文件 模板语法:目的是将变量(数据库内容)如何巧妙的镶嵌到HTML页面中 View(视图):负责业务逻辑,并在适当的时候调用Model和Template 此外Django还有一个…

狗窝里的小日子- 3 ...

来,把平时作的菜菜整理下: 21. 22. 23. 24. 25. 26. 27. 28. 29. 30.

5种流行的Linux发行版:你更喜欢哪一个呢?

现如今,对于各种类型的用户(如桌面用户、服务器管理员、图形设计者等)而言Linux已经成为一种最流行的操作系统。Linux是免费且开源的,任何人都可以建立和编译它的源代码,并将它分发给别人。这就是为什么Linux会有很多个…

购物商城Web开发第二十三天

今天完成了结算页的第二个页面的编写,买东西的完整流程已完成了页面的部分 后面还差页面的JS部分和后台。 今天没有遇到什么大的困难,有一个问题是CSS的float属性的运用还是不够好,今 天也意识到了一些会产生的问题,以后还需要多注…

java装箱拆箱

所谓的拆箱装箱,其实就是一个简单的语法糖。我们以Integer为?。 (一)装箱 Integer i 1; 本质上就是: Integer i Integer.valueOf(1); (二)拆箱 int m i; 本质上就是&…

基于ASP.net耳机网店商城系统(前台页面+后台页面)

源码https://github.com/doublekai/user web文件夹 转载于:https://www.cnblogs.com/doublekai/p/9778246.html

狗窝里的小日子- 4 ...

来,把平时作的菜菜整理下: 31. 32. 33. 34. 35. 36. 37. 38. 39. 40.

硅谷观察者眼中的亚洲

摘要:而印度团队因为语言优势,更多直接涉足在硅谷和全球的创业项目竞争中。去年,她花了大部分时间游历了日本、韩国、中国、印度、新加坡和越南等国家,走访了数百位亚洲的创业者和风险投资商。 即便是如此现场丰富且高度碎片化的亚…

[Web 前端] 解决因inline-block元素导致的空白间距和元素下沉

cp from : https://www.jianshu.com/p/617e78a27c88 ** 前言: ** CSS 中的 display:inline-block 是笔者最为喜欢的元素之一,可以将原本占据一行的块级元素,转变为可以并列显示的行内块级元素。 display:inline-block 常被用来代替float进行页…

我的第一个随笔

自我介绍 Hello!大家好破音,我叫单嘉隆,来自地理信息162,兴趣爱好有 看电影(豆瓣已刷完,正在看imdb)怪物猎人世界!偶尔看看书 个人编程能力: 以前看网课大概写了100来行p…

java8中LocalDate、LocalTime、LocalDateTime介绍

很久以前java8中就推出了新的Time API,旨在解决旧版Date和Calendar的缺陷。讲道理真的挺好用的,不过由其他工具对新版time的兼容并不够完善,导致现在使用还不够普及。大家都还在用老的Date类,苦?的封装时间工具函数,感…

狗窝里的小日子- 5 ...

来,把平时作的菜菜整理下: 51. 52. 53. 54. 55. 56. 57. 58. 59. 60.

Linux(RadHat)基础学习—FTP服务

RedHat下的ftp服务 1.ftp服务的启动 1.编辑文件:vim /etc/sysconfig/selinux第6行selinuxdisabled保存退出。重启主机。 2.安装vsftpd yum install vsftpd -y 安装完成: 开启ftp服务: systmctl start vsftpd systemctl enable vsftpd 3.防火墙…

C++经典面试题汇总

1. 下面代码输出什么&#xff1f;为什么&#xff1f;&#xff08;初始化列表&#xff09; #include<iostream>using namespace std;class Test {int m_i;int m_j; public:Test(int v): m_j(v), m_i(m_j){}int getI(){return m_i;}int getJ(){return m_j;} };int main() {…

手机贴膜利润超百倍 消费者为无用功能高价买单

摘要&#xff1a;市场研究机构IDC的最新报告预计&#xff0c;2013年智能手机出货量将首次超过功能手机&#xff0c;国家工信部的数据显示&#xff0c;截至2011年底&#xff0c;我国智能手机用户已超过1.9亿。记者调查发现&#xff0c;在从事手机贴膜的摊点上&#xff0c;摊主多…

java内存区域及静态常量池、运行时常量池介绍

java内存区域介绍 我们先来介绍下虚拟机运行时数据区的结构&#xff1a; 我们项目中的每一个线程在运行时&#xff0c;都会有拥有自己独立的栈数据和程序计数器。程序计数器可以看作字节码命令的指示器&#xff0c;记录了下个需要执行的字节码指令&#xff0c;栈数据主要分为本…