为何Spark更高效？

为何Spark更高效？

news/2025/4/29 0:42:33/文章来源:https://michael.blog.csdn.net/article/details/114156607

learn from 从0开始学大数据（极客时间）

Spark 的计算阶段

Hadoop MapReduce 简单粗暴地根据 shuffle 将大数据计算分成 Map 和 Reduce 两个阶段，然后就算完事了。
而 Spark 更细腻一点，将前一个的 Reduce 和后一个的 Map 连接起来，当作一个阶段持续计算，形成一个更加优雅、高效的计算模型，虽然其本质依然是 Map 和 Reduce。
但是这种多个计算阶段依赖执行的方案可以有效减少对 HDFS 的访问，减少作业的调度执行次数，因此执行速度也更快
和 Hadoop MapReduce 主要使用磁盘存储 shuffle 过程中的数据不同，Spark 优先使用内存 进行数据存储，包括 RDD 数据。
除非是内存不够用了，否则是尽可能使用内存，这也是 Spark 性能比 Hadoop 高的另一个原因

Spark 的作业管理

DAGScheduler 根据代码生成 DAG 图以后，Spark 的任务调度就以任务为单位进行分配，将任务分配到分布式集群的不同机器上执行

Spark 的执行过程

总结：
Spark 有三个主要特性：

RDD 的编程模型更简单
DAG 切分的多阶段计算过程更快速
使用内存存储中间计算结果更高效

这三个特性使得 Spark 相对 Hadoop MapReduce 可以有更快的执行速度，以及更简单的编程实现

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/472779.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

iphone个系列尺寸_最值得入手的4款iPhone，都是内行人的最爱，拿出去有面子

iphone个系列尺寸_最值得入手的4款iPhone，都是内行人的最爱，拿出去有面子

现如今手机市场里最受大众欢迎的手机应该就是iPhone了，虽然iPhone的价格都普遍偏高，但是大家依然还是非常青睐于它，主要是因为iPhone的配置和性能确实是比其他机型要好，搭载的A系列仿生芯片和iOS系统都提升了它的性能，…

阅读更多...

protocol（协议）和 delegate（委托）也叫（代理）---辨析

protocol（协议）和 delegate（委托）也叫（代理）---辨析

protocol和delegate完全不是一回事。协议(protocol)，（名词）要求。就是使用了这个协议后就要按照这个协议来办事，协议要求实现的方法就一定要实现。委托(delegate)，（动词）助手。顾名思义就是委托…

阅读更多...

redis 计数 java_redission计数器实现，redisTemplate计数器

redis 计数 java_redission计数器实现，redisTemplate计数器

在redission 2.9.0版本之前是有BUG，在实现下面代码时，第一次是成功的，但是在第二次就会失败：RedissonClient client;//client参考别的demoRMapCache mapCache client.getMapCache("nameSpace");mapCache.putIfAbsent(&…

阅读更多...

天池在线编程能否转换

天池在线编程能否转换

文章目录1. 题目2. 解题1. 题目给两个字符串 S 和 T, 判断 S 能不能通过删除一些字母(包括0个)变成 T. 样例1 输入: S "lintcode" 和 T "lint" 输出: true样例2 输入: S "lintcode" 和 T "ide" 输出: true样例3 输入: S "…

阅读更多...

java对象持久化技术_Java对象持久化技术Hibernate 一

java对象持久化技术_Java对象持久化技术Hibernate 一

Hibernate是Java应用和关系数据库之间的桥梁，它负责Java对象和关系数据之间的映射。Hibernate内部封装了通过JDBC访问数据库的操作，向上层应用提供了面向对象的数据访问API。在Java应用中使用Hibernate包含以下步骤。(1)创建Hibernate的配置文件。(2)创建…

阅读更多...

SQL获取变量类型以及变量最大长度

SQL获取变量类型以及变量最大长度

DECLARE Temp nvarchar(1050) SELECT CAST(SQL_VARIANT_PROPERTY(Temp, BaseType) AS VARCHAR(50))SELECT CAST(SQL_VARIANT_PROPERTY(Temp, MaxLength) AS VARCHAR(50))转载于:https://www.cnblogs.com/lhmlyx2723356/p/4105322.html

阅读更多...

java 析构函数_C++与Java的区别(一)

java 析构函数_C++与Java的区别(一)

一，前言网上经常看到编程语言之争，大伙儿皈依到不同门派，各自怀抱信仰，时不时还发生点儿“冲突”。这其中，C和Java的优劣，十多年前就常吵的火热。然而时代在进步，技术在发展，满街早已…

阅读更多...

天池在线编程圣杯咒语

天池在线编程圣杯咒语

文章目录1. 题目2. 解题1. 题目一段英文中同时出现大小写的字母中最大的那一个，现在给你一段英文，你能把这个字母找出来嘛？ ps:一定存在答案英文长度不会超过100000 样例 1： 输入："aAbb" 输出&#xf…

阅读更多...

java jtextarea字体_java – 更改JTextArea中不同行的字体

java jtextarea字体_java – 更改JTextArea中不同行的字体

我想在JTextArea中添加不同的字体行,但是最后一个字体似乎覆盖了另一个字体.请帮忙…import java.awt.*;import javax.swing.*;SuppressWarnings("serial")public class test extends JFrame {private static JTextArea referenceTextArea new JTextArea(10, 10);pr…

阅读更多...

crawler_java_数据平台结构

crawler_java_数据平台结构

大数据生态架构转载于:https://www.cnblogs.com/cphmvp/p/4105674.html

阅读更多...

天池在线编程卡牌游戏（01背包）

天池在线编程卡牌游戏（01背包）

文章目录1. 题目2. 解题1. 题目你跟你的朋友在玩一个卡牌游戏，总共有 n 张牌。每张牌的成本为 cost[i] 并且可以对对手造成 damage[i] 的伤害。你总共有 totalMoney 元并且需要造成至少 totalDamage 的伤害才能获胜。每张牌只能使用一次，判断你是否…

阅读更多...

bean validation校验方法参数_Spring Boot 之使用 validation 验证参数

bean validation校验方法参数_Spring Boot 之使用 validation 验证参数

前言文本已收录至我的GitHub仓库，欢迎Star：https://github.com/bin392328206/six-finger种一棵树最好的时间是十年前，其次是现在我知道很多人不玩qq了,但是怀旧一下,欢迎加入六脉神剑Java菜鸟学习群，群聊号码：54968483…

阅读更多...

原 IOS之NSValue整理

原 IOS之NSValue整理

原 IOS之NSValue整理发表于2年前(2013-02-28 23:02) 阅读（1974） | 评论（0） 5人收藏此文章, 我要收藏赞3IOS NSValue值对象(value object)概念在面向对象的编程语言中，值对象本质上是数据元素的的对象包装器&#xf…

阅读更多...

LeetCode 891. 子序列宽度之和（数学）

LeetCode 891. 子序列宽度之和（数学）

文章目录1. 题目2. 解题1. 题目给定一个整数数组 A ，考虑 A 的所有非空子序列。对于任意序列 S ，设 S 的宽度是 S 的最大元素和最小元素的差。返回 A 的所有子序列的宽度之和。由于答案可能非常大，请返回答案模 10^97。示例&#x…

阅读更多...

hive建表语句_Hive数据如何同步到MaxCompute之实践讲解

hive建表语句_Hive数据如何同步到MaxCompute之实践讲解

摘要：本次分享主要介绍 Hive数据如何迁移到MaxCompute。MMA(MaxCompute Migration Assist)是一款MaxCompute数据迁移工具，本文将为大家介绍MMA工具的功能、技术架构和实现原理，再通过实际操作MMA，演示将Hive数据迁移到MaxCompute。…

阅读更多...

Java 包及访问权限

Java 包及访问权限

文章目录1. package 包2. import3. JDK常见的包4. 访问权限5. jar 压缩1. package 包作用：防止不同的人写的类的名称相同冲突了， package testPackage1.java; class testPg {public String talk(){return "talk()";} } class testAnother{p…

阅读更多...

java phaser用法_第3章Phaser的使用-（java并发编程核心方法与框架）

java phaser用法_第3章Phaser的使用-（java并发编程核心方法与框架）

3.1 Phaser的使用3.2 类Phaser的arriveAndAwaitAdvance()方法测试13.3 类Phaser的arriveAndAwaitAdvance()方法测试23.4 类Phaser的arriveAndDeregister()方法测试3.5 类Phaser的getPhase()和onAdvance()方法测试3.6 类Phaser的getRegisteredParties()方法和register()测试3.7 …

阅读更多...

html选项卡_适用于Mac的最佳HTML文本编辑器，编码开发必备

html选项卡_适用于Mac的最佳HTML文本编辑器，编码开发必备

一个好的文本编辑器对于想要建立网站或进行编码的任何人都是必不可少的。这对于习惯于面面俱到的环境的Mac开发人员而言更加明显。对于他们来说存在一系列不同的优质软件之选。今天小编将介绍几款Mac上好用的HTML文本编辑器，对于每一款文本编辑器，小编将…

阅读更多...

Hive静态分区表动态分区表

Hive静态分区表动态分区表

静态分区表： 一级分区表： CREATE TABLE order_created_partition (orderNumber STRING, event_time STRING ) PARTITIONED BY (event_month string) ROW FORMAT DELIMITED FIELDS TERMINATED BY \t; 加载数据方式一：从本地/HDFS目录加载 loa…

阅读更多...

java 判断请求为 ajax请求_Java过滤器处理Ajax请求，Java拦截器处理Ajax请求，java 判断请求是不是ajax请求...

java 判断请求为 ajax请求_Java过滤器处理Ajax请求，Java拦截器处理Ajax请求，java 判断请求是不是ajax请求...

Java过滤器处理Ajax请求，Java拦截器处理Ajax请求，拦截器Ajax请求java 判断请求是不是ajax请求，Java判断是否为ajax请求>>>>>>>>>>>>>>>>>>>>>>>>>>>>&…

阅读更多...

最新文章