大数据课程K3——Spark的常用案例

文章作者邮箱：yugongshiye@sina.cn 地址：广东惠州

▲ 本章节目的

⚪ 掌握Spark的常用案例——WordCount；

⚪ 掌握Spark的常用案例——求平均值；

⚪ 掌握Spark的常用案例——求最大值和最小值；

⚪ 掌握Spark的常用案例——TopK；

⚪ 掌握Spark的常用案例——二次排序；

一、案例——WordCount

1. 实现步骤

1. 创建spark的项目，在scala中创建项目导入spark相关的jar包。

2. 开发spark相关代码。

代码示例：

import org.apache.spark.SparkConf

import org.apache.spark.SparkContext

object WordCountDriver {

def main(args: Array[String]): Unit = {

val conf=new SparkConf().setMaster("spark://hadoop01:7077").setAppName("wordcount")

val sc=new SparkContext(conf)

val data=sc.textFile("hdfs://hadoop01:9000/words.txt", 2)

val result=data.flatMap { x => x.split(" ") }.map { x => (x,1) }.reduceByKey(_+_)

result.saveAsTextFile("hdfs://hadoop01:9000/wcresult")

}

3. 将写好的项目打成jar，上传到服务器，进入bin目录。

执行：spark-submit --class cn.tedu.WordCountDriver /home/software/spark/conf/wc.jar

二、案例——求平均值

案例文件：

1 16

2 74

3 51

4 35

5 44

6 95

7 5

8 29

10 60

11 13

12 99

13 7

14 26

正确答案：

代码示例一：

import org.apache.spark.SparkConf

import org.apache.spark.SparkContext

object AverageDriver {

def main(args: Array[String]): Unit = {

val conf=new SparkConf().setMaster("local").setAppName("AverageDriver")

val sc=new SparkContext(conf)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/50661.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

大数据课程K3——Spark的常用案例

▲ 本章节目的

一、案例——WordCount

1. 实现步骤

二、案例——求平均值

相关文章

流程自动化广泛渗透，盘点RPA高频应用的5大行业

拼多多app商品详情接口获取pdd商品主图价格销量库存信息

【docker】中文无法显示输入等问题解决方法

时序分解 | MATLAB实现基于SWD群体分解的信号分解分量可视化

修改电脑上路由表使笔记本默认走无线

npm报错：xxx packages are looking for funding run `npm fund` for details（解决办法）

Spring框架提供的工具类

Redis哨兵模式搭建

Ubuntu18.04 交叉编译openssl-1.1.1

远控木马病毒分析

C++ Day3

Golang使用消息队列（RabbitMQ）

C语言之扫雷游戏实现篇

设计模式之创建者模式

VS2022 C++ 批量追加hosts文件IP地址与域名脚本V1.0

Pyqt5打开电脑摄像头进行拍照

【ES6】—【必备知识】—深拷贝与浅拷贝

无涯教程-PHP - File 函数

Linux：如何创建用户

windows上ffmpeg如何录制双屏幕中的一个屏幕上的视频