SparkStreaming -Kafka数据源

SparkStreaming处理kafka作为数据源

所以我们要创建的是kafka的Dstream，那么就要使用到KafkaUtils下的createStream，先来看一下ctrl点进去查看，然后来写参数

在这里插入图片描述

package date_10_16_SparkStreamingimport org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.kafka.KafkaUtils
object kafkaSource {def main(args: Array[String]): Unit = {//使用SparkStreaming完成wordcount//配置对象val conf = new SparkConf().setMaster("local[*]").setAppName("wordcount")//实时数据分析的环境对象//StreamingContext需要两个参数，一个conf，一个是采集周期val streamingContext = new StreamingContext(conf,Seconds(5))//从kafka采集数据val kafkaStream = KafkaUtils.createStream(streamingContext,"chun1:2181","chun",Map("chun"->3))//将采集的数据进行分解(扁平化)val wordToSumDstream = kafkaStream.flatMap(_._2.split(" ")).map((_,1)).reduceByKey(_+_)wordToSumDstream.print()//这里不能停止采集功能，也就是streamingContext不能结束//可以简单理解为启动采集器streamingContext.start()//Driver等待采集器，采集器不挺Driver不停止streamingContext.awaitTermination()}
}

开启kafka，输入数据

kafka-console-producer.sh --broker-list chun1:2181 --topic chun


a a a a
a
a
a
a
a
a a a
a a a

idea里查看结果

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/437582.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

SparkStreaming -Kafka数据源

SparkStreaming处理kafka作为数据源

所以我们要创建的是kafka的Dstream，那么就要使用到KafkaUtils下的createStream，先来看一下ctrl点进去查看，然后来写参数

开启kafka，输入数据

相关文章

SparkStreaming - 无状态与有状态 updataStateByKey

flink(一个流处理，一个批处理)

SparkStreaming - 窗口函数（窗口操作）

Hive优化（再一遍系统复习）

volatile学习（可见性，不保证原子性，禁止指令重排（双端检索机制））

CAS（比较并交换）学习CAS实现原子性+volatile实现可见性，cas与synchronized比较的优缺点

cas引出的ABA问题?如何解决？- 理解原子引用、时间戳(版本号)原子引用

ArrayList、HashMap、HashSet是线程不安全的，高并发下如何解决？

java -锁（公平、非公平锁、可重入锁【递归锁】、自旋锁）

CountDownLatch，同步辅助类

CyclicBarrier-同步辅助类

阻塞队列-BlockningQueue

多线程下的生产者消费者（一个初始值为0的变量，两个线程一个加1一个减1，轮询5轮）

synchronized和ReentrantLock区别，用新的lock有什么好处？举例说说

阻塞队列，来写生产者消费者，生产一个消费一个

Callable接口-创建线程的第三种方法

线程池ThreadPool，线程池底层ThreadPoolExecutor方法七大参数，拒绝策略，以及实际开发中高并发下用到哪个线程池？

【转】2.1.1 购买阿里云服务器(Ubuntu系统)

死锁编码及定位分析（故障排查）

【转】在win10接双显示器（扩展模式）怎么把鼠标游标切换到第二台显示器上？