spark shell中编写WordCount程序

启动hdfs

略

http://blog.csdn.net/zengmingen/article/details/53006541

启动spark

略

安装：http://blog.csdn.net/zengmingen/article/details/72123717

spark-shell：http://blog.csdn.net/zengmingen/article/details/72162821

准备数据

vi wordcount.txt

hello zeng
hello miao
hello gen
hello zeng
hello wen
hello biao
zeng miao gen
zeng wen biao
lu ting ting
zhang xiao zhu
chang sheng xiang qi lai
zhu ye su ai ni

上传到hdfs

hdfs dfs -put wordcount.txt /

编写代码

用scala语言，在spark-shell命令窗下

sc.textFile("hdfs://nbdo1:9000/wordcount.txt")

.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)

.saveAsTextFile("hdfs://nbdo1:9000/out")

运行结果

补充：

将运行结果保存到一个文件。点击阅读扩展

代码：

sc.textFile("hdfs://nbdo1:9000/wordcount.txt")

.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)

.coalesce(1,true).saveAsTextFile("hdfs://nbdo1:9000/out2")

运行结果

-------------

更多的Java，Android，大数据，J2EE，Python，数据库，Linux，Java架构师，教程，视频请访问：

http://www.cnblogs.com/zengmiaogen/p/7083694.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/538577.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

spark shell中编写WordCount程序

启动hdfs

启动spark

准备数据

上传到hdfs

编写代码

运行结果

补充：

代码：

运行结果

相关文章

初级英语02

mysql计算机二级选择题题库_全国计算机二级mysql数据库选择题及答案

git add 撤销_更科学地管理你的项目，Git 简明教程（二）

Eclipse中Copy Qualified Name复制类全名解决办法

c 连接mysql错误信息_使用C语言访问MySQL数据 —— 连接和错误处理

eclipse编写wordcount提交spark运行

gitlab 删除分支_如何删除gitlab上默认受保护的master主分支

rsync服务扩展应用

NodeJs 安装

SSH秘钥登录服务器

mysql存入mtr数据_mysql mtr写入数据

diff git 代码实现_Git 自救指南：这些坑你都跳得出吗？

HDU 4812 D Tree

Angular CLI 安装

go 写文件_「go」项目多个文件编程

CycleGAN 各种变变变

pycharm与webstorm 2017 激活破解

mysql blob 比较_与MSSQL对比学习MYSQL的心得（四）--BLOB数据类型

Webstorm常用快捷键

VirtualBox 上安装Debian 后分辨率设置