eclipse编写wordcount提交spark运行

eclipse编写wordcount提交spark运行

news/2025/4/27 0:24:09/文章来源:https://zengmiaogen.blog.csdn.net/article/details/72461251

采用集成了scala的eclipse编写代码

代码：

package wordcountimport org.apache.spark.SparkConf
import org.apache.spark.SparkContextobject WordCount {def main(args: Array[String]): Unit = {//非常重要，是通向Spark集群的入口val conf=new SparkConf().setAppName("WC")val sc=new SparkContext(conf)sc.textFile(args(0)).flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).sortBy(_._2, false).saveAsTextFile(args(1))sc.stop()}}

导出成jar包

上传到服务器

提交命令：

./spark-submit --master spark://nbdo1:7077

--class wordcount.WordCount

/home/hadoop/wordcount.jar

"hdfs://nbdo1:9000/wordcount.txt" "hdfs://nbdo1:9000/out3"

运行效果：

[hadoop@nbdo1 ~]$ hdfs dfs -cat /out3/part-*
(hello,6)
(zeng,4)
(ting,2)
(miao,2)
(gen,2)
(wen,2)
(biao,2)
(zhu,2)
(ye,1)
(,1)
(zhang,1)
(ai,1)
(lai,1)
(su,1)
(qi,1)
(sheng,1)
(xiao,1)
(xiang,1)
(lu,1)
(chang,1)
(ni,1)

-------------

更多的Java，Android，大数据，J2EE，Python，数据库，Linux，Java架构师，教程，视频请访问：

http://www.cnblogs.com/zengmiaogen/p/7083694.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/538571.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

gitlab 删除分支_如何删除gitlab上默认受保护的master主分支

gitlab 删除分支_如何删除gitlab上默认受保护的master主分支

今天开发在检查代码的时候，发现master分支有问题，现在准备删除此主分支，并且重新提交正确的代码，不过在删除时发现，master分支不能被删除。ps：主分支一般都是线上分支，需要开发确认后并且做好备…

阅读更多...

rsync服务扩展应用

rsync服务扩展应用

rsync服务扩展应用① 守护进程多模块功能配置第一步：修改配置文件注：可以再vim中输入：20,22copy22，表示复制20到22行到22行之后 vim /etc/rsyncd.conf[backup01]comment "backup dir by oldboy"path /backup[backup0…

阅读更多...

NodeJs 安装

NodeJs 安装

进入官网下载，zip 安装包 https://nodejs.org/en/download/ 解压配置环境变量到安装目录 cmd 测试 node -v npm -v

阅读更多...

SSH秘钥登录服务器

SSH秘钥登录服务器

一、查看本机 ssh 公钥，生成公钥 1.通过命令窗口 a. 打开你的 git bash 窗口 b. 进入 .ssh 目录：cd ~/.ssh c. 找到 id_rsa.pub 文件：ls d. 查看公钥：cat id_rsa.pub 或者 vim id_rsa.pub git–查看本机 ssh 公钥&#xff0c…

阅读更多...

mysql存入mtr数据_mysql mtr写入数据

mysql存入mtr数据_mysql mtr写入数据

selenium 打开浏览器import org.openqa.selenium.By; import org.openqa.selenium.WebDriver; import org.openqa.selenium.WebE ...Win8&period;1安装Visual Studio 2015提示需要KB2919355http://www.microsoft.com/zh-cn/download/details.aspx?id42335 安装说明: 1.若要…

阅读更多...

diff git 代码实现_Git 自救指南：这些坑你都跳得出吗？

diff git 代码实现_Git 自救指南：这些坑你都跳得出吗？

每天都会写架构师文章，Java技术文章天天更新，感兴趣的点个关注再走呗！Git 虽然因其分布式管理方式，不完全依赖网络，良好的分支策略，容易部署等优点，已经成为最受欢迎的源代码管理方式。但是一分…

阅读更多...

HDU 4812 D Tree

HDU 4812 D Tree

HDU 4812 思路： 点分治先预处理好1e6 3以内到逆元然后用map 映射以分治点为起点的链的值a 成他的下标 u 然后暴力跑出以分治点儿子为起点的链的值b，然后在map里查找inv[b]*k 代码： #include<bits/stdc.h> using namespace std; #d…

阅读更多...

Angular CLI 安装

Angular CLI 安装

安装Angular 官网的教程，因为国内网络环境原因，访问不了服务器，导致安装失败。 1、先安装NodeJs 安装教程：http://blog.csdn.net/zengmingen/article/details/72650484 2、通过NodeJs中的模块npm 命令行安装 CLI 2.1、设置npm的…

阅读更多...

go 写文件_「go」项目多个文件编程

go 写文件_「go」项目多个文件编程

golang 学习的时候很多sample 讲的都是一个文件的go 文件怎么写，但是现实中不可能所有的实现都写到一个文件里面，按照功能的不同，要么拆分成不同的文件，要么拆分成不同的文件。下面有些个人的经验分享下，如果有问题请指…

阅读更多...

CycleGAN 各种变变变

CycleGAN 各种变变变

转载自简单介绍了一下GAN和DCGAN的原理。以及如何使用Tensorflow做一个简单的生成图片的demo。 Ian Goodfellow对GAN一系列工作总结的ppt，确实精彩，推荐：独家 | GAN之父NIPS 2016演讲现场直击：全方位解读生成对抗网络的原理及未来…

阅读更多...

pycharm与webstorm 2017 激活破解

pycharm与webstorm 2017 激活破解

原有的方式已经失效，见下面博文： https://blog.csdn.net/justszh/article/details/81484802

阅读更多...

mysql blob 比较_与MSSQL对比学习MYSQL的心得（四）--BLOB数据类型

mysql blob 比较_与MSSQL对比学习MYSQL的心得（四）--BLOB数据类型

MYSQL里的BLOB数据类型BLOB是一个二进制大对象，用来存储可变数量的数据。BLOB类型分为4种：TinyBlob、Blob、MediumBlob、LongBlob，这几个类型之间的唯一区别是在存储文件的最大大小上不同。MySQL的四种BLOB类型类型大小(单位&#xff1…

阅读更多...

Webstorm常用快捷键

Webstorm常用快捷键

webstrom 使用 eclipse快键键 File--settings keymap 选择 eclipse 原文链接：http://www.cnblogs.com/yeminglong/p/5995421.html ------------------以下是webstrom默认的----------------------------------- Ctrl/ 或 CtrlShift/ 注释（// 或者/…

阅读更多...

VirtualBox 上安装Debian 后分辨率设置

VirtualBox 上安装Debian 后分辨率设置

VirtualBox 上安装Debian 后分辨率设置首先要配置source.list打开终端，　su 切换成root用户，　cd /etc/apt 然后编辑source.list rootdebian:/etc/apt# vi source.list 注释deb cdrom:行，加以下源 deb http://deb.debian.org/debian stretc…

阅读更多...

疯狂的程序员_程序员的乐趣是什么？

疯狂的程序员_程序员的乐趣是什么？

作者：Java3y我是一个程序员，外行人都以为我是修电脑的，我笑了笑，随意ctrl cctrl v了一把，想象着你们因为我的文章而开心不止，我感到充实而欣慰。想象着你们给我拼命点赞的样子，是多么的滑稽&…

阅读更多...

template多行编写的方式

template多行编写的方式

模板是包在 ECMAScript 2015 反引号 () 中的一个多行字符串。反引号 () — 注意，不是单引号 () — 允许把一个字符串写在多行上， 使 HTML 模板更容易阅读。反引号：键盘数字键1 旁边的，ESC键下面的键如果单引号 Component({sel…

阅读更多...

sqllite事务和MySQL事务_Android学习---SQLite数据库的增删改查和事务(transaction)调用...

sqllite事务和MySQL事务_Android学习---SQLite数据库的增删改查和事务(transaction)调用...

上一篇文章中介绍了手工拼写sql语句进行数据库的CRUD操作,本文将介绍调用sqlite内置的方法实现CRUD操作,其实质也是通过拼写sql语句.首先,创建一个新的android项目:其次,查看代码实现增删查改:1.创建DB工具类MyDBHelper.java(创建数据库的操作)packagecom.amos.android_db;impo…

阅读更多...

sqlserver2000给账户授予所有的权限_你的位置信息权限设置对了么？

sqlserver2000给账户授予所有的权限_你的位置信息权限设置对了么？

位置信息权限是众多应用权限中的一种，是应用获取手机地理位置信息的必要凭证。在你首次安装应用并打开时，通常会出现一连串的权限弹框，如果该应用在其运行过程中会用到你的地理位置信息，那么这些弹框中就会包含一个与位置信息有关…

阅读更多...

Python之路,Day1 - Python基础1

Python之路,Day1 - Python基础1

本节内容 Python介绍发展史Python 2 or 3?安装Hello World程序变量用户输入模块初识.pyc是个什么鬼？数据类型初识数据运算表达式if ...else语句表达式for 循环break and continue 表达式while 循环作业需求一、 Python介绍 python的创始人为吉多范罗苏姆&#xf…

阅读更多...

mysql 范式化_MySQL-范式和反范式

mysql 范式化_MySQL-范式和反范式

1.第一范式(1NF)(列不能再拆分)原子性，字段不可分(列的信息)，只要是关系型数据库，就自动满足1NF；2.第二范式(2NF)(主键唯一，且被依赖)在第一范式基础上建立的，即满足第二范式的必须先满足第一范式。要求DB表…

阅读更多...

最新文章