深入理解与应用Hadoop中的MapReduce

戳蓝字“CSDN云计算”关注我们哦!

 

作者:安静的技术控 

来源:CSDN 

原文:

https://blog.csdn.net/a2011480169/article/details/52924955 

版权声明:本文为博主原创文章,转载请附上博文链接!


现在大数据是越来越火了,而我自己研究这方面也很长时间了,今天就根据我自己的经验教会大家学会如何使用MapReduce,下文中将MapReduce简写为MR。


本篇博客将结合实际案例来具体说明MR的每一个知识点。


1、本篇博客核心内容


640?wx_fmt=png


2、MR的基本概念


640?wx_fmt=png


3、MR中map函数和reduce函数如何编写


640?wx_fmt=png


4、MR程序的基本编写流程(MR的基本执行过程)


640?wx_fmt=png


下面将用一个具体的电信业务说明MR最基本的编写过程:
实验所用数据:
640?wx_fmt=png
具体字段描述:
640?wx_fmt=png
业务要求:统计同一个用户的上行总流量和,下行总流量和以及上下总流量和
例如:
640?wx_fmt=png

代码示例:


640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

运行结果:

640?wx_fmt=png

640?wx_fmt=png

5、MR程序的优化方式1---分区


640?wx_fmt=png


具体业务描述:对于上面的电信数据,统计同一个用户的上行总流量和,下行总流量和以及上下总流量和,并且手机号(11位)的信息输出到一个文件中,非手机号(8位)的信息输出到一个文件中


代码示例


640?wx_fmt=png

640?wx_fmt=png


640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png


运行结果:

640?wx_fmt=png

6、MR程序的优化方式2---自定义排序


640?wx_fmt=png

业务描述:
对于上面业务得到的统计结果:
640?wx_fmt=png


先按照总流量由低到高排序,在总流量相同的情况下,按照下行流量和从低到高排序:


实例代码:

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png


运行结果:
640?wx_fmt=png
640?wx_fmt=png

7、MR程序的优化方式3---本地归并Combine


640?wx_fmt=png


具体业务描述:对于上面的电信数据,统计同一个用户的上行总流量和,下行总流量和以及上下总流量和,代码中要求加入本地归并优化方式:
代码示例:


640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

运行结果:

640?wx_fmt=png
640?wx_fmt=png

8、MR程序的优化方式4---自定义计数器


640?wx_fmt=png


9、如何用MR实现某个业务的方式总结


640?wx_fmt=png



1.微信群:

添加小编微信:color_ld,备注“进群+姓名+公司职位”即可,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!


2.征稿:

投稿邮箱:liudan@csdn.net;微信号:color_ld。请备注投稿+姓名+公司职位。



推荐阅读

  • 云计算到底是怎么玩的?

  • 面向对象编程,再见!

  • AI女性界的“扛把子”,凭一己之力迫使NIPS改名

  • 00后也会「玩」区块链,你对「朝阳」行业焦虑啥 ?| 圣诞特辑

  • 20k~65k, 2018年最后一波热门技术岗位, 立刻投简历, 跳槽才是加薪的捷径

  • 可替代Android的6大开源移动操作系统

  • 程序员求助:被领导强行要求写Bug该怎么办?网友的回答让我笑翻


640?wx_fmt=jpeg

640?wx_fmt=gif点击“阅读原文”,查看原文

640?wx_fmt=png喜欢就点击“好看”吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/525025.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

手把手教你二维数组打印

package com.wuming.struct;public class Demo13 {//多维数组&#xff1a;特殊的以为数组//二维数组&#xff1a;int a[][]new int[a][b],当成一维数组打印public static void main(String[] args) {int[][] array{{1,2},{2,3},{3,4},{4,5}};for (int i 0; i < array.lengt…

BugkuCTF-MISC题蜜雪冰城~

看txt&#xff0c;里面只有(0, 0, 0)和(255, 255, 255)&#xff0c;(0, 0, 0)是黑色&#xff0c;替换成1&#xff0c;(255, 255, 255)是白色&#xff0c;替换成0。 脚本&#xff1a; with open("你爱我呀我爱你.txt",) as f:with open("binary.txt",w) as…

你好,请查收这封元旦祝福,CSDN云计算改版啦!

戳蓝字“CSDN云计算”关注我们哦&#xff01;◆ ◆ ◆ ◆2019新年快乐HAPPY NEW YEAR此时是2019年1月1日站在新一年的起跑线上最暖心的鼓励让2019更精彩祝福中&#xff0c;你步伐坚定&#xff0c;走向远方 ◆ ◆ ◆ ◆元旦快乐CSDN云计算的粉丝们&#xff1a;好消息&#xff01…

Arrays类详细讲解

package com.wuming.struct;import java.util.Arrays;public class Demo14 {public static void main(String[] args) {//Arrays数组类&#xff0c;操作数组&#xff1a;排序、搜索等int[] a{1,2,3,4,9090,31231,543,21,3,23};System.out.println("System.out.println(a);…

C语言 数组定义和使用 - C语言零基础入门教程

目录 一.数组简介二.定义数组并初始化 1.定义数组2.初始化数组 三.访问数组四.修改数组五.猜你喜欢 零基础 C/C 学习路线推荐 : C/C 学习目录 >> C 语言基础入门 一.数组简介 在 C 语言中&#xff0c;一组数据的集合称为数组 Array &#xff0c;其实前面我们已经学习过…

BugkuCTF-MISC题普通的二维码

考点在八进制转字符串 下载文件file.zip解压得到一张二维码&#xff0c;扫描没有flag 通过010editor打开&#xff0c;在尾部有一串数字 字符串为&#xff1a; 14615414114717311014116614513717106012513712017113716314316215116016413711716414313712415713712414515613710…

C语言 数组遍历 - C语言零基础入门教程

目录 一.数组遍历原理二.数组遍历实战 1.遍历数组查询数组中的元素2.遍历数组修改数组中的元素 三.猜你喜欢 零基础 C/C 学习路线推荐 : C/C 学习目录 >> C 语言基础入门 一.数组遍历原理 在 C / C 数组定义和初始化中详细的介绍了关于数组五种初始化方法&#xff0c;这…

2018 疯狂微服务之死

戳蓝字“CSDN云计算”关注我们哦&#xff01;近期微服务的话题非常火爆&#xff0c;有时可谓非常“疯狂”&#xff1a;Netflix 在 devops 上做得很棒&#xff0c;同时 Netfix 也采用微服务。因此&#xff1a;如果我也用微服务&#xff0c;那么我也可以在 devops 方面做得很好。…

BugkuCTF-MISC题怀疑人生

补充&#xff1a;掩码爆破 字掩码爆破 所以选择数字&#xff0c;打三个英文问号&#xff0c;如果知道几位比如知道掩码是meimei后面是三个但是不知道&#xff0c;就写meimei??? 解题流程 下载文件file.zip 解压出三个文件 ctf1.zip&#xff0c;ctf2.zip&#xff0c;ctf3.…

冒泡排序之详细讲解

package com.wuming.struct;import java.util.Arrays;public class Demo17 {public static void main(String[] args) {int[] a{42,53,664,7,77,334,755,22};int[] sortsort(a);//调用完自己写的排序方法后&#xff0c;返回一个数组System.out.println(sort);System.out.printl…

有问有答 | 分布式服务框架精华问答

戳蓝字“CSDN云计算”关注我们哦&#xff01;随着社会的发展&#xff0c;技术的进步&#xff0c;以前的大型机架构由于高成本、难维护等原因渐渐地变得不再主流&#xff0c;替代它的就是当下最火的分布式架构。要说分布式架构有多重要&#xff0c;可以说如果你不了解“分布式”…

C语言 数组排序 – 冒泡法排序 - C语言零基础入门教程

目录 一.简介二.数组冒泡法排序原理三.数组冒泡法排序实战四.猜你喜欢 零基础 C/C 学习路线推荐 : C/C 学习目录 >> C 语言基础入门 一.简介 经过前面的学习&#xff0c;我们已经学会了数组遍历&#xff0c;在开发中&#xff0c;我们经常回碰到对数组进行排序&#xff…

BugkuCTF-MISC题赛博朋克

下载文件file.zip&#xff0c;打开发现出错&#xff0c;查看是否为伪加密&#xff0c;以010editor打开搜索504B0102 处起第9&#xff0c;10个字节为0000的为伪加密&#xff0c;若改后仍不能打开为真加密 改为0000后可以打开&#xff0c;解压后得到一个文件cyberpunk.txt&#…

面向对象讲解

定义&#xff1a;以类的方式组织代码&#xff0c;以对象的方式封装数据 对象是具体的事物&#xff0c;类是抽象的。

云要闻 | 腾讯在华南建云计算基地;致敬Larry Roberts;华云数据在无锡拿了一个奖!...

戳蓝字“CSDN云计算”关注我们哦&#xff01;Hello&#xff0c;everyone&#xff1a;1月2日&#xff0c;星期三CSDN云要闻时间&#xff1a;嗨&#xff0c;大家好&#xff0c;偶是“CSDN 云计算”微信公众号新晋成员一枚&#xff0c;人称“要闻君”。2019年刚一露头儿&#xff0…

C语言 数组排序 – 选择法排序 - C语言零基础入门教程

目录 一.简介二.数组选择法排序原理三.数组选择法排序实战四.猜你喜欢 零基础 C/C 学习路线推荐 : C/C 学习目录 >> C 语言基础入门 一.简介 经过前面的学习&#xff0c;我们已经学会了数组遍历&#xff0c;在开发中&#xff0c;我们经常回碰到对数组进行排序&#xff…

史上最详细的值传递和引用传递之间区别

package com.wuming.oop; //值传递 public class Demo04 {public static void main(String[] args) {int a1;System.out.println(a);//1Demo04.change(a);System.out.println(a);//1}//返回值为空public static void change(int a) {a10;} }1 1 package com.wuming.oop; //引用…

BugkuCTF-MISC题三色绘恋

打开压缩包出错 通过winrar可解压出图片 下载文件后是个压缩包&#xff0c;要密码&#xff0c;但是没有任何信息&#xff0c;怀疑是伪加密。010打开 0900改为0000取消加密 后可以解压&#xff0c;得到一张图片。 拿到jpg图片binwalk看下发现zip文件foremost分离一下&#xf…

有问有答 | Storm技术内幕与实践精华问答

戳蓝字“CSDN云计算”关注我们哦&#xff01;Storm是Twitter开源的分布式实时大数据处理框架&#xff0c;被业界称为实时版Hadoop。 随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍&#xff0c;比如网站统计、推荐系统、预警系统、金融系统等&#xff0c; 大数据实时处理…

C语言 数组排序 – 插入法排序 - C语言零基础入门教程

目录 一.简介二.数组插入法排序原理三.数组插入法排序实战四.猜你喜欢 零基础 C/C 学习路线推荐 : C/C 学习目录 >> C 语言基础入门 一.简介 经过前面的学习&#xff0c;我们已经学会了数组遍历&#xff0c;在开发中&#xff0c;我们经常回碰到对数组进行排序&#xff…