MapReduce分析NCDC 年气象数据最低温度与最高温度

MapReduce分析NCDC 年气象数据最低温度与最高温度

news/2025/11/4 2:34:05/文章来源:https://blog.csdn.net/godadream/article/details/81434157

利用hadoop计算技术对采集的气象数据信息进行处理，主要分两个阶段：mapper阶段和reducer阶段，mapper阶段主要是对日志文件进行按行读取并进行字符串截取，reducer阶段对mapper阶段传过来的数据进行大小比较，最终获取每一年中的最高温度。

具体气象数据的格式可以参考：https://blog.csdn.net/lihuinihao/article/details/38315209

1. 首先将eclipse将MaxTemperature项目打成jar包，并将jar包和气象数据拖拽到虚拟机上。本文中分析的是1941-1950十年间的数据信息，分别存在10个文件中。

2. 在hdfs系统中新建一个名为/inputdata_t的安装目录

hdfs dfs -mkdir /inputdata_t

3. 将数据集上传到inputdata_t目录下

hdfs dfs -put ~/桌面/19* /inputdata_t

4. 切换到根目录并对数据进行分析

cd

hadoop jar ~/桌面/MaxTemperature.jar MinTemperature /inputdata_t /output/mintemp

5. 查看结果

hdfs dfs -cat /output/mintemp/part-r-00000

6. 下载至本地

hadoop fs -get /output/mintemp/part-r-00000 /opt/hadoop-2.7.6/tmp/

ls ../tmp/

7. 删除文件

hdfs dfs -rm -r /output/mintemp

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/491420.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

非侵入脑机接口新突破！用意念控制光标，连续追踪效果提升5倍

非侵入脑机接口新突破！用意念控制光标，连续追踪效果提升5倍

来源：智东西看点：CMU研究人员在使用非侵入式脑机接口开发了第一个成功用意念控制的机械臂，展现了连续追踪和跟踪计算机光标的能力。智东西6月23日消息，卡内基梅隆大学与明尼苏达大学的研究人员在非侵入式机器人设备控制领域取得了…

阅读更多...

python用Matplotlib画箭头

python用Matplotlib画箭头

plt.annotate(text,xy(tx0,ty0),xytext(tx1,ty1),arrowpropsdict(arrowstyle"->",connectionstyle"arc3")) 其中，text是在箭头末尾显示的文字，xy是箭头终点坐标，xytext是起点坐标，arrowtypes指定箭头的样…

阅读更多...

python中序列（列表list和元组tuple）的用法

python中序列（列表list和元组tuple）的用法

数据结构是以某种方式（如通过编号）组合起来的数据元素的集合。再python中最基本的数据结构为序列（sequence）。序列中的元素是有序的，索引从0开始，用负索引表示序列末尾元素的位置。 python中常见的序列有两…

阅读更多...

Beta版本测试报告

Beta版本测试报告

请根据团队项目中软件的需求文档、功能规格说明书和技术规格说明书，写出软件的测试计划、测试过程和测试结果，并回答下述问题。 1. 写出团队项目软件的总体测试计划，记录测试过程，给出测试结果，并说明这些测试怎样对软…

阅读更多...

python给多个子图加总标题

python给多个子图加总标题

在画完所有的子图后，加一句 plt.suptitle(Title)

阅读更多...

AI芯片的长征之路：挑战与机遇

AI芯片的长征之路：挑战与机遇

来源： 半导体行业观察前言：笔者有幸受邀在六月初北京举行的首届亚洲AI硬件峰会（AI Hardware Summit Asia）上发表了开幕主题演讲，与全世界的AI硬件专家分享了我对行业的一些看法和想法。演讲以英文形式进行，…

阅读更多...

排名（水题）

排名（水题）

排名 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 19177 Accepted Submission(s): 7033 Problem Description今天的上机考试虽然有实时的Ranklist，但上面的排名只是根据完成的题数排序&#xf…

阅读更多...

make_moons函数

make_moons函数

生成半环形数据 sklearn.datasets.make_moons(n_samples100, shuffleTrue, noiseNone, random_stateNone) 参数： n_samples : 整数型, 可选，默认为100，产生的样本点的数量shuffle : 布尔型，可选填 (默认为True)，是否…

阅读更多...

阿里巴巴罗汉堂发布最关乎人类未来的十大问题

阿里巴巴罗汉堂发布最关乎人类未来的十大问题

来源：中国新闻网中新网杭州6月25日电 (记者魏晞)25日，阿里巴巴倡议成立的罗汉堂发布最关乎人类未来的十大问题。200多位来自全球的顶尖学者、政界、企业界负责人应邀在杭州“西湖论剑”，闭门研讨十大问题，其中包括6位诺贝尔经济学…

阅读更多...

python画图删除上边框和右边框

python画图删除上边框和右边框

import seaborn as sns ... sns.despine();#在画完图之后插入这一句

阅读更多...

iOS - Masonry自动布局

iOS - Masonry自动布局

简介： 相对于官方的NSLayoutConstraints的的过于繁琐和麻烦，Masonry是一个轻量级的布局框架拥有自己的描述语法采用更优雅的链式语法封装自动布局简洁明了并具有高可读性而且同时支持 iOS 和 Max OS X。可以到Masonry-Github下载官方源码Demo安装&…

阅读更多...

Python中的字典dict

Python中的字典dict

字典是python中唯一的内置映射类型，其中的值不按顺序排列，而是存储在键下。键不可修改且不能重复的，所以其可能是数字、字符串或元组，而不可能是list。字典中键-值对被称为项（item），其语法如下&…

阅读更多...

Drive.ai轰然倒下：曾估值两亿，吴恩达夫妇站台，苹果将接盘部分可用技术人才...

Drive.ai轰然倒下：曾估值两亿，吴恩达夫妇站台，苹果将接盘部分可用技术人才...

来源：大数据文摘曾经估值两个亿美元，吴恩达夫妇亲自站台，风极一时的无人车创业公司Drive.ai轰然倒塌。本月20日，总部位于加州山景城的 Drive.ai 公司被证实已经向一家州政府机构递交了通知，表明即将关闭，并…

阅读更多...

PyMC3实现贝叶斯神经网络

PyMC3实现贝叶斯神经网络

转自https://blog.csdn.net/jackxu8/article/details/71308390#commentBox 源地址https://docs.pymc.io/notebooks/bayesian_neural_network_advi.html PyMC3中的贝叶斯深网络生成数据产生一个简单的线性不可分的二分类问题的模拟数据。 %matplotlib inline import pymc…

阅读更多...

Dynamics CRM 开启图表的3D效果展示

Dynamics CRM 开启图表的3D效果展示

CRM中的图表在我们的业务场景中用的很多，用户可以根据自己的实际需求来构建图表查看数据。我们平时看到的图表都是平面的，像下图中的这种，那有没有一种方式可以让展示3D效果看起来更立体呢，答案是可以的。这里就以上面的图表为例…

阅读更多...

OpenCV初体验

OpenCV初体验

OpenCV提供了一些实用工具来读取从视频流到摄像机画面的各种各样的图像格式，这些工具都是HighGUI的一部分。下面几个小例子可以让初学者提前体验一下OpenCV的功能。 1. 打开一张图像并且将其显示在屏幕上 #include "stdafx.h" #include <opencv2/ope…

阅读更多...

“CRISPR婴儿”计划疯狂重启顶级科学家们表示无力阻止

“CRISPR婴儿”计划疯狂重启顶级科学家们表示无力阻止

来源： 生物通新的“CRISPR婴儿”计划启动，顶级科学人士感到震惊，却表示他们无力阻止它6月10日，俄罗斯分子生物学家Denis Rebrikov表示计划开展基因编辑婴儿实验，并公开了他将跨越“红线”的研究计划。两位有影响力的学…

阅读更多...

写一些脚本的心得总结系列第3篇------同步数据到其他表

写一些脚本的心得总结系列第3篇------同步数据到其他表

3.同步数据到其他表的。这种又分插入和更新字段两种情况，除了sql方面的逻辑外，要考虑记录执行sql和变化前后数据记录。总是要做最坏的打算，一旦更新错了还能回滚数据。比如在更新之前先记录被更新的数据记录到某表（新建表&#…

阅读更多...

PyMC3和Lasagne构建神经网络(ANN)和卷积神经网络(CNN)

PyMC3和Lasagne构建神经网络(ANN)和卷积神经网络(CNN)

转自http://www.sohu.com/a/162460147_505915 源地址https://twiecki.io/blog/2016/07/05/bayesian-deep-learning/ 今天，我们将使用Lasagne构建一个更有趣的模型，这是一个灵活的Theano图书馆，用于构建各种类型的神经网络。你可能知道&…

阅读更多...

OpenCV高斯滤波GaussianBlur

OpenCV高斯滤波GaussianBlur

图像处理中，常用的滤波算法有均值滤波、中值滤波以及高斯滤波等。三种滤波器的对比滤波器种类基本原理特点均值滤波使用模板内所有像素的平均值代替模板中心像素灰度值易收到噪声的干扰，不能完全消除噪声，只能相对减弱噪声中值滤波计算模板内…

阅读更多...

最新文章