hadoop 卡主_HDFS DisTCP执行卡住了,怎么办?

背景

我们在进行两个集群间数据同步的时候,使用的是hdfs的distcp的方式进行跨集群跨版本的数据同步,但是在执行hdfs distcp 命令时,发现在运行到 with build listing处就卡住了 .

具体问题如下图:

针对问题解决,中间我们试过了哪些办法

1 首先查看hdfs本身服务状态是否正常,get命令是否可用? 这里我们尝试使用get的方式从源集群中下载一个文件来进行测试, hadoop fs -get hdfs://namenode:8020 . 以及使用cp命令是否也是可用的? Hadoop fs -cp hdfs://namenode:8020 hdfs://namenode:8020/ 结果发现get命令和cp命令都是没有问题的,那么这里其实就证明一方面hdfs服务本身是没有问题的,另一方面是网络是通的,不是网络原因.

2 检查yarn application 并没有启动yarn任务,也就是mr任务就没有执行,那么这里我们可以试验一下正常的提交一个mr任务看看是否能够正常的在yarn上面running起来.

执行任务报下面的异常信息:

3 我们查找集群中mapreduce.task.io.sort.mb的设置值为4096,这个配置的意思大概是

“在排序文件时使用的缓冲内存的总量,以兆字节为单位”。有人可能已经为每个任务使用大量内存的应用程序全局设置了该值。在删除该配置(并使用其默认值100)之后,DistCp就可以工作了。

mapreduce.task.io.sort.mb的问题根本分析

MapTask.MapOutputBuffer使用byte[] 大小的数组来实现缓冲区mapreduce.task.io.sort.mb,在分配数组之前检查大小是否正确。问题是Java数组不能有超过2^31 - 1的元素(即使是64位JVM),这是Java语言专门化本身的一个限制。这意味着配置mapreduce.task.io.sort。mb实际上被限制为<= 2047。指定值4096对每个任务占用大量内存的应用程序没有帮助,相反,它会破坏所有MapReduce应用程序

但是由于这个原因,distcp并不会有任何的失败提示,它在SortPass.run()方法的内部循环中不断重试sort传递,所以会一直卡住..

希望本文对你有帮助!

感谢关注“码农星球”。本文版权属于“码农星球”。我们提供咨询和培训服务,关于本文有任何困惑,请关注并联系我们。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/337044.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

spring javafx_Oracle Spring Clean JavaFX应该吗?

spring javafx我们确实在Codename One上依赖JavaFX&#xff0c;我们的模拟器需要它。 我们的桌面版本使用它&#xff0c;而我们的设计器工具基于Swing。 我们希望它成功&#xff0c;这对我们的业务至关重要&#xff01; 即使您是Java EE开发人员并且不关心桌面编程&#xff0c;…

哪些著名软件是用C、C++编写的?

点击蓝字关注我们因公众号更改推送规则&#xff0c;请点“在看”并加“星标”第一时间获取精彩技术分享来源于网络&#xff0c;侵删经常跟大家谈论C/C是多么的厉害&#xff0c;但总是耳听为虚&#xff0c;还需眼见为实&#xff0c;那如何做到眼见为实呢&#xff1f;当然还是要从…

tomcat截取日志_Tomcat的日志分割三种方法

一、Tomcat的日志分割三种方法一、方法一&#xff1a;用cronolog分割tomcat的catalina.out文件1、编译安装cronologwget http://cronolog.org/download/cronolog-1.6.2.tar.gztar zxvf cronolog-1.6.2.tar.gzcd cronolog-1.6.2./configuremake && make install2、查看c…

java ee 下版本_将旧版本从Java EE 5减少到7

java ee 下版本Java EE 5于2005年首次引入&#xff0c;而Java EE 7于2013年问世。这两个版本之间存在7年的差距&#xff0c;从技术角度来说&#xff0c;这就像一个世纪。 许多组织仍然对使用Java EE 5感到困惑&#xff0c;并且有很多正当的理由选择不升级。 不过&#xff0c;如…

哪款 Linux 才是更好的 CentOS 替代品?

点击蓝字关注我们因公众号更改推送规则&#xff0c;请点“在看”并加“星标”第一时间获取精彩技术分享来源于网络&#xff0c;侵删AlmaLinux 是基于 RHEL 的企业级 Linux 发行版。以下是选择 AlmaLinux 作为 CentOS 替代方案的一些原因。CentOS 将于 2024 年 6 月到期。截至 2…

android uinput 按键_android 使用uinput模拟输入设备的方法

在google remote中&#xff0c;android接收端接收socket发来的IR CODE&#xff0c;然后将IR CODE模拟出来发给系统处理&#xff0c;这就是google remote接收端的原理。系统端怎样模拟input event呢&#xff1f;方法一&#xff1a;通过Instrumentation.sendKeyDownUpSync 实现&a…

绩效从C到S,分享渣渣程序员逆袭秘诀!

点击蓝字关注我们因公众号更改推送规则&#xff0c;请点“在看”并加“星标”第一时间获取精彩技术分享来源于网络&#xff0c;侵删绩效面谈结束&#xff0c;从会议室出来&#xff0c;有一种不真实的感觉——这个季度我竟然拿了S&#xff1f;&#xff01;要知道&#xff0c;上个…

海贼王为什么画风突变_什么是突变测试?

海贼王为什么画风突变最近&#xff0c;我再三提到突变测试一词。 因为可以说这种方法能够以超出代码覆盖范围的方式检测测试安全网的空白&#xff0c;所以我花了一些时间来追赶这个话题并尝试一下。 这篇文章总结了我的发现&#xff0c;作为对该主题的快速介绍。 什么是变异测…

C语言 #define 与 typedef 的区别与用法

点击蓝字关注我们因公众号更改推送规则&#xff0c;请点“在看”并加“星标”第一时间获取精彩技术分享来源于网络&#xff0c;侵删在C语言编程中&#xff0c;typedef 和 #define是最常用语句&#xff0c;可能很多工作过几年的工程师都没有去深究过它们的一些用法和区别。typed…

spring总结_Spring综合课程总结

spring总结本文是我们名为“ EAI的Spring集成 ”的学院课程的一部分。 在本课程中&#xff0c;向您介绍了企业应用程序集成模式以及Spring Integration如何解决它们。 接下来&#xff0c;您将深入研究Spring Integration的基础知识&#xff0c;例如通道&#xff0c;转换器和适…

合工大850参考书_合肥工业大学计算机考研850上岸经验分享

转载于 王道论坛 原作者 欲把西湖比西子 链接经验杂谈专业课考研&#xff0c;我个人认为主要还是考察基本的概念&#xff0c;以教材为主&#xff0c;教材就是圣经。不可否认&#xff0c;教材是枯燥的&#xff0c;尤其像数据结构这样的课程&#xff0c;比较抽象&#xff0c;就算…

硬核!400 行代码实现一个虚拟机

点击蓝字关注我们因公众号更改推送规则&#xff0c;请点“在看”并加“星标”第一时间获取精彩技术分享来源于网络&#xff0c;侵删我们都知道理工科类的大学专业&#xff0c;一般都会在大一选择教授 C 语言作为编程入门语言&#xff0c;我最初接触编程也是入的 C 语言的坑。课…

23种设计模式简介_设计模式简介

23种设计模式简介本文是我们名为“ Java设计模式 ”的学院课程的一部分。 在本课程中&#xff0c;您将深入研究大量的设计模式&#xff0c;并了解如何在Java中实现和利用它们。 您将了解模式如此重要的原因&#xff0c;并了解何时以及如何应用模式中的每一个。 在这里查看 &am…

python实现api接口的脚本_Zabbix批量添加主机,Python调用api接口方式【脚本定制】...

使用说明&#xff1a;此脚本使用方法&#xff0c;详细步骤如下(不清楚的可以加我微信或QQ咨询)脚本默认添加内容如excel模板所示&#xff1a;主机名、显示名、IP地址、所属组、所属模板1、所属模板2(如需要添加其他内容如: 多个所属组、多个模板、DNS、SNMP等&#xff0c;可联系…

Spring集成基础知识

本文是我们名为“ EAI的Spring集成 ”的学院课程的一部分。 在本课程中&#xff0c;向您介绍了企业应用程序集成模式以及Spring Integration如何解决它们。 接下来&#xff0c;您将深入研究Spring Integration的基础知识&#xff0c;例如通道&#xff0c;转换器和适配器。 在这…

C++最佳实践 | 工具

点击蓝字关注我们因公众号更改推送规则&#xff0c;请点“在看”并加“星标”第一时间获取精彩技术分享来源于网络&#xff0c;侵删前言C最佳实践: 支持Fork的编码标准文档本文档旨在收集对C最佳实践所进行的协作性讨论&#xff0c;是《Effective C》(Meyers) 和《C Coding Sta…

python resize_Python resize

最新项目flask扩展&#xff0c;用于自动调整代码中图像的大小&#xff0c;以及模板。可以从JPEG PNG SVG转换为JPEG PNG&#xff0c;调整大小以适应和裁剪。提供基于文件和基于s3的存储选项。有关文档&#xff0c;请参见https: ...2020-12-22已阅读: n次django resizer允许动态…

C语言函数返回 1 和返回 0 哪个好?

点击蓝字关注我们因公众号更改推送规则&#xff0c;请点“在看”并加“星标”第一时间获取精彩技术分享来源于网络&#xff0c;侵删基本上&#xff0c;没有人会将大段的C语言代码全部塞入 main() 函数。更好的做法是按照复用率高、耦合性低的原则&#xff0c;尽可能的将代码拆分…

抽象工厂和工厂方法示例_抽象工厂设计模式示例

抽象工厂和工厂方法示例本文是我们名为“ Java设计模式 ”的学院课程的一部分。 在本课程中&#xff0c;您将深入研究大量的设计模式&#xff0c;并了解如何在Java中实现和利用它们。 您将了解模式如此重要的原因&#xff0c;并了解何时以及如何应用模式中的每一个。 在这里查…

人脸识别像素最低_一种低分辨率图像的人脸识别方法与流程

本发明涉及计算机视觉技术领域&#xff0c;更具体地&#xff0c;涉及一种低分辨率图像的人脸识别方法。背景技术&#xff1a;目前最常用的人脸识别算法是基于卷积神经网络(Convolutional Neural Network&#xff0c;CNN)的&#xff0c;CNN由一系列的卷积操作组成&#xff0c;如…