Hadoop3：Yarn的Tool接口案例

一、需求

依然以wordcount案例为基础，进行开发
我们知道，用hadoop自带的example.jar执行wordcount
命令如下

hadoop jar /opt/module/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount -D mapreduce.job.queuename=hive /input /output1

这个命令中，首先，指定方法名参数，然后，指定了队列-D参数，最后，指定输入文件和输出目录。

那么我们自己开发的wc.jar可以这样用吗？

二、测试之前的wc.jar

命令1

hadoop jar wc.jar com.atguigu.mapreduce.wordcount.WordCountDriver wordcount -D mapreduce.job.queuename=hive /input /output1

报错
在这里插入图片描述
命令2

hadoop jar wc.jar com.atguigu.mapreduce.wordcount.WordCountDriver -D mapreduce.job.queuename=hive /input /output1

报错
在这里插入图片描述
可以发现，我们自己开发的jar，不能，像hadoop自带的jar一样，带上其他各种参数。

三、实现Tool接口的jar

WordCount

package com.atguigu.mapreduce.tool;import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.Tool;import java.io.IOException;public class WordCount implements Tool {private Configuration conf;// 核心驱动（conf 需要传入）@Overridepublic int run(String[] args) throws Exception {Job job = Job.getInstance(conf);job.setJarByClass(WordCountDriver.class);job.setMapperClass(WordCountMapper.class);job.setReducerClass(WordCountReducer.class);job.setMapOutputKeyClass(Text.class);job.setMapOutputValueClass(IntWritable.class);job.setOutputKeyClass(Text.class);job.setOutputValueClass(IntWritable.class);FileInputFormat.setInputPaths(job, new Path(args[0]));FileOutputFormat.setOutputPath(job, new Path(args[1]));return job.waitForCompletion(true) ? 0 : 1;}@Overridepublic void setConf(Configuration conf) {this.conf = conf;}@Overridepublic Configuration getConf() {return conf;}// mapperpublic static class WordCountMapper extends Mapper<LongWritable, Text, Text, IntWritable> {private Text outK = new Text();private IntWritable outV = new IntWritable(1);@Overrideprotected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {// ss  cls// 1 获取一行String line = value.toString();// 2 切割String[] words = line.split(" ");// 3 循环遍历写出for (String word : words) {outK.set(word);context.write(outK, outV);}}}// reducerpublic static class WordCountReducer extends Reducer<Text, IntWritable, Text, IntWritable> {private IntWritable outV = new IntWritable();@Overrideprotected void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {int sum = 0;for (IntWritable value : values) {sum += value.get();}outV.set(sum);context.write(key, outV);}}
}

WordCountDriver

package com.atguigu.mapreduce.tool;import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;import java.util.Arrays;public class WordCountDriver {private static Tool tool;public static void main(String[] args) throws Exception {// 创建配置Configuration conf = new Configuration();switch (args[0]){case "wordcount":tool = new WordCount();break;default:throw new RuntimeException("no such tool "+ args[0]);}// 执行程序int run = ToolRunner.run(conf, tool, Arrays.copyOfRange(args, 1, args.length));System.exit(run);}
}

测试命令

hadoop jar wc.jar com.atguigu.mapreduce.tool.WordCountDriver wordcount -D mapreduce.job.queuename=hive /input /output1

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/pingmian/39334.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Hadoop3：Yarn的Tool接口案例

一、需求

二、测试之前的wc.jar

三、实现Tool接口的jar

相关文章

Python编程中的10个令人捧腹的常见错误实例

Python高级编程：强化学习基础

代码随想录算法训练营第五十六天|KMC98 所有可达路径

Linux服务器集群搭建

如何选择品牌推广公司？哪家好？收费标准及评价！

深度探索“目录名称无效“：原因、解决方案与最佳实践

Windows下快速安装Open3D-0.18.0(python版本)详细教程

Android原生与flutter模块交互

无法下载 https://mirrors./ubuntu/dists/bionic/main/binary-arm64/Packages

Echarts-饼图

springboot数字化医院产科系统源码

VMware Mac/Win 虚拟机软件介绍

轻松创建对象——简单工厂模式（Python实现）

2024年创业新商机组合拳“消费增值+二二复制”引流拓客新思路

MySQL生成日期维度表

怎样恢复数据？电脑数据恢复方法详解！

数据文件传输连接超时？镭速教你如何解决！

关于 element-ui el-cascader 数据回显问题的解决方案

【操作系统】进程管理——线程管理（个人笔记）

零信任沙箱在数据安全领域的意义