大数据中的分布式文件系统MapReduce的选择题

一 . 选择题

一. 单选题(共9题,49.5分)

  1. (单选题)下列传统并行计算框架,说法错误的是哪一项?
    A. 刀片服务器、高速网、SAN,价格贵,扩展性差上
    B. 共享式(共享内存/共享存储),容错性好
    C. 编程难度高
    D. 实时、细粒度计算、计算密集型
    正确答案: B:共享式(共享内存/共享存储),容错性好;
    5.5分
  2. (单选题)下列关于MapReduce模型的描述,错误的是哪一项?
    A. MapReduce采用“ 分而治之”策略
    B. MapReduce设计的一个理念就是“ 计算向数据靠拢”
    C. MapReduce框架采用了Master/Slave架构
    D. MapReduce应用程序只能用Java来写
    正确答案: D:MapReduce应用程序只能用Java来写;
    5.5分
  3. (单选题)MapReduce1.0的体系结构中,JobTracker是主要任务是什么?
    A. 负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况
    B. 使用“slot”等量划分本节点上的资源量(CPU、内存等)
    C. 会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给TaskTracker
    D. 会跟踪任务的执行进度、资源使用量等信息,并将这些信息告诉任务(Task)
    正确答案: A:负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况;
    5.5分
  4. (单选题)下列关于MapReduce工作流程,哪个描述是正确的?
    A. 所有的数据交换都是通过MapReduce框架自身去实现的
    B. 不同的Map任务之间会进行通信
    C. 不同的Reduce任务之间可以发生信息交换
    D. 用户可以显式地从一台机器向另一台机器发送消息
    正确答案: A:所有的数据交换都是通过MapReduce框架自身去实现的;
    5.5分
  5. (单选题)下列关于MapReduce的说法,哪个描述是错误的?
    A. MapReduce具有广泛的应用,比如关系代数运算、分组与聚合运算等
    B. MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数
    C. 编程人员在不会分布式并行编程的情况下,也可以很容易将自己的程序运行在分布式系统上,完成海量数据集的计算
    D. 不同的Map任务之间可以进行通信
    正确答案: D:不同的Map任务之间可以进行通信;
    5.5分
  6. (单选题)下列关于Map和Reduce函数的描述,哪个是错误的?
    A. Map将小数据集进一步解析成一批<key,value>对,输入Map函数中进行处理
    B. Map每一个输入的<k 1 ,v 1 >会输出一批<k 2 ,v 2 >。<k 2 ,v 2 >是计算的中间结果
    C. Reduce输入的中间结果<k 2 ,List(v 2 )>中的List(v 2 )表示是一批属于不同k 2 的value
    D. Reduce输入的中间结果<k 2 ,List(v 2 )>中的List(v 2 )表示是一批属于同一个k 2 的value
    正确答案: C:Reduce输入的中间结果<k 2 ,List(v 2 )>中的List(v 2 )表示是一批属于不同k 2 的value;
    5.5分
  7. (单选题)下面哪一项不是MapReduce体系结构主要部分?
    A. Client
    B. JobTracker
    C. TaskTracker以及Task
    D. Job
    正确答案: A:Client;
  8. (单选题)关于MapReduce1.0的体系结构的描述,下列说法错误的是?
    A. Task 分为Map Task 和Reduce Task 两种,分别由JobTracker 和TaskTracker 启动
    B. slot 分为Map slot 和Reduce slot 两种,分别供MapTask 和Reduce Task 使用
    C. TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等)
    D. TaskTracker 会周期性接收JobTracker 发送过来的命令并执行相应的操作(如启动新任务、杀死任务等)
    正确答案: A:Task 分为Map Task 和Reduce Task 两种,分别由JobTracker 和TaskTracker 启动;
    5.5分
  9. (单选题)下列说法错误的是?
    A. Hadoop MapReduce是MapReduce的开源实现,后者比前者使用门槛低很多
    B. MapReduce采用非共享式架构,容错性好
    C. MapReduce主要用于批处理、实时、计算密集型应用
    D. MapReduce采用“ 分而治之”策略
    正确答案: C:MapReduce主要用于批处理、实时、计算密集型应用;
    二. 多选题(共9题,50.5分)
  10. (多选题)MapReduce相较于传统的并行计算框架有什么优势?
    A. 非共享式,容错性好
    B. 普通PC机,便宜,扩展性好
    C. 编程简单,只要告诉MapReduce做什么即可
    D. 批处理、非实时、数据密集型
    正确答案: ABCD:非共享式,容错性好; 普通PC机,便宜,扩展性好; 编程简单,只要告诉MapReduce做什么即可; 批处理、非实时、数据密集型;
    2.8分
  11. (多选题)MapReduce体系结构主要由以下那几个部分构成?
    A. Client
    B. JobTracker
    C. TaskTracker
    D. Task
    正确答案: ABCD:Client; JobTracker; TaskTracker; Task;
    5.5分
  12. (多选题)下列关于MapReduce的体系结构的描述,说法正确的有?
    A. 用户编写的MapReduce程序通过Client提交到JobTracker端
    B. JobTracker负责资源监控和作业调度
    C. TaskTracker监控所有TaskTracker与Job的健康状况
    D. TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等)
    正确答案: ABD:用户编写的MapReduce程序通过Client提交到JobTracker端; JobTracker负责资源监控和作业调度; TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等);
    5.5分
  13. (多选题)MapReduce的作业主要包括什么?
    A. 从磁盘或从网络读取数据,即IO密集工作
    B. 计算数据,即CPU密集工作
    C. 针对不同的工作节点选择合适硬件类型
    D. 负责协调集群中的数据存储
    正确答案: AB:从磁盘或从网络读取数据,即IO密集工作; 计算数据,即CPU密集工作;
    5.5分
  14. (多选题)对于MapReduce 而言,其处理单位是split。split 是一个逻辑概念,它包含哪些元数据信息?
    A. 数据起始位置
    B. 数据长度
    C. 数据所在节点
    D. 数据大小
    正确答案: AB:数据起始位置; 数据长度;
  15. (多选题)下列关于Map 端的Shuffle的描述,哪些是正确的?
    A. MapReduce默认为每个Map任务分配1000MB缓存
    B. 多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的
    C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
    D. 每个Map任务分配多个缓存,使得任务运行更有效率
    正确答案: BC:多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的; 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce;
    5.5分
  16. (多选题)MapReduce的具体应用包括哪些?
    A. 关系代数运算(选择、投影、并、交、差、连接)
    B. 分组与聚合运算
    C. 矩阵-向量乘法
    D. 矩阵乘法
    正确答案: ABCD:关系代数运算(选择、投影、并、交、差、连接); 分组与聚合运算; 矩阵-向量乘法; 矩阵乘法;
    5.5分
  17. (多选题)MapReduce执行的全过程包括以下哪几个主要阶段?
    A. 从分布式文件系统读入数据
    B. 执行Map任务输出中间结果
    C. 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
    D. 执行Reduce任务得到最终结果并写入分布式文件系统
    正确答案: ABCD:从分布式文件系统读入数据; 执行Map任务输出中间结果; 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务; 执行Reduce任务得到最终结果并写入分布式文件系统;
    5.5分
  18. (多选题)下列说法正确的是?
    A. MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task
    B. Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动
    C. 在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的
    D. 在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息
    正确答案: ABCD:MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task; Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动; 在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的; 在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/134533.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

webpack 的 Loader 和 Plugin 的区别,常见的 loader 和 plugin 有哪些?

结论先行&#xff1a; 1、 Loader 和 Plugin 的区别 Loader 也叫做就是“加载器”&#xff0c;因为 webpack 原生只能解析 js 文件&#xff0c;而对于其他类型文件&#xff0c;则需要借助 loader。所以 loader 的作用就是实现对不同格式文件的解析和处理&#xff0c;例如把 E…

使用PCtoLCD2002提取字模

“模式”---“字符模式” LCD显示&#xff0c;汉字使用宋体还是比较好的&#xff0c;16*16是长、宽都是16个像素显示。

Lavarel异步队列的使用

系统为window 启动队列&#xff1a; php artisan queue:listen设置队列类 .env文件需设置&#xff1a;QUEUE_CONNECTIONredis <?phpnamespace App\Jobs;use Illuminate\Bus\Queueable; use Illuminate\Contracts\Queue\ShouldQueue; use Illuminate\Foundation\Bus\Disp…

Spark Core

Spark Core 本文来自 B站 黑马程序员 - Spark教程 &#xff1a;原地址 第一章 RDD详解 1.1 为什么需要RDD 分布式计算需要 分区控制shuffle控制数据存储、序列化、发送数据计算API等一系列功能 这些功能&#xff0c;不能简单的通过Python内置的本地集合对象&#xff08;如…

gitlab 设置 分支只读

一&#xff0c;设置master分支只读&#xff0c; 并且只有Maintainers 拥有合并权限。 二&#xff0c;设置成员权限 改为developer 三&#xff0c;邀请成员 点击右上角 Invite Members

冒泡排序算法的四种实现方式:C、C++、Java和Python

下面是冒泡排序算法的四种实现方式&#xff1a;C、C、Java和Python。 C语言实现&#xff1a; #include <stdio.h>void bubbleSort(int arr[], int n) {for (int i 0; i < n - 1; i) {for (int j 0; j < n - i - 1; j) {if (arr[j] > arr[j 1]) {int temp …

AVS3:双向梯度修正BGC

双向梯度修正&#xff08;Bi-directional Gradient Correction&#xff0c;BGC&#xff09;是利用双向参考块间的差值对预测值进行修正的技术。 BGC仅用于双向预测CU&#xff0c;设两个方向得到的单向预测值分别为pred0和pred1&#xff0c;修正前的双向预测值为predBI&#xf…

web —— html

Web —— css基础 1. HTML2. 基本HTML结构3. HTML常用标签3.1 文本相关标签3.2 HTML图像标签3.3 HTML超链接标签3.4 HTML表&#xff0c;单3.4.1 HTML表格3.4.2 HTML表单&#xff0c;输入框&#xff08;多选框&#xff0c;单选框&#xff09;下拉框 3.5 HTML分区标签3.5.1 div标…

LeetCode-94. 二叉树的中序遍历(C++)

目录捏 一、题目描述二、示例与提示三、思路四、代码 一、题目描述 给定一个二叉树的根节点 root &#xff0c;返回 它的 中序 遍历 。 二、示例与提示 示例 1&#xff1a; 输入&#xff1a; root [1,null,2,3] 输出&#xff1a; [1,3,2] 示例 2&#xff1a; 输入&#xf…

大数据毕业设计选题推荐-营业厅营业效能监控平台-Hadoop-Spark-Hive

✨作者主页&#xff1a;IT毕设梦工厂✨ 个人简介&#xff1a;曾从事计算机专业培训教学&#xff0c;擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Py…

初识Java 17-2 反射

目录 转型前检查 构建例子&#xff1a;生成层次结构 优化Creator&#xff1a;使用类字面量 优化PetCounter&#xff1a;动态验证类型 更通用的递归计数 注册工厂 本笔记参考自&#xff1a; 《On Java 中文版》 转型前检查 当我们使用传统的类型转换&#xff0c;例如&…

Java封装BufferedImage与base64互转方法

一、BufferedImage转base64 /*** BufferedImage 编码转换为 base64* param bufferedImage* return*/private static String BufferedImageToBase64(BufferedImage bufferedImage) {ByteArrayOutputStream bao new ByteArrayOutputStream();//io流try {ImageIO.write(buffered…

【系统架构设计】架构核心知识: 5 系统安全性与保密性设计

目录 一 信息安全基础 1 信息安全的基本要素 2 信息安全的范围 3 网络安全

支付卡行业(PCI)PIN安全要求和测试程序 7个控制目标、33个要求及规范性附录ABC 密钥注入-PCI认证-安全行业基础篇4

概述 用于在ATM和POS终端进行在线和离线支付卡交易处理期间&#xff0c;对个人身份号码&#xff08;PIN&#xff09;数据进行安全管理、处理和传输。 该标准具体包括 7 个控制目标和 33 个安全要求&#xff0c; 标准的结构分为标准主体部分&#xff0c;标准附录&#xff08;N…

windows查看端口号占用,并杀死进程

1、查看所有运行的端口&#xff1a; netstat -ano 2、查看被占用端口对应的 PID netstat -aon|findstr "8081" 回车执行该命令&#xff0c;最后一串数字就是 PID进程号, 这里是 19232。 3、查看指定 PID 的进程 tasklist|findstr "19232" 回车执行该…

[NLP] 使用Llama.cpp和LangChain在CPU上使用大模型

一 准备工作 下面是构建这个应用程序时将使用的软件工具: 1.Llama-cpp-python 下载llama-cpp, llama-cpp-python [NLP] Llama2模型运行在Mac机器-CSDN博客 2、LangChain LangChain是一个提供了一组广泛的集成和数据连接器&#xff0c;允许我们链接和编排不同的模块。可以常…

Ubuntu websocket程序

转自&#xff1a;C/C编程&#xff1a;WebSocketpp&#xff08;Linux Clion boostAsio&#xff09;_websocket-CSDN博客 目前自己使用的&#xff1a; #include <functional> #include <mutex> #include <set> #include <thread>#include <websock…

vue sass-loader,webpack安装卸载操作命令

检查 node-sass 的可用版本&#xff1a;运行下面的命令&#xff0c;查看 node-sass 的可用版本列表。 查看 npm view node-sass versions卸载 npm uninstall node-sass安装指定版本 npm install node-sass4.14.1安装最新版本 npm install sass-loaderlatest如果没有指定特定…

【ARM 安全系列介绍 1 -- 奇偶校验与海明码校验详细介绍】

文章目录 奇偶校验介绍奇偶校验 python 实现奇偶校验C代码实现 海明码详细介绍 奇偶校验介绍 奇偶校验是一种错误检测方法&#xff0c;广泛应用于计算机内部以及数据通信领域。其基本原理是为了使得一组数据&#xff08;通常是一字节8位&#xff09;中的“1”的个数为偶数或奇…

Python实战 | 使用 Python 的日志库(logging)和 pandas 库对日志数据进行分析

专栏集锦&#xff0c;大佬们可以收藏以备不时之需 Spring Cloud实战专栏&#xff1a;https://blog.csdn.net/superdangbo/category_9270827.html Python 实战专栏&#xff1a;https://blog.csdn.net/superdangbo/category_9271194.html Logback 详解专栏&#xff1a;https:/…