大数据技术笔试题库--带答案

一、单选:

1、下列选项中,执行哪一个命令查看Linux系统的IP配置。A

A、ipconfig

B、find

C、ifconfig

D、arp -a

2、在MapReduce程序中,map()函数接收的数据格式是(D)。

A、字符串

B、整型

C、Long

D、键值对

3、下列选项中,关于HDFS的架构说法正确的是(B)。

A、HDFS采用的是主备架构

B、HDFS采用的是主从架构

C、HDFS采用的是从备架构

D、以上说法均错误

4、下列选项中,主要用于决定整个MapReduce程序性能高低的阶段是(D)。

A、MapTask

B、ReduceTask

C、分片、格式化数据源

D、Shuffle

5、下列选项中,用于上传文件的Shell命令是(D)。

A、-ls

B、-mv

C、-cp

D、-put

6、HDFS中的Block默认保存(A)份。

A、3份

B、2份

C、1份

D、不确定

7、下列选项中,若是哪个节点关闭了,就无法访问Hadoop集群(A)。

A、namenode

B、datanode

C、secondary namenode

D、yarn

8、下列选项中,Hadoop2.x版本独有的进程是(C)。

A、JobTracker

B、TaskTracker

C、NodeManager

D、NameNode

9、Hadoop2.0集群服务启动进程中,下列选项不包含的是(B)。

A、NameNode

B、JobTracker

C、DataNode

D、ResourceManager
10、下列选项中,存放Hadoop配置文件的目录是(D)。

A、include

B、bin

C、libexec

D、etc

11、Hadoop1.0中,Hadoop内核的主要组成是(A)。

A、HDFS和MapReduce

B、HDFS和Yarn

C、Yarn

D、MapReduce和Yarn

12、在MapTask的Combine阶段,当处理完所有数据时,MapTask会对所有的临时文件进行一次(B)。

A、分片操作

B、合并操作

C、格式化操作

D、溢写操作

13、一个gzip文件大小75MB,客户端设置Block大小为64MB,占用Block的个数是(B)。

A、1

B、2

C、3

D、4

14、下列选项中,哪一项是研究大数据最重要的意义(D)。

A、分析

B、统计

C、测试

D、预测

15、Hive定义一个自定义函数类时,需要继承以下哪个类?(B)

A、FunctionRegistry

B、UDF

C、MapReduce

16、Hive最重视的性能是可测量性、延展性、(B)和对于输入格式的宽松匹配性。

A、较低恢复性

B、容错性

C、快速查询

D、可处理大量数据

17、在Hadoop的解压目录下,通过执行哪一项指令可以查看Hadoop的目录结构。(B)

A、jps

B、ll

C、tar

D、find

18、下列选项中,关于HDFS说法错误的是(D)。

A、HDFS是Hadoop的核心之一

B、HDFS源于Google的GFS论文

C、HDFS用于存储海量大数据

D、HDFS是用于计算海量大数据

19、按粒度大小的顺序,Hive数据被分为:数据库、数据表、(C)、桶。

A、元祖

B、栏

C、分区

D、行

20、在HDFS中,用于保存数据的节点是(B)。

A、namenode

B、datanode

C、secondaryNode

D、yarn

21、下列哪项通常是集群的最主要的性能瓶颈?( C )

A、CPU

B、网络

C、磁盘

D、内存

22、下列选项中,哪项不是Hive系统架构的组成部分?( C )

A、用户接口

B、跨语言服务

C、HDFS

D、底层驱动引擎

23、Hive查询语言和SQL的一个不同之处在于(C)操作。

A、Group by

B、Join

C、Partition

D、Union

24、Hive加载数据文件到数据表中的关键语法是?( A)

A、LOAD DATA [LOCAL] INPATH filepath [OVERWRITE] INTO TABLE tablename

B、INSERTDATA [LOCAL] INPATH filepath [OVERWRITE] INTO TABLE tablename

C、LOAD DATA INFILE d:\car.csv APPEND INTO TABLE t_car_temp FIELDS TERMINATED BY “,”

D、INSERTDATA [LOCAL] INFILE d:\car.csv APPEND INTO TABLE t_car_temp FIELDS TERMINATED BY “,”

25、下列选项中,哪一个可以对Hadoop集群进行格式化(A)。

A、hadoop namenode -format

B、hadoop namenode -ls

C、hdfs datanode -ls

D、hdfs datanode -format

26、下列选项中,一键启动HDFS集群的指令是(C)。

A、start-namenode.sh

B、start-datanode.sh

C、start-dfs.sh

D、start-slave.sh

27、关于SecondaryNameNode哪项是正确的?( C)

A、它是NameNode的热备

B、它对内存没有要求

C、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间

D、SecondaryNameNode应与NameNode部署到一个节点

28、下列选项中,哪个配置文件可以配置HDFS地址、端口号以及临时文件目录(A)。

A、core-site.xml

B、hdfs-site.xml

C、mapred-site.xml

D、yarn-site.xml

29、下列说法中,关于客户端从HDFS中读取数据的说法错误的是(C)。

A、客户端会选取排序靠前的DataNode来依次读取Block块

B、客户端会把最终读取出来所有的Block块合并成一个完整的最终文件

C、客户端会选取排序靠后的DataNode来依读取Block块

D、如果客户端本身就是DataNode,那么将从本地直接获取数据

30、Hadoop集群启动成功后,用于监控HDFS集群的端口是(D)。

A、50010

B、50075

C、8485

D、50070

31、下列说法不正确的是?( D)

A、数据源是数据仓库的基础,通常包含企业的各种内部信息和外部信息。

B、数据存储及管理是整个数据仓库的核心。

C、OLAP服务器对需要分析的数据按照多维数据模型进行重组、分析,发现数据规律和趋势。

D、前端工具主要功能是将数据可视化展示在前端页面中。

32、下列选项中,用于删除HDFS上文件夹的方法是(A)。

A、delete()

B、rename()

C、mkdirs()

D、copyToLocalFile()

33、每个Map任务都有一个内存缓冲区,默认大小是(C)。

A、128M

B、64M

C、100M

D、32M

34、Hive建表时,数值列的字段类型选取decimal(x,y)与Float、double的区别,下列说法正确的是?( B)

A、decimal(x,y)是整数,Float、double是小数

B、Float、double在进行sum等聚合运算时,会出现JAVA精度问题

C、decimal(x,y)是数值截取函数,Float、double是数据类型

35、下列选项中,关于SSH服务说法正确的是(D)。

A、SSH服务是一种传输协议

B、SSH服务是一种通信协议

C、SSH服务是一种数据包协议

D、SSH服务是一种网络安全协议

36、以下选项中,哪种类型间的转换是不被Hive查询语言所支持的?( D)

A、Double—Number

B、BigInt—Double

C、Int—BigInt

D、String—Double

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1478.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

全国节能宣传周丨物通博联智慧能源解决方案助力节能降碳

今年7月10日至16日,为全国第33个节能宣传周。今年全国节能宣传周活动主题是“节能降碳,你我同行”。 全国节能宣传周活动是在1990年国务院第六次节能办公会议上确定的活动周,开展该活动是实施全面节约战略、开展节能降碳宣传教育、推动形成绿…

Vue3组件间的通信方式

目录 1.props父向子组件通信 2.自定义事件 子向父组件通信 3.全局事件总线 4.v-model组件通信(父子组件数据同步) 绑定单个数据同步 绑定多个数据同步 5.useAttrs组件通信 6.ref与$parent ref获取子组件实例对象 $parent获取父组件实例对象 7.p…

postgresql内核分析 spinlock与lwlock原理与实现机制

​专栏内容: postgresql内核源码分析 手写数据库toadb 并发编程 个人主页:我的主页 座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物. 概述 在postgresql 中,有大量的并发同步&#xff0…

260道网络安全工程师面试题汇总(附答题解析+配套资料)

由于我之前写了不少网络安全技术相关的文章和回答,不少读者朋友知道我是从事网络安全相关的工作,于是经常有人私信问我: 我刚入门网络安全,该怎么学? 想找网络安全工作,应该要怎么进行技术面试准备&…

Oracle删除约束条件不会锁表

最近有个需求要删除一个Oracle约束条件,但是由于不知道会不会锁表,所以测试了一下 使用python写了段代码验证下 import cx_Oracle conn cx_Oracle.connect(dba_li/oracle192.168.56.105:1521/orcl) #用自己的实际数据库用户名、密码、主机ip地址 替…

通过rebase,解决gitlab提示的pipeline failed

之前提交的MQ,提示Pipeline failed: gitlab提交MQ提示Pipeline failed的解决办法_pipeline:failed_柳鲲鹏的博客-CSDN博客 又报错,给的提示: 本以为万事大吉。结果发现自己的库也提示有问题。按照上文的办法修改之后还是不对。…

Java设计模式-责任链(Chain of Responsibility)模式

介绍 Java责任链(Chain of Responsibility)设计模式是指很多处理对象构成一个链,链中前一个对象指向后一个对象。请求在链中传递,一个请求可以被一个或者多个对象处理。调用方(即客户端)不知道请求会被链中…

【C++】C++11 (3): lambda表达式和包装器

一、lambda表达式 C98中的一个例子 在C98中&#xff0c;如果想要对一个数据集合中的元素进行排序&#xff0c;可以使用std::sort方法。 #include <algorithm> #include <functional> int main() {int a[] { 4,1,8,5,3,7,0,9,2,6 };// 默认按照小于比较&#xff…

JS、Vue鼠标拖拽

JS代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content"widthdevic…

每日打卡day8——差分练习

输入一个长度为 n 的整数序列。 接下来输入 m 个操作&#xff0c;每个操作包含三个整数 l,r,c&#xff0c;表示将序列中 [l,r] 之间的每个数加上 c。 请你输出进行完所有操作后的序列。 输入格式 第一行包含两个整数 n 和 m。 第二行包含 n 个整数&#xff0c;表示整数序列…

Go和Java实现观察者模式

Go和Java实现观察者模式 在监控系统中&#xff0c;我们需要采集监控指标的信息&#xff0c;假设当采集的指标信息超过阈值时我们需要对该监控指标持久化到 数据库中并且进行告警。 本文通过指标采集持久化和告警来说明观察者模式的使用&#xff0c;使用Go语言和Java语言实现…

使用Linux Deploy搭建服务器(五)Linux Deploy添加自启动(亲测可用)linuxdeploy自动化配置

添加开机自动任务,可以省去开机后手动输入初始化命令的操作 一、方式1 run-parts方式,也就是rc.local的方式(这种方式有时候不生效,按照4中的配置就好了) 1、Linux Deploy配置 1.点击右下角的设置图标进入设置界面 2.划到“初始化”那块,“启用”打上勾 选项“run-p…

文件包含漏洞

一、什么是文件包含漏洞 1.文件包含漏洞概述 和SQL注入等攻击方式一样&#xff0c;文件包含漏洞也是一种注入型漏洞&#xff0c;其本质就是输入一段用户能够控制的脚本或者代码&#xff0c;并让服务端执行。 什么叫包含呢&#xff1f;以PHP为例&#xff0c;我们常常把可重复使…

基于GIS的生态敏感性评价与产业路径选择研究:以江西省吉安市为例

导读: 确立绿水青山就是金山银山的理念,建立生态经济体系,是新时代生态环境保护与经济发展的协调之道。对产业规划而言,与生态同行,构建绿色产业体系,是推动地区高质量发展的根本要求。鉴于此,文章从实证角度出发,以江西省吉安市为研究对象,采用生态敏感性评价方法,选…

【Python基础】- break和continue语句

在Python中&#xff0c;break和continue是用于控制循环语句的特殊关键字。 break语句用于跳出当前的循环&#xff08;for循环或while循环&#xff09;&#xff0c;并继续执行紧接着的循环外的代码。它通常用于满足某个条件时提前结束循环。例如&#xff0c;考虑以下示例&#…

RabbitMQ 同样的操作一次成功一次失败

RabbitMQ 是一个功能强大的消息队列系统&#xff0c;广泛应用于分布式系统中。然而&#xff0c;我遇到这样的情况&#xff1a;执行同样的操作&#xff0c;一次成功&#xff0c;一次失败。在本篇博文中&#xff0c;我将探讨这个问题的原因&#xff0c;并提供解决方法。 我是在表…

深入理解阻塞与非阻塞、同步与异步

0、前言 阻塞与非阻塞、同步与异步&#xff0c;这几个概念虽然每次看都能看的懂&#xff0c;但是过一段时间又会忘掉&#xff0c;所以系统的整理一下他们的区别&#xff0c;也方便自己后面忘掉的时候快速记忆&#xff0c;虽然网上有很多的说明这些概念的帖子&#xff0c;但是每…

Django dumpdata 迁移数据库数据

Django 迁移数据库数据 数据导出 连接上数据源数据库&#xff0c;执行 dumpdata 导出数据。 python3 manage.py dumpdata main --indent 4 -o mydata.json数据导入 连接上目标数据库&#xff0c;比如通过在 local_settings.py 配置本地数据库&#xff0c;执行 loaddata 导入…

西安丨高时空分辨率、高精度一体化预测技术之风、光、水能源自动化预测技术应用

目录 ​第一章 预测平台讲解及安装 第二章 一体化预测工具详解与数据获取及制备 第三章 风资源预测自动化技术 第四章 太阳能资源自动化预测技术 第五章 水资源自动化预测技术 第六章 后处理自动化技术 更多推荐 能源是国民经济发展和人民生活必须的重要物质基础。在过去…

Linux5.17 Ceph应用

文章目录 计算机系统5G云计算第四章 LINUX Ceph应用一、创建 CephFS 文件系统 MDS 接口1.服务端操作2.客户端操作 二、创建 Ceph 块存储系统 RBD 接口三、创建 Ceph 对象存储系统 RGW 接口四、OSD 故障模拟与恢复 计算机系统 5G云计算 第四章 LINUX Ceph应用 一、创建 CephF…