Hive+Flume+Kafka章节测试六错题总结

题目2:

EXTERNAL关键字的作用?[多选]

A、EXTERNAL关键字可以让用户创建一个外部表
B、创建外部表时,可以不加EXTERNAL关键字
C、通过EXTERNAL创建的外部表只删除元数据,不删除数据
D、不加EXTERNAL的时候,默认创建内部表也叫管理表
【参考答案】: ACD
【您的答案】: ABC

external关键字可以让用户创建一个外部表,在建表的同时可以指定一个指向实际数据的路径(location),在删除表的时候,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删除数据。默认创建的表都是所谓的管理表,有时也被称为内部表。因为这种表,Hive会(或多或少地)控制着数据的生命周期。所以ACD选项是正确的,不加external是内部表,B选项错误。

题目3:

对as和like的描述正确的是?[多选]

A、as可以将查询结果添加到新创建的表中
B、like根据已经存在的表结构创建表
C、as针对数据,like针对结构
D、as和like的作用一样
【参考答案】: ABC
【您的答案】: BC

根据查询结果创建表(查询的结果会添加到新创建的表中)

  • hive (default)>create table if not exists student2 AS select id, name from student;

这个就是将查询结果添加到新创建的表中,所以A选项正确。

题目7:

聚合函数sum()over(…order by cu),中order by描述正确的是? [单选题]

A、只要开窗中如果使用order by ,有累加功能,默认等于UNBOUNDED PRECEDING and current row
B、在聚合函数后,开窗中如果使用order by ,有累加功能,默认等于UNBOUNDED PRECEDING and current row
C、在非聚合函数后,开窗中如果使用order by ,有累加功能,默认等于UNBOUNDED PRECEDING and current row
D、在聚合函数后,开窗中如果无论是否使用order by ,都具有累加功能,默认等于UNBOUNDED PRECEDING and current row
【参考答案】: B
【您的答案】: A

B、在聚合函数后,开窗中如果使用order by,有累加功能,默认等于UNBOUNDED PRECEDING and current row。

在使用聚合函数后,如果在开窗函数中使用ORDER BY子句,它会定义用于计算累积的顺序,通常是按照某个列的值排序。默认情况下,它等同于UNBOUNDED PRECEDING and current row,这意味着对当前行及其之前的所有行进行累加操作。这允许你在窗口中根据指定的排序顺序对聚合函数进行计算。

题目12:

下列关于减少topic的分区数的描述正确的是?[单选题]

A、可以减少,使用命令sub进行移除。
B、可以减少,使用命令alter进行修改。
C、不可以减少,因为是一旦创建就不能改变的。
D、不可以减少,被删除的分区数据难以处理。
【参考答案】: D
【您的答案】: C

D、不可以减少,被删除的分区数据难以处理。

分区数一旦创建后通常是不可以减少的。删除分区会导致删除数据,这些数据难以恢复,因此通常情况下,分区数的减少是不允许的。如果需要减少分区数,通常需要创建一个新的表或数据集来满足新的需求,并迁移数据到新表中,而不是修改现有的分区数。

题目13:

下列关于Exactly Once语义中描述错误的是?[单选题]

A、当ack=-1,可以保证数据不会丢失。
B、当ack=0,可以保证数据不会重复。
C、当ack=1,即可以保证数据不会重复,也可以保证数据不会丢失。
D、幂等性无法保证跨分区跨会话的Exactly Once。
【参考答案】: C
【您的答案】: B

C、当ack=1,只能保证数据不会丢失,但无法保证数据不会重复。A选项,当ack=-1时,默认数据是不会丢失的。B选项,当ack等于0时,数据只会发送一次,不需要等待回复确认,可以保证数据不会重复。D选项,如果生产者中途宕机,然后重新建立会话时,不能保证不同会话时PID是一样,这时候重新发送重复数据时无法保证幂等性。

C选项,只能保证数据不会丢失,不能保证数据不会重复的问题。

题目15:

下列关于kafka 造成数据丢失的场景描述正确的是?[多选题]

A、ack=0时,leader故障有可能丢失数据。
B、ack=1时,在follower同步成功之前leader故障,将会丢失数据。
C、ack=-1时,在follower同步完成后,broker发送ack之前,leader发生故障,可能会丢失数据。
D、ack=-1时,在follower同步完成前,broker发送ack之后,leader发生故障,可能会丢失数据。
【参考答案】: AB
【您的答案】: ABD

ack=-1时,不会丢数据,所以C, D 错误

题目17:

配置Metastore到MySql的说法正确的是? [单选题]

A、默认数据库derby容量太小
B、为了能够实现多窗口启动hive
C、为了使用JDBC的方式连接Hive
D、默认数据库也能实现hive多窗口启动
【参考答案】: B
【您的答案】: C

在某些情况下,为了支持多个Hive客户端同时连接到Hive Metastore,需要将Metastore配置为使用外部数据库,如MySQL。这是因为默认的Derby数据库通常只支持单个连接,这意味着只能有一个Hive客户端会话在同一时间连接到Hive Metastore。通过将Metastore配置为使用外部数据库,可以允许多个Hive客户端并发连接到Metastore,实现多窗口启动Hive。

题目21:

Hive中对Parquet格式描述正确的是?[多选]

A、Parquet文件是以二进制方式存储的,所以是不可以直接读取的
B、文件中包括该文件的数据和元数据,因此Parquet格式文件是自解析的。
C、可以把每一个行组由一个Mapper任务处理,增大任务执行并行度
D、在Parquet中,有三种类型的页:数据页、字典页和索引页
【参考答案】: ABCD
【您的答案】: BC

A选项:Parquet文件是以二进制方式存储的,所以是不可以直接读取的,从某个角度来说不是很准确,是可以读取和解析的,但解释为不可以直接读取也是正确的。

D选项:正确,就是这三种类型。

题目23:

Hive中对本地模式描述正确的是?[多选]

A、Hive可以通过本地模式在单台机器上处理所有的任务
B、对于小数据集,执行时间可以明显被缩短。
C、用户可以通过设置hive.exec.mode.local.auto的值为true,来让Hive在适当的时候自动启动这个优化,默认是false。
D、设置local mr的最大输入数据量,当输入数据量小于这个值时采用local mr的方式,默认为134217728,即128M
【参考答案】: ABCD
【您的答案】: ABD

C选项是正确的,存在该参数,在hive/conf/hive-default.xml.template文件中可以查看到该参数的默认情况,默认为false。

<property><name>hive.exec.mode.local.auto</name><value>false</value><description>Let Hive determine whether to run in local mode automatically</description></property>

题目24:

Hive中对推测执行描述正确的是?[多选]

A、为了避免,一个作业的多个任务之间运行速度不一致,一个慢的任务会拖慢作业的整体执行进度这种情况,Hadoop采用了推测执行(Speculative Execution)机制。
B、根据一定的法则推测出“拖后腿”的任务,并为这样的任务启动一个备份任务,让该任务与原始任务同时处理同一份数据,并最终选用最先成功运行完成任务的计算结果作为最终结果。
C、Hadoop的mapred-site.xml文件中进行配置,mapreduce.map.speculative默认是true
D、hive本身也提供了配置项来控制reduce-side的推测执行:hive.mapred.reduce.tasks.speculative.execution默认是true
【参考答案】: ABCD
【您的答案】: ACD

C 选项,在mapred-default.xml文件总找到了该参数,默认确实为true。

<property><name>mapreduce.map.speculative</name><value>true</value><description>If true, then multiple instances of some map tasksmay be executed in parallel.</description>
</property>

D选项, 在hive/conf/hive-default.xml.template文件中确实存在配置项来控制推测执行,正确。

<property><name>hive.mapred.reduce.tasks.speculative.execution</name><value>true</value><description>Whether speculative execution for reducers should be turned on. </description></property>

题目25:

Hive中对动态分区描述正确的是?[多选]

A、对分区表Insert数据时候,hive自动会根据分区字段的值,将数据插入到相应的分区中,但需要进行相应的配置。
B、开启动态分区功能(默认true,开启)hive.exec.dynamic.partition=true
C、在所有执行MR的节点上,最大一共可以创建多少个动态分区。默认1000
D、整个MR Job中,最大可以创建多少个HDFS文件。默认100000
【参考答案】: ABCD
【您的答案】: ACD
B选项,在hive/conf/hive-default.xml.template文件中可以确定动态分区功能默认是开启的。

<property><name>hive.exec.dynamic.partition</name><value>true</value><description>Whether or not to allow dynamic partitions in DML/DDL.</description></property>

题目26:

Hive中对内外表描述正确的是?[多选]

A、可以通过desc formatted table 来查询表的类型
B、修改内部表xxx为外部表alter table xxx set tblproperties(‘EXTERNAL’=‘TRUE’);
C、修改外部表xxx为内部表alter table xxx set tblproperties(‘EXTERNAL’=‘FALSE’);
D、(‘EXTERNAL’=‘TRUE’)和(‘EXTERNAL’=‘FALSE’)为固定写法,区分大小写
【参考答案】: ABCD
【您的答案】: AD
A、可以通过 desc formatted table 来查询表的类型。这是正确的,可以使用此命令来查看表的详细信息,包括表的类型(内部表或外部表)。

B、修改内部表为外部表的语法是使用以下命令:

ALTER TABLE xxx 
SET TBLPROPERTIES('EXTERNAL'='TRUE');

这个命令是正确的,它将内部表修改为外部表。

C、修改外部表为内部表的语法是使用以下命令:

ALTER TABLE xxx 
SET TBLPROPERTIES('EXTERNAL'='FALSE');

这个命令是正确的,它将外部表修改为内部表。

D、('EXTERNAL'='TRUE')('EXTERNAL'='FALSE') 是用于设置表属性的键值对,它们不是固定写法,而是用来指示表的类型的。这些键值对的大小写是敏感的,所以区分大小写是正确的。

所以正确的选项是 A、B、C 和 D。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/103236.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JAVA学习第一天,java的运行方式

对未来很迷茫&#xff0c;不知道以后能出去干什么&#xff0c;好像掌握的东西很少&#xff0c;从今天开始学习学习java吧&#xff0c;让自己充实起来&#xff0c;记录一下。 jav…

【数据加密、解密】前后端数据传输的过程中,如何进行数据加密传输,保证数据的传输安全,防止被他人窃取

前端进行参数传递的时候 &#xff0c;有些数据为了安全起见还是需要加密传输的&#xff0c;比如用户密码&#xff0c;比如登录的时候&#xff0c;注册的时候&#xff0c;用户输入的密码&#xff0c;如果明文进行传输还是不太安全的&#xff0c;所以一般可以进行加密后传递到后端…

Maven系列第6篇:生命周期和插件详解?

maven系列目标&#xff1a;从入门开始开始掌握一个高级开发所需要的maven技能。 这是maven系列第6篇。 整个maven系列的内容前后是有依赖的&#xff0c;如果之前没有接触过maven&#xff0c;建议从第一篇看起&#xff0c;本文尾部有maven完整系列的连接。 前面我们使用maven…

刷新页面,数据丢失

刷新页面数据丢失原因很多&#xff0c;其中有一种是解析错误&#xff0c;没有解构出来。 报错内容如下(类似这个报错)&#xff1a; 数据结构如下&#xff1a; this.$router.push({name: DetailComparison,query: {rowDetail: rowDetail || null} }) 修改数据结构&#xff1a…

OpenAI科学家谈GPT-4的潜力与挑战

OpenAI Research Scientist Hyung Won Chung 在首尔国立大学发表的一场演讲。 模型足够大&#xff0c;某些能力才会显现&#xff0c;GPT-4 即将超越拐点并在其能力上实现显着跳跃。GPT-3 和 GPT-4 之间的能力仍然存在显着差距&#xff0c;并且尝试弥合与当前模型的差距可能是无…

使用eBPF加速阿里云服务网格ASM

背景 随着云原生应用架构的快速发展&#xff0c;微服务架构已经成为了构建现代应用的主要方式之一。而在微服务架构中&#xff0c;服务间的通信变得至关重要。为了实现弹性和可伸缩性&#xff0c;许多组织开始采用服务网格技术来管理服务之间的通信。 Istio作为目前最受欢迎的…

找单身狗1

一个数组中只有1个数字出现1次&#xff0c;其他数字都是成对出现&#xff0c;找出这个单身狗。 对于这个问题&#xff0c;这里提供两种思路: 1.暴力求解 这种方法是最容易想到的&#xff0c;分别统计每个元素出现的次数&#xff0c;找到出现一次的那个数字即可。然而毕竟是暴…

C++基础之类二(类的实例化,This指针)

目录 类的实例化 概念 类和对象的区别 计算一个类 不同的类的大小 类的存储模型 内存对齐 让结构体按照指定的默认对齐数进行对齐 确定偏移量 大小端字节序 This指针 概念 this指针四大特性 一些关于this指针的问题 总结 之前学过了类&#xff0c;但在编程中类无法直接使用&…

docker-compose 部署示例

文章目录 docker-compose文件格式docker-compose 下载 docker-compose文件格式 这个软件的实际很小&#xff0c;只是根据配置文件产生一些docker命令来执行可以。 配置文件本身是yml的格式&#xff0c;如下 version: 3.5services:# Etherpad: real-time collaborative docume…

MQTT 主题通配符

MQTT 主题通配符 MQTT 主题通配符包含单层通配符 及多层通配符 #&#xff0c;主要用于客户端一次订阅多个主题。 注意&#xff1a;通配符只能用于订阅&#xff0c;不能用于发布。 单层通配符 加号 (“” ) 是用于单个主题层级匹配的通配符。在使用单层通配符时&#xff0c;…

鼎鑫鸿鄴利用国家的策略优势和满足全球需求并驾齐驱

随着全球对可再生能源的需求不断增长&#xff0c;鼎鑫鸿鄴新能源科技有限公司正充分利用中国政府的策略优势&#xff0c;积极满足全球能源使用需求&#xff0c;并在可再生能源领域崭露头角。中国属于全球最大的太阳能市场&#xff0c;在技术研发、产能建设和市场规模等方面拥有…

华为HCIP题库h12-821题库新增30题

901、 &#xff08;多选题&#xff09;下面关于BGP中的公认属性的描述&#xff0c;正确的是 A、公认必属性是所有BGP路由器都识别&#xff0c;且必须存在于Updata消息中 B、BGP必须识别所有公认属性 C、公认属性分为公认必遵和可选过渡两种 D、公认任意属性是所有BGP造由器…

[Spring] SpringMVC 简介(一)

目录 一、SpringMVC 简介 1、什么是 MVC 2、什么是 SpringMVC 3、SpringMVC 实现原理 4、SpringMVC 的特点 二、简单案例 1、引入依赖 2、在 web.xml 中配置前端控制器 DispatcherServlet 3、创建 SpringMVC 的配置文件 4、创建请求控制器 5、测试页面 6、访问不到 …

数学建模——人工神经网络模型

一、人工神经网络简介 1、神经网络起源与应用 1943年心理学家McCulloch和数学家Pitts提出神经元生物数学模型&#xff08;M-P模型&#xff09;&#xff0c;后来人工神经网络(Artifical Neural Network,ANN)是在生物神经网络(Biological Neural Network,BNN)基础上发展起来的&a…

网络通信错误代码列表 HTTP 、FTP

HTTP 1xx&#xff08;临时响应&#xff09;&#xff1a;表示临时响应并需要请求者继续执行操作的状态代码。 100 &#xff08;继续&#xff09; 请求者应当继续提出请求。服务器返回此代码表示已收到请求的第一部分&#xff0c;正在等待其余部分。 101 &#xff08;切换协议…

Json的操作

Json解析float报错&#xff0c;要使用double 第一种 void Start(){//Convert();Convertddd();}public void Convertddd(){ //LineDataDic d new LineDataDic();JsonData d new JsonData();for (int i 0; i < 5; i){LineData convertData new LineData();convertData.ta…

【LeetCode】2578. 最小和分割

难度&#xff1a;简单 题目 给你一个正整数 num &#xff0c;请你将它分割成两个非负整数 num1 和 num2 &#xff0c;满足&#xff1a; num1和num2直接连起来&#xff0c;得到 num各数位的一个排列。 换句话说&#xff0c;num1 和 num2 中所有数字出现的次数之和等于 num 中…

Kestra:高性能、基于 Java 的编排平台

Kestra 是一个基于 Java 构建的事件驱动的编排和调度平台&#xff0c;它利用 YAML 进行工作流定义&#xff08;您可以将其视为工作流的 Terraform&#xff09;。 Kestra 可以简化计划和事件驱动的工作流程。通过将基础设施即代码最佳实践引入数据、流程和微服务编排&#xff0…

MobaXterm使sftp目录与cmd目录同步

MobaXterm使sftp目录与cmd目录同步 创建session时在ssh菜单栏中选择Advanced SSH settings其中SSH-browser type 选择SCP&#xff08;enhanced speed&#xff09; 勾选Follow SSH path

Red Hat 8 安装Docker返回找不到镜像的问题(Status code: 404)

文章目录 小结问题解决参考 小结 Red Hat 8 yum 指令安装Docker社区版时返回了Status code: 404错误&#xff0c;也就是找不到相应的仓库镜像&#xff0c;进行了解决。 问题 环境: Red Hat 8.3 首先安装了 yum install -y yum-utils配置Red Hat 8的Docker的镜像仓库&#x…