第一章测验
1、下面哪个选项不属于Google的三驾马车?
A.HDFS
B.MapReduce
C.BigTable
D.GFS
2、下面哪个思想是为了解决PageRank(网页排名)的问题?
A.GFS
B.BigTable
C.MapReduce
D.YARN
3、GFS 存储的文件都被分割成固定大小的块,每个块都会复制到多个块服务器上(可靠性),请问默认冗余存储几份?
A.1
B.2
C.3
D.5
4、下面哪个特点是不属于Hadoop的特点?
A.扩容能力强
B.成本低
C.高效率和可靠性
D.适合复杂数据的分析
5、下面哪个场景适合使用Hadoop处理?
A.少量数据分析
B.在线分析
C.离线分析
D.复杂数据
6、2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?
A.“The Google File System”
B.“MapReduce: Simplified Data Processing on Large Clusters”
C.“Bigtable: A Distributed Storage System for Structured Data”
D.“The Hadoop File System”
7、2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?
A.“The Google File System”
B.“MapReduce: Simplified Data Processing on Large Clusters”
C.“Bigtable: A Distributed Storage System for Structured Data”
D.“The Hadoop File System”
8、2006年,Google公司发表了用来处理海量数据的一种非关系型数据库的论文是?
A.“The Google File System”
B.“MapReduce: Simplified Data Processing on Large Clusters”
C.“Bigtable: A Distributed Storage System for Structured Data”
D.“The Hadoop File System”
9、对于GFS架构,下面哪个说法是错误的?
A.GFS Master节点管理所有的文件系统所有数据块。
B.GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务器上(可靠性)。块的冗余度默认为3。
C.GFS Master还管理着系统范围内的活动,比如块服务器之间的数据迁移等
D.GFS Master与每个块服务器通信(发送心跳包),发送指令,获取状态
10、狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下面哪个组件?
A.HDFS
B.MapReduce
C.Yarn
D.HBase
11、与Hadoop 1.x相比,Hadoop 2.x采用全新的架构,最明显的变化就是增加了哪个组件?
A.MapReduce
B.Yarn
C.Pig
D.HBase
12、建立在Hadoop文件系统之上的分布式的列式数据库?
A.HBase
B.Hive
C.YARN
D.Mahout
13、下面哪个选项不是HDFS架构的组成部分?
A.NameNode
B.DataNode
C.SecondaryNameNode
D.GFS
14、Hadoop的作者是?
A.Doug cutting
B.Martin Fowler
C.Kent Beck
D.No answer text provided.
15、Hadoop版本演进过程中,0比Hadoop1.0有了很多的优化,下面哪项不属于Hadoop2.0?
A.加入HDFS的 NameNode Federation和YARN
B.YARN基于cgroup的内存和磁盘IO隔离
C.支持NameNode HA
D.Wire-compatibility特性
16、Hadoop版本演进过程中,Hadoop3.0比Hadoop2.0有了很多的优化,下面哪项不属于Hadoop3.0?
A.JDK版本的最低依赖从1.7变成了1.8
B.支持多个Standby状态的NameNode
C.支持NameNode HA
D.Datanode内部添加了负载均衡
17、Hadoop更适合哪些场景?
A.离线分析
B.复杂数据
C.少量数据
D.在线分析
18、下面哪些是大数据的基本特征?
A.数据体量大
B.数据类型多
C.处理速度快
D.价值密度低
19、Hadoop能够使用户轻松开发和运行处理大数据的应用程序,那它主要有下面哪些特点?
A.高可靠性
B.高扩展性
C.高效性
D.高容错性
20、Google的在大数据解决方案是开源的。
A.True
B.False
21、GFS分布式文件系统有两个基本组成部分,一个是客户端(Client),一个是服务端(Server)。
A.True
B.False
22、上传的数据块保存在GFS上,在保存过程中需要水平复制,水平复制需要考虑两个要求:可靠性、可用性。
A.True
B.False
23、HDFS的采用了“分而治之”的思想。
A.True
B.False
24、MapReduce是的最早提出是Google为了解决PageRank的问题。
A.True
B.False
25、Hbase是非关系型数据库,是面向列的。
A.True
B.False
26、Hadoop源自始于2002年的Apache Lucene项目。
A.True
B.False
17、Google的论文《Google File System》提到:还依赖一个高可用的、序列化的分布式锁服务组件,叫Chubby。
A.True
B.False
28、Region Server是Google的论文《Bigtable:一个分布式的结构化数据存储系统》中描述的BigTable的组成部分。
A.True
B.False
29、Google的GFS论文是主要是为了解决PageRank(网页排名)的问题。
A.True
B.False