Hadoop精华问答:Hadoop框架最核心的设计是?

640?wx_fmt=png

2006年项目成立的一开始,“Hadoop”这个单词只代表了两个组件——HDFS和MapReduce。到现在的13个年头,这个单词代表的是“核心”,今天我们就来看看关于Hadoop的精华问答。


640?wx_fmt=gif1

Q:Hadoop是什么?


A:Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。


640?wx_fmt=gif2

Q:Hadoop框架最核心的设计是?


A:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。


640?wx_fmt=gif3

Q:Hadoop的主要优点?


A:Hadoop的主要优点有以下几个:

(a) 高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。

(b)高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中。

(c)高效性。Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。

(d)高容错性。Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。

(e)低成本。与一体机、商用数据仓库以及QlikView、Yonghong Z-Suite等数据集市相比,Hadoop是开源的,项目的软件成本因此会大大降低。


640?wx_fmt=gif4

Q:HDFS是什么?


A:Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.640?wx_fmt=png

HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。

对外部客户机而言,HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件,等等。但是 HDFS 的架构是基于一组特定的节点构建的,这是由它自身的特点决定的。

这些节点包括 NameNode(仅一个),它在 HDFS 内部提供元数据服务;DataNode,它为 HDFS 提供存储块。由于仅存在一个 NameNode,因此这是 HDFS 的一个缺点(单点失败)。 

存储在 HDFS 中的文件被分成块,然后将这些块复制到多个计算机中(DataNode)。这与传统的 RAID 架构大不相同。块的大小(通常为 64MB)和复制的块数量在创建文件时由客户机决定。NameNode 可以控制所有文件操作。HDFS 内部的所有通信都基于标准的 TCP/IP 协议。


640?wx_fmt=gif5

Q:HDFS有何特性?


A:HDFS的部分特性:

1. 一致性,高可用性,分区容错性 

2. 存储超大文件 

3. 一次写入,多次读取(流式数据访问) 

4. 运行在普通廉价的服务器上 

5. 以高延迟为代价 

6. 不适合存储大量小容量的文件 

7. 会在多个datanode上存储多份副本,默认3份,三份副本一般会保存在两个或者两个以上的服务器中 

8. namenode 负责管理文件目录,文件和block的对应关系以及block和datanode的对应关系 

9. datanode负责存储,大部分的容错机制都是在datanode上实现


640?wx_fmt=png

小伙伴们冲鸭,后台留言区等着你!

关于Hadoop,今天你学到了什么?还有哪些不懂的?除此还对哪些话题感兴趣?快来留言区打卡啦!留言方式:打开第XX天,答:……

同时欢迎大家搜集更多问题,投稿给我们!风里雨里留言区里等你~


福利

1、扫描添加小编微信,备注“姓名+公司职位”,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!


640?wx_fmt=jpeg

2、公众号后台回复:白皮书,获取IDC最新数据白皮书整理资料!


推荐阅读:

  • 轻松了解面试官心理!ElasticSearch写入数据的工作原理是什么? | 技术头条

  • 专访图灵奖得主John Hopcroft:中国必须提升本科教育水平,才能在AI领域赶上美国

  • 程序员与程序媛的神仙爱情 | 程序员有话说

  • 他曾主导世界上第一台安卓智能机, 如今能否靠区块链手机找回昔日的光荣?|人物志

  • 移动开发或将被颠覆?

  • 如何将TensorFlow Serving的性能提高超过70%?


640?wx_fmt=png喜欢就点击“在看”吧

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/524186.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

git.exe init#timeout = 10错误:克隆远程repo'origin'时出错hudson.plugins.git

用Jenkins自动化搭建测试环境,Jenkins构建任务 关键异常抓取 git.exe init#timeout 10错误:克隆远程repoorigin时出错hudson.plugins.git (git.exe init # timeout10 ERROR: Error cloning remote repo origin hudson.plugins.git)具体异常抓…

阿里云镜像仓库

阿里云镜像加速器 第一步&#xff1a;进入apache-maven-3.6.1/conf/目录 cd apache-maven-3.6.1/conf/第二步&#xff1a;编辑settings.xml文件添加阿里云仓库镜像 vim settings.xml第三步&#xff1a;在文件中找到标签&#xff0c;在里面复制添加即可&#xff01; <mirro…

Docker精华问答 | 多个 Docker 容器之间共享数据怎么办?

在计算机技术日新月异的今天, Docker 在国内发展的如火如荼。特别是在一线互联网公司 Docker 的使用是十分普遍的,甚至成为了一些企业面试的加分项&#xff0c;那么今天我们继续关于Docker 的精华问答。1Q&#xff1a;容器磁盘可以限制配额么&#xff1f; A&#xff1a;对于 de…

ssh连接远程linux环境

ssh连接远程linux环境 格式为&#xff1a; ssh 用户名远程ip地址例如&#xff1a; ssh root192.168.182.128

要闻君说:谷歌云重磅发布两大技术平台;以后可以打飞滴了?SAP重组动荡;微软宣布 Azure Functions 支持 Java...

关注并标星星CSDN云计算极客头条&#xff1a;速递、最新、绝对有料。这里有企业新动、这里有业界要闻&#xff0c;打起十二分精神&#xff0c;紧跟fashion你可以的&#xff01;每周三次&#xff0c;打卡即read更快、更全了解泛云圈精彩newsgo go go 【4月10日 星期三】云の声音…

OpenGL ES EGL eglDestroyContext

目录 一. EGL 前言二. EGL 绘制流程简介三.eglDestroyContext 函数简介 四.eglDestroyContext 使用四.猜你喜欢 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >> OpenGL ES 基础 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >> OpenGL ES 特效 …

用Jenkins自动化搭建测试环境_jenkins基础搭建_入门试炼02

Jenkins基础&#xff1a; 本篇介绍Jenkins的安装、Jenkins中的常用插件的安装方法、Jenkins用户配置以及提醒邮件的配置。 接上一篇&#xff1a;使用Jenkins搭建自动化测试环境_环境准备_入门试炼01 https://blog.csdn.net/weixin_40816738/article/details/90280440 文章目录一…

OpenGL ES EGL eglQueryContext

目录 一. EGL 前言二. EGL 绘制流程简介三.eglQueryContext 函数简介 四.eglQueryContext 使用四.猜你喜欢 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >> OpenGL ES 基础 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >> OpenGL ES 特效 零基…

终于有人把5G和边缘计算的关系说清楚了 | 技术头条

戳蓝字“CSDN云计算”关注我们哦&#xff01;技术头条&#xff1a;干货、简洁、多维全面。更多云计算精华知识尽在眼前&#xff0c;get要点、solve难题&#xff0c;统统不在话下&#xff01;作者&#xff1a; pala来源&#xff1a;边缘计算社区5G三大应用场景为&#xff1a;增强…

Jenkins_安装基础软件_入门试炼03

应用部署服务器准备&#xff1a; 本章对Linux系统简介、安装Java环境、安装并配置 Git、安装并配置 Maven、安装并配置 Tomcat、以及将部署服务器配置到Jenkins上。 一、Linux操作系统需要做的准备 1. 确定IP地址2. 确认登录用户名密码3. 查看/启动ssh服务4. 确认可以远程连接…

Jenkins_GithubFork程序_入门试炼04

部署应用介绍与前期准备&#xff1a; 本章讲解Fork github上的应用、部署应用下载、简略分析部署应用、 数据库准备、本地运行部署应用、将更新后的代码上传到github。 一、Github的介绍 GitHub是一个面向开源及私有软件项目的托管平台&#xff0c;因为只支持git 作为唯一的版…

用Jenkins自动化搭建测试环境_入门试炼05

Jenkins自动化部署任务开发&#xff1a; 本章简述自动化构建、部署过程、 创建Jenkins 任务&#xff0c;填写部署代码、实际运行部署任务。 一、部署过程介绍 简述自动化部署过程&#xff1a; 【开始】-【Git同步最新代码】-【maven打包编译】-【停止Tomcat】-【部署应用】-【…

OpenGL ES OpenGL WebGL EGL WGL 区别

目录 一.OpenGL二.OpenGL ES三.WebGL 四.EGL 和 WGL 五.猜你喜欢 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >> OpenGL ES 基础 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >> OpenGL ES 特效 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学…

用Jenkins自动化搭建测试环境_入门试炼06

本章研发修改程序代码、 运行Jenkins环境发布任务、新环境上验证研发更改。 实战 1. 修改部署应用源代码2. commit修改内容&#xff0c;push代码到github3.执行Jenkins自动化部署任务4. 待任务完成后&#xff0c;打开浏览器查看部署结果 【从修改代码】-到【推送git库】-再到…

为什么给黑洞拍照需要这么长时间?

戳蓝字“CSDN云计算”关注我们哦&#xff01;技术头条&#xff1a;干货、简洁、多维全面。更多云计算精华知识尽在眼前&#xff0c;get要点、solve难题&#xff0c;统统不在话下&#xff01;作者&#xff1a;中国科普博览&#xff1b;左文文&#xff08;中科院上海天文台&#…

OpenGL ES freeglut 下载和使用

目录 一.freeglut 简介二.freeglut 下载五.猜你喜欢 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >> OpenGL ES 基础 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >> OpenGL ES 特效 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >…

使用Jenkins搭建自动化测试环境_环境准备_入门试炼01

平台介绍&#xff1a; 前置准备环境&#xff1a;数据库MySQL&#xff0c;测试环境OS CentOS。 文章目录1. 平台介绍2. 自动化测试环境部署带来的幸福感:2.1. 程序自动部署&#xff0c;节约时间2.2. 环境一键部署&#xff0c;不怕研发频繁修改代码1. 平台介绍 2. 自动化测试环境…

与云原生及开源大神们的第二次亲密接触 | 全议程重磅发布

戳蓝字“CSDN云计算”关注我们哦&#xff01;CNCF主办的中国最大规模开源与云原生大会有来自阿里巴巴、百度、华为、腾讯和雅虎日本的演讲嘉宾&#xff0c;加上Linux基金会的Open Source Summit。加利福尼亚州旧金山&#xff0c;2019年4月10日 —— 云原生计算基金会&#xff0…

OpenGL ES glew 下载和使用

目录 一.glew 简介二.glew 下载五.猜你喜欢 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >> OpenGL ES 基础 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >> OpenGL ES 特效 零基础 OpenGL ES 学习路线推荐 : OpenGL ES 学习目录 >> Op…

Storm精华问答 | 遇到这些错误日志该如何解决?

分布式的实时计算系统&#xff0c;能够可信任的处理大量的流式数据&#xff0c;就好比Hadoop对于批量数据进行的处理一样&#xff1b;通常来说&#xff0c;Hadoop能够进行大批量数据的离线处理&#xff0c;但是在实时计算上的表现实在是不尽如人意&#xff1b;而Storm就可以担当…