七、HDFS文件系统的存储原理

七、HDFS文件系统的存储原理

news/2025/11/1 7:45:27/文章来源:https://blog.csdn.net/2301_79149013/article/details/134543373

1、总结

之所以把总结放在文件开头，是为了让读者对这篇文章有更好的理解，（其实是因为我比较懒……）

对于整个HDFS文件系统的存储原理，我们可以总结为一句话，那就是：

分块+备份

2、存储结构和问题

（1）存储方式

对于一个比较大文件，我们可以将文件分为好几个部分，存储在不同的服务器节点上，每一个服务器节点，存储文件的一部分。

（2）造成的问题

在这种存储模式下，很容易造成文件大小不一的情况，有可能出现a文件大小为1KB，b文件大小为3MB，c文件直接达到5GB的情况，甚至达到TB乃至更高的单位。

（3）解决方法

对于这种问题，HDFS文件系统将文件大小设定统一的管理单位，划分为block块，一个block块的大小为256MB，如果1GB的文件存储到HDFS文件系统中，则需要划分出4个block块。

（4）隐藏问题

在这种将文件划分为block块的存储模式下，会出现一个“隐藏且致命”的问题，那就是如果存储的某个节点上的某一个block块被删除或者丢失，那应该如何处理？

此处将文件划分为9个block块，如果丢失一个block块就会导致文件出现错误，无法使用，如果对于一个特别大的文件，我们将这个文件划分为10000个block块，那么block块丢失的概率回大大增大，那么文件出现问题的概率也会随之增大。

3、解决方案

（1）简单描述

中国有句古话叫做，“不要把鸡蛋同时放在一个篮子里”，对于每个block文件，我们可以对其尽心备份处理，例如在node1节点里有个名为a的block块，我们可以对a进行备份，分别命名为a_copy1和a_copy2，分别存储在node2和node3节点中。

（2）图文描述

（3）具体实现

我们可以让每一个block块都有两个副本(默认)，分别存储在不同的节点之上。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/157421.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

使用Navicat将SQL server数据库导入mysql数据库

使用Navicat将SQL server数据库导入mysql数据库

使用Navicat将SQL server数据库导入mysql数据库 1、使用Navicat Premium打开MySql数据库，然后新建一个数据库名（该数据库名称为需要从SqlServer数据库导过来的名称，mysql只有小写，不影响） 比如需要将SqlServer数据库…

阅读更多...

Linux IIC 驱动实验

Linux IIC 驱动实验

一、引言随着嵌入式系统的快速发展，IIC（Inter-Integrated Circuit）总线已经成为一种常见的通信协议，广泛应用于各种嵌入式设备中。在Linux操作系统中，IIC总线驱动程序是实现设备间通信的关键。本文将介绍一个基于Linu…

阅读更多...

计数排序+桶排序详讲（思路+图解+代码详解）

计数排序+桶排序详讲（思路+图解+代码详解）

文章目录计数排序和桶排序一、计数排序概念：写法一：写法二： 二、桶排序概念代码计数排序和桶排序一、计数排序时间复杂度：空间复杂度：稳定性：稳定概念： 非基于比较的排序计数排序又称为…

阅读更多...

PACS系统源码，WORKLIST数字化工作流程，影像数字化存储，电子报告书写、胶片打印

PACS系统源码，WORKLIST数字化工作流程，影像数字化存储，电子报告书写、胶片打印

PACS系统源码可与医院HIS、LIS无缝连接 PACS系统以实现医学影像数字化存储、诊断为核心任务，从医学影像设备（如CT、CR、DR、MR、DSA、RF等）获取影像，集中存储、综合管理医学影像及病人相关信息，建立数字化工作流程。 …

阅读更多...

文章系列2：Unraveling the functional dark matter through global metagenomics

文章系列2：Unraveling the functional dark matter through global metagenomics

这篇文章发布于2023年10月nature。通讯作者是来自于 DOE Joint Genome Institute, Lawrence Berkeley National Laboratory, Berkeley, CA, USA. 背景介绍&目标作者首先背景介绍了两种主流宏基因组分析方法，包括reads-based reference mapping（eg…

阅读更多...

Reactive.Net绑定Subscribe调用wpf控件报错

Reactive.Net绑定Subscribe调用wpf控件报错

使用.ObserveOnDispatcher()解决，nuget安装ReactiveUI.WPF 参考 winforms - Rx Example not working - Stack Overflow

阅读更多...

openssl+ SM2 + linux 签名开发实例（C++）

openssl+ SM2 + linux 签名开发实例（C++）

文章目录一、SM2 签名理论基础二、SM2签名开发实例一、SM2 签名理论基础 SM2是中国国家密码管理局发布的椭圆曲线密码算法标准，用于数字签名、密钥交换和公钥加密等安全通信场景。以下是SM2签名的理论基础相关知识点： 椭圆曲线密码学（Elli…

阅读更多...

为gnustep项目移植到wsl的过程

为gnustep项目移植到wsl的过程

仔细研读/usr/share/GNUStep/Makefiles下的很多makefile文件的一些变量定义然后开始整理代码，各个文件存放到自定义的文件夹，方便管理修改GNUMakefile, 这里要研读很多Makefile 文件的变量定义，修正自己的赋值一个尝试例子: https://gi…

阅读更多...

VMware虚拟机的安装教程

VMware虚拟机的安装教程

安装VMware虚拟机的步骤如下： 首先，你需要从VMware官方网站（https://www.vmware.com）下载VMware虚拟机软件安装程序。一旦下载完成，双击运行安装程序。在安装程序启动后，你将看到一个欢迎界面。点击"…

阅读更多...

chromium114添加新的语言国际化支持

chromium114添加新的语言国际化支持

一、需求说明需要chromium114支持新语言体系,例如藏语，蒙古语，苗语等二、操作步骤 1. build/config/locales.gni修改在all_chrome_locales变量中添加新的语种标识，如下图。 2. 添加编译文件，告诉浏览器在编译时需要加载和输出那些文件尝试编译出现错误一提示。需要…

阅读更多...

Python Turtle Graphics 绘制I Love You字符

Python Turtle Graphics 绘制I Love You字符

1.1引言： Python的turtle模块是一个非常有趣且强大的工具，它允许我们以一个可视化和互动的方式学习编程。通过调用各种命令，我们可以引导turtle画出一个指定的图形。在本博客中，我们将使用turtle模块来绘制一个复杂的图形。 1.2实…

阅读更多...

读像火箭科学家一样思考笔记05_思想实验

读像火箭科学家一样思考笔记05_思想实验

1. 思想实验室 1.1. 思想实验至少可以追溯到古希腊时期 1.1.1. 从那时起，它们就跨越各个学科，在哲学、物理学、生物学、经济学等领域取得重大突破 1.1.2. 它们为火箭提供动力，推翻政府，发展进化生物学，解开宇宙的奥…

阅读更多...

优秀智慧园区案例 - 三亚市崖州湾科技城智慧园区，先进智慧园区建设方案经验

优秀智慧园区案例 - 三亚市崖州湾科技城智慧园区，先进智慧园区建设方案经验

一、项目背景三亚崖州湾科技城作为海南自贸港建设的重点园区，是重点推进的海南自贸港先导项目之一。崖州湾科技城全力抢抓有利时机，进一步拓宽发展思路，持续深化体制机制创新，牢牢把握“打造产学研城深度融合的聚集地”这一核心…

阅读更多...

问题：vue2+elementui，tabs切换显示表格并设置表格选中行高亮失败

问题：vue2+elementui，tabs切换显示表格并设置表格选中行高亮失败

错误示范： 1.直接setCurrentRow失败（this.currentRow是之前保存的表格当前选中行的数据） this.$refs.table.setCurrentRow(this.currentRow);2.以为是表格没生成就执行了setCurrentRow导致设置不成功，所以使用了this.$nextTick&…

阅读更多...

同为科技（TOWE）桌面PDU插排：一款可以DIY定制的“超级插座”

同为科技（TOWE）桌面PDU插排：一款可以DIY定制的“超级插座”

当今社会，各种电子产品和家用电器已成为人们日常生活中不可或缺的一部分，在带给人们便利的同时，也使得电力使用变得更加频繁和重要。然而，当前市面上很多普通插座由于功能单一、材质粗劣、插口数量受限、充电速度过慢、插头间互相…

阅读更多...

人机交互——机器人形态

人机交互——机器人形态

1.聊天机器人 2.任务型机器人 3.面向FAQ的问答机器人 4.面向KB的问答机器人

阅读更多...

seismicunix基础-声波波动方程推导

seismicunix基础-声波波动方程推导

seismicunix基础-声波波动方程推导接触波动方程的研究人员都绕不开这个公式，这是在一维状态下波动方程但是对于这个方程是怎样来的很少有人能说清楚，其中涉及到牛顿第二运动定律，物体的加速度与受到的力有关。假设一维弦是大量紧密连接的质…

阅读更多...

服务器64GB内存、8核CPU的MySQL 8配置参数

服务器64GB内存、8核CPU的MySQL 8配置参数

服务器64GB内存、8核CPU的MySQL 8配置参数可以按照以下步骤进行调优： 调整缓冲区相关参数： 增加innodb_buffer_pool_size的值，将其设置为4GB或更大，以加速频繁读取的操作。 – 2147483648 增加key_buffer_size的值，将…

阅读更多...

ES6 的 class 类和Typescript 的 class 类的区别

ES6 的 class 类和Typescript 的 class 类的区别

前言为什么要理解ES6的类和TS类的区别： 都是面向对象的开发它们看着很像但是它们不一样学习明白了，避免混用 ES6 类是 JavaScript 中基于原型的面向对象编程的语法糖，而 TypeScript 类在此基础上增加了强类型检查和其他面向对象编程的特性…

阅读更多...

智能座舱架构与芯片- (9) 音频篇上

智能座舱架构与芯片- (9) 音频篇上

一、音频总线音频是智能座舱的核心功能，涵盖车载音响、语音识别、e-Call、消噪及回声消除等应用，随着汽车智能网联化的发展，对音频的开发要求也越来越高。传统的车载音频系统采用模拟并行音频信号传输方式，难以在功能增加与整车…

阅读更多...

最新文章