hdfs为什么要用block以及block大小的设置

1、在HDFS里面,文件存储为什么要以Block块的方式存储?

目的:减少磁盘寻道的时间。

 

(1)、不设置block:因为数据是分散的存放磁盘上的,读取数据时需要不停的进行磁盘寻道,开销比较大。

(2)、使用block: 一次可以读取一个block中的数据,减少磁盘寻道的次数和时间。

 

其他:block在磁盘上非连续存储的,读取数据时需要磁盘寻道。

2、为什么HDFS中块(block)不能设置太大,也不能设置太小?

(1)、block设置过大:从磁盘传输数据的时间明显大于寻址时间,导致处理该块数据时比较慢。

(2)、block设置过小:NameNode需要大量内存来存储元数据,不可取。

3、HDFS寻址时间

HDFS中找到目标文件块(block)所需要的时间。

4、DataNode上的块大小默认是128MB,为什么128MB是最优选择?

目的:减少HDFS寻址开销。

 

HDFS的平均寻址时间大概是10ms,寻址时间为传输时间的1%时,为最佳状态,所以最佳传输时间是10ms/0.01=1000ms=1s。

 

目前磁盘的传输速率普遍为100MB/s;

计算出最佳block大小:100MB/s x 1s = 100MB,

所以我们设定block大小为128MB。

 

如果磁盘传输速率很大,例如2000M/s时,block可以设置为 2000M/s * 1s = 2000M

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/463231.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c++整理--虚函数

一、虚函数是这么实现的 解析:简单的说,虚函数是通过虚函数表实现的,那么什么是虚函数表呢?事实上,如果一个类中含有虚函数表,则系统会为这个类分配一个指针成员指向一张虚函数表(vtbl&#xff…

[Linux] 命令行工具

1. 基本工具1.1 特殊字符shell的特殊字符有&#xff1a;&、;、|、*、?、、"、、[、]、(、)、$、<、>、{、}、^、#、/、\、%、!、~、。要将这些具有特殊含义的字符当作普通字符使用&#xff0c;可对它们转义使用&#xff0c;在特殊字符前加反斜杠" \ "…

【技术博客-总览--重要】

1 mayday05/technology-talk forked from aalansehaiyang/technology-talk https://github.com/mayday05/technology-talk/blob/master/middle-software/kafka.md 转载于:https://www.cnblogs.com/snowwhite/p/10504391.html

Python 代码调试技巧

Python 代码调试技巧 2012-5-3 简介&#xff1a; Debug 对于任何开发人员都是一项非常重要的技能&#xff0c;它能够帮助我们准确的定位错误&#xff0c;发现程序中的 bug。python 提供了一系列 debug 的工具和包&#xff0c;可供我们选择。本文将主要阐述如何利用 python debu…

谈谈JAVA中的安全发布

谈谈JAVA中的安全发布 昨天看到一篇文章阐述技术类资料的"等级"&#xff0c;看完之后很有共鸣。再加上最近在工作中越发觉得线程安全性的重要性和难以捉摸&#xff0c;又掏出了《Java并发编程实战》研读一番&#xff0c;这本书应该是属于为“JAVA 多线程作注解”的一…

微机原理8086CPU

8086CPU有14个寄存器&#xff1a;AX BX CX DX SI DI SP BP IP CS SS DS ES PSW寄存器16位&#xff0c;存放2个字节ABCDX为通用寄存器2^16-1最大数据存放8086上一代CPU中的寄存器都是8位 四个寄存器可以分为两个独立的8位寄存器使用分为AH、AL 高八位低八位数据最大存放16位822…

软件工程 - 设计模式学习之工厂方法模式Factory Method

在现实生活中我们可以看见,乐事在卖薯片,可比克也在卖.我敢肯定的说它们各自都有自己的工厂来生产薯片,而且生产出来的薯片味道还是不一样的.这就是我们这里所谓的工厂方法模式. 我们来看看这个模式的UML图: 这个模式中我们可以看到:产品和工厂2个基类,然后它们下面又有些子孙类…

一个简单的Makefile模板

FLAGS -Wall -g INCLUDE-I$(ACE_ROOT)/include ACE_LIB-L$(ACE_ROOT)/libN_LIB-lACEDD-DACE_HAS_EVENT_POLL Server:Server.o TaskWork.o  g -o Server Server.o TaskWork.o $(ACE_LIB) $(N_LIB) $(DD)Server.o:Server.cpp ClassDefined.h  g $(FLAGS) $(INCLUDE) $(DD) -…

new 与 malloc区别

new和malloc的区别 属性 new/delete是C关键字&#xff0c;需要编译器支持。malloc/free是库函数&#xff0c;需要头文件支持c。 参数 使用new操作符申请内存分配时无须指定内存块的大小&#xff0c;编译器会根据类型信息自行计算。而malloc则需要显式地指出所需内存的尺寸。 …

树莓派3B+学习笔记:4、查看GPIO

GPIO&#xff08;General Purpose I/O Ports&#xff09;意思为通用输入/输出端口。可以在终端重直接查看GPIO的定义。查看方式1&#xff1a;gpio readall 查看方式2&#xff1a; pinout 可以看出&#xff0c;这条命令执行后提示要查看更多信息访问pinout.xyz 转载于:https://w…

汇编语言基础知识点

汇编指令和机器指令一一对应&#xff0c;有编译器翻译识别&#xff0c;计算机无法直接识别一个存储单元等于1字节 1字节等于8位1KB1024Byte(字节)1Byte8bit&#xff08;位&#xff09;CPU中&#xff0c;指令和数据都是二进制形式存在磁盘的数据&#xff0c;CPU无法直接使用&…

java开发环境搭建--写给java新手

最近我遇到很多java开发的新人&#xff0c;包括很自认为不是新人的人根本就不会自己搭建一个完整的开发环境&#xff0c;因此想写此文&#xff0c;希对他们有所帮助&#xff0c;解除他们的一些开发困惑&#xff0c;更好的了解java. 一、windows下开发环境的搭建 1、从http://ja…

Silverlight的自定义tooltip提示工具条

这种应用场景其实很多&#xff0c;比如游戏中装备/魔法的选择菜单&#xff0c;这里借用了"深蓝色右手"的一张图 再比如聊天室中的文本颜色设置 虽然sl的ToolTipService.ToolTip属性可以设置任何对象&#xff0c;比如下面这样 代码 1 <Rectangle Fill"Red&qu…

c++ 线程间通信方式

一&#xff1a;两个进程间的两个线程通信&#xff0c;相当于进程间通信 二&#xff1a;一个进程中的两个线程间通信 通信方式&#xff1a; 1.互斥锁 mutex; lock_guard (在构造函数里加锁&#xff0c;在析构函数里解锁&#xff09; unique_lock 自动加锁、解锁 2.读写锁 shar…

Linux dmidecode备忘

dmidecode之前笔者在文章Linux下查看主板的相关信息中已经介绍了该命令查看主板信息的用法&#xff0c;这里进一步介绍 DMI&#xff0c;即DesktopManagement Interface。也有被称为SMBIOS&#xff0c;即System Management BIOS。DMI表的意义在于让我们在不探测硬件实体的情况下…

[Silverlight]使用PagedCollectionView配合复选框实现动态筛选的解决方案

在之前的文章中提到&#xff0c;PagedCollection提供了筛选&#xff08;Filter&#xff09;功能。 实际项目中我们往往有这样的需求 即通过复选框动态的筛选DataGird的相关项&#xff0c;比如上面截图所示例的筛选Gender列特定项。有的朋友可能已经想到了&#xff1a;直接操作O…

linux与汇编

Linux操作系统是用C语言编写的&#xff0c;汇编只在必要的时候才被人们想到&#xff0c;但它却是减少代码尺寸和优化代码性能的一种非常重要的手段&#xff0c;特别是在与硬件 直接交互的时候&#xff0c;汇编可以说是最佳的选择。Linux提供了非常优秀的工具来支持汇编程序的开…

MyBatis 逆向工程(MyBatis 自动生成接口以及xml)的使用

刚学MyBatis逆向工程&#xff08;还以为要反汇编呢.....&#xff09; MyBatis逆向工程 个人理解就是链接数据库自动生成相关的增删改查相关的类 以及xml文件 &#xff08;其中有一些不足 应该就是多表链接的问题需要自己写吧&#xff09; MyBatis逆向工程 一般和主项目分开 比较…

IE6-IE9兼容性问题列表及解决办法_补充之五:在IE9下, disabled的文本框内容被选中后,其他控件无法获得焦点问题...

先看一段Htm代码&#xff0c;里面一个disabled的文本框&#xff0c;一个普通可写的文本框&#xff0c;还有一个按钮&#xff0c;非常简单&#xff0c;代码如下&#xff1a;<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.o…

group by 的实现原理

转载&#xff1a;https://cloud.tencent.com/developer/article/1513067 写过 Sql 的同学应该都知道 group by 是用来对数据进行分组的&#xff0c;一般与聚合函数一起使用&#xff0c;对分组后的数据进行聚合。虽然大家都在用&#xff0c;但是有些同学还是不太清楚 group by …