hdfs的特性、命令、安全模式、基准测试

1.第一点:如何理解hdfs分布式文件系统,每台机器出一块磁盘,凑成一个大的硬盘,大的硬盘的容量来自各个服务器的硬盘容量之和。

你出5毛,我出5毛,大家凑成1块。

2. HDFS 是 Hadoop Distribute File System 的简称,意为:Hadoop 分布式文件系统。是 Hadoop 核心组件之一,作为最底层的分布式存储服务而存在。

3.hdfs的特性:

(1)master/slave架构:namenode是我们的主节点,datanode是我们的从节点

                                                          namenode主要管理元数据信息  datanode主要存储各种数据

(2)分块存储

(3)名字空间(NameSpace)

(4)HDFS 会给客户端提供一个统一的抽象目录树,客户端通过路径来访问文件,形如:hdfs://namenode:port/dir-a/dir-b/dir-c/file.data。

(5)Namenode 元数据管理;

(6)Datanode 数据存储;

(7)副本机制;

(8)一次写入,多次读出:频繁的写入会造成元数据的频繁的更新改变,比较麻烦。

3. hdfs常用的操作命令:

hdfs  dfs   -ls  /  查看根路径下面的文件或者文件夹

hdfs dfs  -mkdir  -p   /xx/xxx  在hdfs上面递归的创建文件夹

hdfs  dfs -moveFromLocal  sourceDir(本地磁盘的文件或者文件夹的路径)   destDir(hdfs的路径) (剪切)

hdfs  dfs  -mv  hdfsSourceDir   hdfsDestDir(剪切,从hdfs上的一个位置移动到另一个位置)

hdfs  dfs -put  localDir  hdfsDir   将本地文件系统的文件或者文件夹放到hdfs上面去 (复制)

Usage: hdfs dfs -rm [-f] [-r|-R递归] [-skipTrash跳过垃圾桶永久删除] URI [URI ...] 删除hdfs上的一个或多个文件或文件夹。

hdfs dfs -tail [-f] URI  (Displays last kilobyte of the file to stdout)

hdfs dfs -appendToFile <localsrc> ... <dst> 将本地系统的一个或多个文件追加到hdfs的一个文件中。

hdfs  dfs -cat  hdfsFiles 查看一个或多个hdfs的文件内容

hdfs  dfs  -cp   hdfsSourceDIr   hdfsDestDir   拷贝文件或者文件夹,从hdfs上的一个位置拷贝到另一个位置

hdfs的权限管理两个命令:

hdfs  dfs  -chmod -R  777  /xxx

hdfs  dfs  -chown -R hadoop:hadoop  /xxx

hdfs dfs -expunge 清空回收站 

 

2.hdfs高级命令使用:主要就是用于限制某个路径下面的文件的个数,或者限制某个路径下面文件的大小。

hdfs dfs -mkdir -p /user/root/lisi     #创建hdfs文件夹

hdfs dfsadmin -setQuota 2 lisi      # 给该文件夹下面设置最多上传两个文件,上传文件,发现只能上传一个文件

hdfs dfsadmin -clrQuota /user/root/lisi    # 清除文件数量限制

hdfs dfsadmin -setSpaceQuota 4k /user/root/lisi   # 限制空间大小4KB

hdfs dfs -put  /export/softwares/zookeeper-3.4.5-cdh5.14.0.tar.gz /user/root/lisi

hdfs dfsadmin -clrSpaceQuota /user/root/lisi   #清除空间限额

hdfs dfs -count -q -h /user/root/lisi 查看hdfs文件限额数量

注意:hdfs dfs -count -q -h /user/root/lisi 可以简写为hdfs dfs -count -q -h lisi 这里使用了相对路径,

当前登录用户是root,所以当前路径是/user/root/

 

3.  hdfs的安全模式:文件系统只接受读数据请求,而不接受删除、修改等变更请求。hdfs集群刚启动的时候,默认30S钟的时间是出于安全期的,去检测datanode了,只有过了30S之后,集群脱离了安全期,然后才可以对集群进行操作

hdfs  dfsadmin  -safemode [ enter | leave | get  ]

 

4.  hdfs基准测试(压力测试)

测试写入速度:

hadoop jar /export/servers/hadoop-2.6.0-cdh5.14.0/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.6.0-cdh5.14.0.jar TestDFSIO  -write -nrFiles 10 -fileSize 10MB

完成之后查看写入速度结果,写入速度一般在30M/S左右超不多:

hdfs dfs -text /benchmarks/TestDFSIO/io_write/part-00000

测试读取速度:

hadoop jar /export/servers/hadoop-2.6.0-cdh5.14.0/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.6.0-cdh5.14.0.jar TestDFSIO -read -nrFiles 10 -fileSize 10MB

查看读取结果,实际工作当中通过MR读取速度大概在100M/s左右:

hdfs dfs -text /benchmarks/TestDFSIO/io_read/part-00000

清除测试数据:

hadoop jar /export/servers/hadoop-2.6.0-cdh5.14.0/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.6.0-cdh5.14.0.jar TestDFSIO -clean

注:在执行命令时的当前路径下,会生成一个测试报告文件:-rw-r--r-- 1 root root  303 May 23 22:06 TestDFSIO_results.log

转载于:https://www.cnblogs.com/mediocreWorld/p/10941071.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/386728.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何push一个docker镜像到DockerHub上

如何push一个docker镜像到DockerHub上 2018.01.03 11:31:39字数 139阅读 202 有时候想要保存自己的docker镜像&#xff0c;又不想自己搭建docker registry&#xff0c;那么就可以了借用DockerHub来用&#xff0c;一般不会有多少人在意你的镜像&#xff0c;不过万一被人看上了…

测开2 - Python(文件操作)

把第一次写好漏掉的点写在最前面&#xff1a;文件读写的内容都要求是字符串。 几种文件操作的模式&#xff1a; 1. r&#xff0c;读模式&#xff08;默认模式&#xff09;&#xff0c;只能读不能写&#xff0c;文件不存在时报错 2. w&#xff0c;写模式&#xff0c;只能写不能读…

使用docker在CentOS7上搭建WordPress

前言 本文基于Centos 7 环境的docker搭建操作&#xff0c;centos 7 用 firewalld 替换了iptables作为默认防火墙操作&#xff0c;但以前习惯了iptables 就不与时俱进了。 环境准备 systemctl disable firewalld systemctl stop firewalld setenforce 0 sed -i "s/SELIN…

企业级应用,如何实现服务化一(项目架构演化)

1.企业级应用架构演化 1.1.架构演化图 1.2.文字描述 #单一应用架构当网站流量很小时&#xff0c;只需一个应用&#xff0c;将所有功能都部署在一起&#xff0c;以减少部署节点和成本#垂直应用架构当访问量逐渐增大&#xff0c;单一应用增加机器带来的加速度越来越小&#xff0c…

Alpine 操作系统是一个面向安全的轻型 Linux 发行版

Alpine 操作系统是一个面向安全的轻型 Linux 发行版。它不同于通常 Linux 发行版&#xff0c;Alpine 采用了 musl libc 和 busybox 以减小系统的体积和运行时资源消耗&#xff0c;但功能上比 busybox 又完善的多&#xff0c;因此得到开源社区越来越多的青睐。在保持瘦身的同时&…

ASP.NET MVC Filter过滤机制(过滤器、拦截器)

https://blog.csdn.net/knqiufan/article/details/82413885 本文为博主原创文章&#xff0c;未经博主允许不得转载。 https://blog.csdn.net/knqiufan/article/details/82413885参考文章&#xff1a;1、https://www.cnblogs.com/webapi/p/5669057.html 2、htt…

elk docker

换了个运行环境,重新搭建一套公司本地内部的ELK,之前也搭过(可访问:https://yanganlin.com/31.html),最近做什么事情都想用Docker,这次也用Docker,还算顺利,没掉什么坑里,上次搭建,也用用的6.2的版本,这都过了一年,Elk这三个产品,都已经上7了,用docker搭建的还是用6.2.4,稳定不…

LeetCode Largest Number

1231231转载于:https://www.cnblogs.com/ZHONGZHENHUA/p/10954249.html

有个需求mybatis 插入的时候不知道有哪些字段,需要动态的传入值和字段

有个需求mybatis 插入的时候不知道有哪些字段&#xff0c;需要动态的传入值和字段&#xff0c; Java code? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Test public void testAddProductGuaranty() { //1 560 50000 2014/10/2 0:00:00 2014/11/1 0…

readonly的用法

转载于:https://www.cnblogs.com/w123w/p/10958567.html

mybatis insert 动态生成插入的列及插入的值

代码如下 &#xff1a; 1.mapper.xml 文件 <?xml version"1.0" encoding"UTF-8"?> <!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" "http://mybatis.org/dtd/mybatis-3-mapper.dtd"> <mapper name…

loj2245 [NOI2014]魔法森林 LCT

[NOI2014]魔法森林 链接 loj 思路 a排序&#xff0c;b做动态最小生成树。 把边拆成点就可以了。 uoj98.也许lct复杂度写假了、、越卡常&#xff0c;越慢 代码 #include <bits/stdc.h> #define ls c[x][0] #define rs c[x][1] using namespace std; const int N 2e5 7; …

Jenkins发布spring boot到hub.Docker 方法

在生成的目录下&#xff0c;建立个文件&#xff0c;文件名称为&#xff1a;Dockerfile FROM java:8 VOLUME /tmp ADD target/assignment-0.0.1-SNAPSHOT.jar /dalaoyang.jar ENTRYPOINT ["java","-Djava.security.egdfile:/dev/./urandom","-jar&q…

网页视频直播、微信视频直播技术解决方案:EasyNVR与EasyDSS流媒体服务器组合之区分不同场景下的直播接入需求...

背景分析 熟悉EasyNVR产品的朋友们都知道&#xff0c;EasyNVR不仅可以独成体系&#xff0c;而且还可以跟其他系列产品相配合&#xff0c;形成各种不同类型的解决方案&#xff0c;满足各种不同应用场景的实际需求。针对很多设备现场没有固定公网IP&#xff0c;但是又想实现公网、…

如何解决VMware Workstation 10.0.0 build-1295980马赛克现象

VMware Workstation 10.0.0 build-1295980偶尔出现客户机马赛克现象&#xff0c;可切换至其它选项卡&#xff0c;再切换回去即可。 还有一种方式是关闭加速3D图形。 转载于:https://www.cnblogs.com/rms365/p/10961499.html

不同账号间的云资源授权方法

阿里云的访问控制RAM产品可以实现资源的分配和授权,在一个特殊的业务背景下,资源也可以实现跨账号的授权使用. 背景: 1.A公司,作为甲方Party A,出资购买云资源,对云资源具有所有权,但不实际管理,需要乙方配合. 2.B公司,作为乙方Party B,要管理A公司的云资源,需要A公司授权云资…

知乎上已获千赞,全网独家首发!

前言 选了开发这一行&#xff0c;就意味着想混得好就要持续学习&#xff0c;你的技术和薪资、位置直接挂钩&#xff0c;进步对于程序员的重要性就不赘述了&#xff0c;接下来作为过来人&#xff0c;为广大同行分享一些学习干货&#xff0c;希望可以帮到大家 1、网络 网络协议…

知乎上已获千赞,持续更新中

前言 不知不觉自己已经做了几年开发了&#xff0c;由记得刚出来工作的时候感觉自己能牛逼&#xff0c;现在回想起来感觉好无知。懂的越多的时候你才会发现懂的越少。 如果你的知识是一个圆&#xff0c;当你的圆越大时&#xff0c;圆外面的世界也就越大。 最近看到很多Androi…

centos下搭建Jenkins持续集成环境(安装jenkins)

centos下搭建Jenkins持续集成环境(安装jenkins) 1、安装JDK yum install -y java 2、安装jenkins 添加Jenkins库到yum库&#xff0c;Jenkins将从这里下载安装。 1 wget -O /etc/yum.repos.d/jenkins.repo http://pkg.jenkins-ci.org/redhat/jenkins.repo 2 rpm --import h…

elementUi Dialog 对话框使用中数据获取问题

Dialog 对话框&#xff1a;使用中数据获取问题演示代码&#xff1a; <div class"centerContent"><ul><li class"contentBox" v-for"(notice,index) in systemNotices" :key"index"> //循环取值<div class&quo…