HDFS概述及常用shell操作

HDFS

  • 一、HDFS概述
    • 1.1 HDFS适用场景
    • 1.2 HDFS优缺点
    • 1.3 HDFS文件块大小
  • 二、HDFS的shell操作
    • 2.1 上传
    • 2.2 下载
    • 2.3 HDFS直接操作

一、HDFS概述

1.1 HDFS适用场景

因为HDFS里所有的文件都是维护在磁盘里的
在磁盘中对文件的历史内容进行修改 效率极其低(但是追加可以)
在这里插入图片描述

1.2 HDFS优缺点

  • 优点
    -

  • 缺点
    因为数据量太大 且磁盘IO操作很多 所以不适合低延时的要求
    那HDFS为什么怕小文件呢-因为不管是大文件 还是小文件 他们对应的元数据信息大小都是一样的(大概150字节) 而元数据都是存在服务器的内存中 这是有限的
    在这里插入图片描述

1.3 HDFS文件块大小

在这里插入图片描述
在这里插入图片描述

二、HDFS的shell操作

2.1 上传

  • -moveFromLocal:从本地剪切粘贴到HDFS(本地就没了)
    hadoop fs -moveFromLocal ./test.txt /test

  • -copyFromLocal:从本地文件系统中拷贝文件到HDFS(本地还有)
    hadoop fs -copyFromLocal README.txt /test

  • -appendToFile:追加一个文件到已经存在的文件末尾
    hadoop fs -appendToFile liubei.txt /shuguo/kongming.txt

  • -put:等同于copyFromLocal
    hadoop fs -put ./test2.txt /test/

2.2 下载

  • -copyToLocal:从HDFS拷贝到本地
    hadoop fs -copyToLocal /sanguo/shuguo/kongming.txt ./
  • -get:等同于copyToLocal
    hadoop fs -get /sanguo/shuguo/kongming.txt ./
  • -getmerge:合并下载多个文件(把多个文件的内容合并放在一个文件)
    hadoop fs -getmerge /user/atguigu/test/* ./zaiyiqi.txt

2.3 HDFS直接操作

  • -ls: 显示目录信息
    hadoop fs -ls /

  • -mkdir:在HDFS上创建目录(-p创建多级目录)
    hadoop fs -mkdir -p /sanguo/shuguo

  • -cat:显示文件内容
    hadoop fs -cat /sanguo/shuguo/kongming.txt

  • -chgrp -chmod -chown:Linux文件系统中的用法一样 修改权限(Web可以直接改)

  • -cp :从HDFS的一个路径拷贝到HDFS的另一个路径
    hadoop fs -cp /sanguo/shuguo/kongming.txt /zhuge.txt

  • -mv:在HDFS目录中移动(重命名)文件
    hadoop fs -mv /zhuge.txt /sanguo/shuguo/

  • -tail:显示一个文件的末尾1kb的数据
    hadoop fs -tail /sanguo/kongming.txt

  • -rm:删除文件或文件夹
    hadoop fs -rm /user/atguigu/test/jinlian2.txt
    hadoop fs -rm -r 删文件夹

  • -rmdir:只能删除空目录
    hadoop fs -rmdir /test

  • -setrep:设置HDFS中文件的副本数量(这里设置的副本数只是记录在NameNode的元数据中 是否真的会有这么多副本 还得看DataNode的数量 因为目前只有3台设备 最多也就3个副本 只有节点数的增加到10台时 副本数才能达到10)
    hadoop fs -setrep 10 /sanguo/kongming.txt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/755724.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

走近 AI Infra 架构师:在高速飞驰的大模型“赛车”上“换轮子”的人

如果把大模型训练比作 F1 比赛,长凡所在的团队就是造车的人,也是在比赛现场给赛车换轮子的人。1% 的训练提速,或者几秒之差的故障恢复时间,累积起来,都能影响到几百万的成本。长凡说:“大模型起来的时候&am…

算法详解——选择排序和冒泡排序

一、选择排序 选择排序算法的执行过程是这样的:首先,算法遍历整个列表以确定最小的元素,接着,这个最小的元素被置换到列表的开头,确保它被放置在其应有的有序位置上。接下来,从列表的第二个元素开始&#x…

事件高级、

文章目录 1.注册事件(绑定事件)addEventListener 事件监听方式attachEvent 事件监听方式、兼容性解决方案 * 2.删除事件(解绑事件)删除事件的方式删除事件兼容性解决方案 * 3.DOM事件流4.事件对象使用语法兼容性方案*常见属性和方…

边缘计算+WEB端应用融合:AI行为识别智能监控系统搭建指南 -- 边缘设备图像识别及部署(二)

专栏目录 边缘计算WEB端应用融合:AI行为识别智能监控系统搭建指南 – 整体介绍(一) 边缘计算WEB端应用融合:AI行为识别智能监控系统搭建指南 -- 边缘图像识别及部署(二) 前言边缘图像识别与推流整体思路原始…

海康威视添加新摄像头到原建的网络监控平台中

一、适用场景 1、企业已经存在一套海康威视的监控网络系统; 2、根据业务的需求,要新增加一些摄像头; 3、原施工方忙碌,为新增加的摄像头施工成本较高; 4、新增加海康威视的摄像头视频监控,保存在原建的监控…

构建强大的API:Django中的REST框架探究与实践【第146篇—Django】

👽发现宝藏 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 构建强大的API:Django中的REST框架探究与实践 在当今的Web开发中,构…

Apache SeaTunnel MongoDB CDC 使用指南

随着数据驱动决策的重要性日益凸显,实时数据处理成为企业竞争力的关键。SeaTunnel MongoDB CDC(Change Data Capture) 源连接器的推出,为开发者提供了一个高效、灵活的工具,以实现对 MongoDB 数据库变更的实时捕获和处理。 本文将深入探讨该连…

Jackson 2.x 系列【1】概述

有道无术,术尚可求,有术无道,止于术。 本系列Jackson 版本 2.17.0 源码地址:https://gitee.com/pearl-organization/study-seata-demo 文章目录 1. 前言2. 什么是 JSON3. 常用 Java JSON 库4. Jackson4.1 简介4.2 套件4.3 模块4.…

prompt开发生命周期

1.定义任务场景和成功标准 任务场景可分为简单任务:实体抽取、qa等 复杂任务:代码生成、创意写作等 在定义任务后,就要定义模型实现该任务的成功标准: 模型表现和准确率;延迟;价格。 2.开发测试用例 多…

Vue2(七):超详细vue开发环境搭建(win7),nodejs下载与安装,安装淘宝镜像(报错已解决),配置脚手架

一、安装node.js 本来想粗略写一下的,但是搭建脚手架的时候,遇到了很多问题,浪费快两天时间,记录一下自己的解决办法希望对你们有帮助! 1.下载nodejs 安装包下载链接【CNPM Binaries Mirror】 下载我划线的这个&am…

代码随想录算法训练营第25天| 216.组合总和III、17.电话号码的字母组合

216.组合总和III 题目链接:组合总和III 题目描述:找出所有相加之和为 n **的 k ****个数的组合,且满足下列条件: 只使用数字1到9每个数字 最多使用一次 返回 所有可能的有效组合的列表 。该列表不能包含相同的组合两次&#xff0c…

2024热门外贸独立站wordpress模板

工艺品wordpress外贸主题 简约大气的wordpress外贸主题,适合做工艺品进出品外贸的公司官网使用。 https://www.jianzhanpress.com/?p5377 日用百货wordpress外贸主题 蓝色大气的wordpress外贸主题,适合做日用百货的外贸公司搭建跨境电商网站使用。 …

Qt教程 — 3.3 深入了解Qt 控件:Input Widgets部件(2)

目录 1 Input Widgets简介 2 如何使用Input Widgets部件 2.1 QSpinBox组件-窗口背景不透明调节器 2.2 DoubleSpinBox 组件-来调节程序窗口的整体大小 2.3 QTimeEdit、QDateEdit、QDateTimeEdit组件-编辑日期和时间的小部件 Input Widgets部件部件较多,将分为三…

centos上安装Docker

0.安装Docker Docker 分为 CE 和 EE 两大版本。CE 即社区版(免费,支持周期 7 个月),EE 即企业版,强调安全,付费使用,支持周期 24 个月。 Docker CE 分为 stable test 和 nightly 三个更新频道…

PlantUML Integration 编写短信服务类图

PlantUML Integration 写一个类图,主要功能为 1、编写一个serviceSms短信服务类; 2、需要用到短信的地方统一调用基建层的服务即可; 3、可以随意切换、增加短信厂商,不需要更改场景代码,只需要更改application.yml 里面…

13个外贸业务员常用邮件模板-订单沟通

除了报价后跟进客户,我们在实际工作过程当中也会遇到很多非常规性的情况,需要和客户及时沟通处理。 以下是13个外贸业务员常用邮件模板-订单沟通:你可以根据自己的行业、公司、产品情况以及自身的经验判断进行调整和完善,做出一套…

水下蓝牙耳机哪个牌子好?业界公认四大高口碑游泳耳机

在这个活力四溢的时代,人们对于健康生活方式的追求愈发热切,游泳作为一项兼顾休闲与健身的运动,深受大众喜爱。在水下世界,音乐的陪伴能增添游泳的乐趣,一款好的水下蓝牙耳机成为游泳爱好者们的新宠。 近年来&#xff…

DZY-212中间继电器 DC 220V 板后接线 面板安装 JOSEF约瑟

系列型号: DZY-200系列中间继电器;DZY-201中间继电器; DZY-202中间继电器;DZY-203中间继电器; DZY-204中间继电器;DZY-205中间继电器; DZY-206中间继电器;DZY-207中间继电器; DZY-20…

openEuler 22.03(华为欧拉)一键安装 Oracle 19C(19.22) 数据库

前言 Oracle 一键安装脚本,演示 openEuler 22.03 一键安装 Oracle 19C 单机版过程(全程无需人工干预):(脚本包括 ORALCE PSU/OJVM 等补丁自动安装) ⭐️ 脚本下载地址:Shell脚本安装Oracle数据…

ssh免密登陆更换目标主机后无法连接

在进行hadoop分布式环境搭建时(三台机,master,slave1,slave2),后期slave2系统出现问题,更换新机后,master与slave2文件传输失败: 以为是秘钥过期的问题,更换…