【Linux】EXT2文件系统 | 磁盘分区块组 | inode

文章目录

  • 一、前言
  • 二、EXT2文件系统 - 逻辑存储结构
    • 💾分区(Partition)
        • 分区的概念
        • 每个分区的内容
        • Linux下查询磁盘分区
    • 💾块组(Block Group)
        • 磁盘格式化
        • 每个块组的内容
          • 1. Superblock(超级块)
          • 2. Group Descriptor Table(组描述符表)
          • 3. Block Bitmap(块位图)
          • 4. inode Bitmap(inode位图)
          • 5. inode Table(inode表)
          • 6. Data Blocks(数据块)
  • 三、操作磁盘文件的过程
    • ✨创建文件
    • ✨找到文件
    • ✨删除文件
    • ✨恢复文件

一、前言

在上篇 文件IO 文件系统调用 文件fd 重定向 文章中,我们已经学习了在内存中被打开(被加载)的文件,还有一部分是磁盘中未被打开的文件。这篇我们来谈磁盘文件。

Linux对文件的管理工作:

  1. 管理被打开的文件
  2. 管理磁盘中没有被打开的文件

以上两点构成了Linux的文件系统,文件系统这个名词狭义上指的是磁盘文件系统,例如Linux下的ext2文件系统。




二、EXT2文件系统 - 逻辑存储结构

💾分区(Partition)

分区的概念
  • 定义: 将硬盘划分为逻辑上独立的单元。

  • 作用: 实现文件系统的组织和管理,提供隔离的存储空间,体现了分治的思想。

    请添加图片描述

每个分区的内容
  • 对于每一个分区:
    请添加图片描述

Boot Block(引导块):

  • 定义: Boot block是文件系统中的第一个块,通常包含引导加载程序和文件系统的元数据,用于引导操作系统。
  • 作用: 存储引导加载程序,提供文件系统的起始点,引导操作系统的启动。

Linux下查询磁盘分区

可以通过以下命令查看当前Linux系统的分区:

  1. 使用 lsblk 命令:
lsblk /dev/vda

请添加图片描述

上述命令会列出 /dev/vda 设备的分区信息,包括每个分区的大小、挂载点等。


  1. 使用 fdisk 命令:
sudo fdisk -l /dev/vda

请添加图片描述

上述命令会显示 /dev/vda 设备的分区表信息,包括每个分区的起始扇区、大小等。可能要使用sudo提权。


  1. 使用 df -h
df -h

请添加图片描述

相当于Windows的 “此电脑”,df -h 提供了一个快速的方式来查看系统上各个文件系统的存储使用情况,以便及时了解磁盘空间的分布和使用率。




💾块组(Block Group)

ext2文件系统会根据分区的大小划分为数个块组(Block Group)。而每个块组都有着相同的结构组成。块组也被称为分组块组是由分区细分出的产物。

磁盘格式化
  1. 当磁盘完成分区后,我们还需要对磁盘进行格式化
  2. 磁盘格式化就是对磁盘中的分区进行初始化的一种操作,这种操作通常会导致现有的磁盘或分区中所有的文件被清除。
  3. 磁盘格式化就是对分区后的各个区域写入对应的管理信息

其中,写入的管理信息是什么是由文件系统决定的,不同的文件系统格式化时写入的管理信息是不同的,常见的文件系统有EXT2、EXT3、XFS、NTFS等。

每个块组的内容

块组与分区的关系如图所示:
请添加图片描述

当我们考虑一个块组中的内容时,以下是一个块组中包含的内容:

1. Superblock(超级块)
  • 定义: 超级块是文件系统中一个关键的元数据块,包含有关整个文件系统的信息
  • 作用: 提供整个块组的整体信息。存放文件系统本身的结构信息。
  • 记录的信息主要有:
    • block和 inode的总量
    • 未使用的block和inode的数量
    • 一个block和inode的大小
    • 最近一次挂载的时间
    • 最近一次写入数据的时间
    • 最近一次检验磁盘的时间等其他文件系统的相关信息。
      Super Block的信息被破坏,可以说整个文件系统结构就被破坏了
2. Group Descriptor Table(组描述符表)
  • 定义: 组描述符表存储了关于每个块组的元信息,包括块组中的inode和数据块的位置,以及空闲块和inode的数量等信息。

  • 作用: 提供了有关块组的重要信息,帮助文件系统在块组级别进行管理和分配。

  • 组描述符表中的主要信息包括:
    1. 块组的起始块号: 记录块组的起始块号,用于定位块组在整个文件系统中的位置。
    2. 块位图的起始块号: 记录块组中块位图的起始块号,用于定位块组中块的分配情况。
    3. Inode位图的起始块号: 记录块组中Inode位图的起始块号,用于定位块组中Inode的分配情况。
    4. Inode表的起始块号: 记录块组中Inode表的起始块号,用于定位块组中Inode的存储位置。
    5. 空闲块的数量: 统计块组中未分配的空闲块数量。
    6. 空闲Inode的数量: 统计块组中未分配的空闲Inode数量。

3. Block Bitmap(块位图)
  • 定义: 块位图是一个位图,记录块组中每个块的使用情况,标记哪些块已被分配,哪些是空闲的
  • 作用: 帮助文件系统管理块的分配和释放,维护块的空闲状态。
4. inode Bitmap(inode位图)
  • 定义: Inode位图是一个位图,记录块组中每个inode的使用情况,标记已分配和空闲的inode
  • 作用: 帮助文件系统管理inode的分配和释放,维护inode的空闲状态。
5. inode Table(inode表)
  • 定义: Inode表存储了块组中所有文件和目录的元数据,每个文件和目录都关联到一个唯一的inode。
  • 作用: 记录文件的属性信息,如文件大小、权限、属主等。

一个典型的inode结构包含以下信息:

  1. 文件类型(File Type): 表示Inode关联的文件类型,如普通文件、目录、符号链接等。

  2. 权限和所有者信息:

    • 文件所有者(User ID)
    • 文件所属组(Group ID)
    • 文件权限(Read、Write、Execute)
  3. 时间戳:

    • 文件的最后访问时间(atime)
    • 文件的最后修改时间(mtime)
    • Inode的最后修改时间(ctime)
  4. 文件大小: 记录文件的大小(以字节为单位)。

  5. 链接数: 记录连接到该Inode的硬链接数量。当链接数为0时,表示文件不再被引用,可以被删除。

  6. 数据块指针:

    • 直接块指针(Direct Block Pointers):用于存储文件的前一定量数据块。
    • 单间接块指针(Single Indirect Block Pointer):指向一个块,该块包含更多数据块的指针。
    • 双间接块指针(Double Indirect Block Pointer):指向一个块,该块包含单间接块的指针。
  7. 文件系统标志: 记录Inode所属的文件系统的特定标志。

6. Data Blocks(数据块)
  • 定义: 数据块是用于存储文件实际数据的块,也包括目录中文件名和对应inode的映射。
  • 作用: 存储文件和目录的实际内容,包括文件数据和目录项。



三、操作磁盘文件的过程

✨创建文件

请添加图片描述

  1. 存储属性
    内核先找到一个空闲的i节点(这里是263466)。内核把文件信息记录到其中。
  2. 存储数据
    该文件需要存储在三个数据块,内核通过块位图找到了三个空闲数据块:300,500,800。将内核缓冲区的第一块数据复制到300,下一块复制到500,以此类推。
  3. 记录分配情况
    文件内容按顺序300,500,800存放。内核在inode上的磁盘分布区记录了上述块列表。
  4. 添加文件名到目录
    假如新的文件名是“abc”。linux如何在当前的目录中记录这个文件?内核将映射关系(263466,abc)添加到目录文件。文件名和inode之间的对应关系将文件名和文件的内容及属性连接起来。

✨找到文件

在Linux操作系统的ext2文件系统中,通过一个文件的inode找到该文件的过程涉及到文件目录、内核缓冲区等关键概念。以下是找文件的步骤:

  1. 文件目录(Directory):

    • 文件目录是一个特殊的文件,用于存储文件名与其对应的inode号之间的映射关系。每个目录项都包含文件名和对应文件的inode号。
  2. 查找文件的inode:

    • 当用户提供一个文件名时,内核首先会查找文件所在的目录,即打开包含文件名的目录文件。这可以通过系统调用如 opendirreaddir 来实现。
  3. 读取目录文件:

    • 文件目录是一个包含目录项的文件。通过系统调用 readdir 等,内核将目录文件的内容读入内核缓冲区。
  4. 在内核缓冲区中查找目录项:

    • 内核缓冲区中存储了目录文件的内容,包括文件名和对应的inode号。内核根据用户提供的文件名在内核缓冲区中查找相应的目录项。

目录项

目录项是文件系统中的一个记录单元,用于将文件名与其对应的inode号关联起来。每个目录项包含一个文件或目录的名称以及与之相关联的唯一标识符(inode号),该标识符用于定位并访问文件或目录的详细元数据。目录项是构建目录结构的基本组成部分,使得文件系统能够有效地组织和检索文件。

  1. 获取文件的inode号:

    • 一旦找到了目录项,就可以从中获取文件对应的inode号。
  2. 访问文件的inode:

    • 使用文件的inode号,内核再次进行系统调用(例如 stat)来获取文件的详细元数据。这涉及到文件系统的访问操作,文件系统会将对应inode的信息读取到内核缓冲区中。
  3. 获取文件的数据块:

    • 通过读取inode中的数据块指针,内核可以找到文件的实际数据块。
  4. 读取文件内容:

    • 最终,内核可以通过读取文件的数据块来获取文件的实际内容。

总体而言,文件系统通过在文件目录中查找文件名与inode号的映射关系,然后通过inode号来获取文件的详细信息,最终访问文件的实际数据块,实现了从用户提供的文件名到文件内容的映射过程。这一系列操作都依赖于内核缓冲区。


✨删除文件

  1. 将该文件对应的inode在inode位图当中置为无效(比特位设置为0)。
  2. 将该文件申请过的数据块在块位图当中置为无效(比特位设置为0)。

✨恢复文件

因为删除操作并不会真正将文件对应的信息删除,而只是将其inode号和数据块号置为了无效,所以当我们删除文件后短时间内是可以恢复的,在删除后,有些操作系统会记录日志,日志中会保存被删的inode编号!
为什么说是短时间内可恢复呢?因为该文件对应的inode号和数据块号已经被置为了无效,因此后续创建其他文件或是对其他文件进行写入操作申请inode号和数据块号时,可能会将该置为无效了的inode号和数据块号分配出去,此时删除文件的数据就会被覆盖,也就无法恢复文件了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/668643.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

106 C++ STL 标准模版库大局观,重要概念

一 C标准库 C standard Library。 只要你装了C编译器,那么这个 C标准库就会被自动的安装进来了。 为什么要装进来这个呢?主要是为了解决可复用问题。 C标准库给我们提供了大量的成熟的可使用的功能。因此用好 标准库,是一个合格的C程序员的…

【Delphi 基础知识 28】ListView控件的详细使用

文章目录 控件设置增加数据删除选中的行按标题删除读取某行某列内容修改某行某列内容清空内容设置焦点上下移动条目读出选中行信息点击正反排序每行item显示不一样的颜色 控件设置 ViewStyle 设为vsReportReadOnly 设为TrueGridLines 设为TrueRowSelect 设为True 增加数据 …

《Redis核心技术与实战》学习笔记0——开篇词 | 这样学Redis,才能技高一筹

开篇词 | 这样学Redis,才能技高一筹 文章目录 开篇词 | 这样学Redis,才能技高一筹为什么懂得了一个个技术点,却依然用不好 Redis? 作为键值数据库,Redis 的应用非常广泛,如果你是后端工程师,我猜…

Kubernetes的有状态应用示例:使用StatefulSet部署Cassandra

文章目录 环境概述准备为Cassandra创建headless service验证Cassandra StatefulSet修改Cassandra StatefulSet清理Cassandra容器环境变量参考 环境 RHEL 9.3Docker Community 24.0.7minikube v1.32.0 概述 本例展示了如何在Kubernetes上运行Apache Cassandra。Cassandra是一…

RCS-YOLO复现

复现结果–Precision:0.941,Recall:0.945,AP 50 _{50} 50​:0.941,AP 50 : 95 _{50:95} 50:95​:0.693,误差在5个点内,可以接受 感想 第5篇完全复现的论文

Palworld幻兽帕鲁自建服务器32人联机开黑!

玩转幻兽帕鲁服务器,阿里云推出新手0基础一键部署幻兽帕鲁服务器教程,傻瓜式一键部署,3分钟即可成功创建一台Palworld专属服务器,成本仅需26元,阿里云服务器网aliyunfuwuqi.com分享2024年新版基于阿里云搭建幻兽帕鲁服…

如何做餐饮业满意度调研

餐饮满意度调研是一种评估顾客对餐厅服务、菜品口感、环境和服务等方面满意度的重要手段。随着餐饮市场竞争的日益激烈,顾客满意度成为了餐饮企业竞争力的重要指标之一。通过这种调研,餐厅可以了解顾客的需求和期望,从而改进服务质量&#xf…

「Kafka」消费者篇

「Kafka」消费者篇 Kafka 消费方式 Kafka 消费者工作流程 消费者总体工作流程 新版本(0.9之后)的 offset 保存在 kafka 的 Topic 里,持久化到磁盘,可靠性有保障。 老版本(0.9之前)的 offset 保存在 Zook…

docker 离线安装镜像

一、导出镜像 下载完镜像后&#xff0c;我们需要将其导出为tar文件&#xff0c;以便在离线环境中使用。 执行以下命令导出镜像&#xff1a; docker save -o <保存路径>/<镜像名>_<版本>.tar <镜像名>:<版本>其中&#xff0c;<保存路径>是…

uniapp中配置开发环境和生产环境

uniapp在开发的时候&#xff0c;可以配置多种环境&#xff0c;用于自动切换IP地址&#xff0c;用HBuilder X直接运行的就是开发环境&#xff0c;用HBuilder X发布出来的&#xff0c;就是生产环境。 1.使用HBuilder X创建原生的uniapp程序 选择vue3 2.什么都不改&#xff0c;就…

机器学习复习(8)——基本概念

目录 "benchmark"和"baseline"的定义和区别 R1 score概念 LoRA微调概念 "benchmark"和"baseline"的定义和区别 在计算机视觉领域的论文中&#xff0c;"benchmark"和"baseline"这两个术语经常被使用&#xff0…

【日常总结 - java】list 与 字符串(用逗号隔开)相互转换

一、list 转 字符串 第一种&#xff1a;使用谷歌Joiner方法 (推荐) 第二种&#xff1a;循环插入逗号 第三种&#xff1a;stream流 (推荐) 第四种&#xff1a;lambda表达式遍历并加入逗号 二、字符串 转 list 方法一&#xff1a;使用split()方法 方法二&#xff1a;使用C…

algo-桶排序

桶排序 桶排序是一种分布排序&#xff0c;将元素数组分到多个桶内&#xff0c;然后每个桶再分别进行排序。 其计算复杂度取决于对桶内排序所用算法、使用桶数量以及输入均匀度。 主要流程如下 建立空桶数组将原始数组发布到各桶中对非空桶进行排序按照顺序从非空桶里面收集…

一文讲透ast.literal_eval() eval() json.loads()

文章目录 一文讲透ast.literal_eval() eval() json.loads()1. ast.literal_eval()2. eval()3. json.loads()4. 总结 一文讲透ast.literal_eval() eval() json.loads() 在Python库中&#xff0c;我们经常会遇到需要将字符串转换为相应对象或数据结构的情况。在这种情况下&#…

ShardingSphere 5.x 系列【5】Spring Boot 3 集成并实现读写分离

有道无术&#xff0c;术尚可求&#xff0c;有术无道&#xff0c;止于术。 本系列Spring Boot 版本 3.1.0 本系列ShardingSphere 版本 5.4.0 源码地址&#xff1a;https://gitee.com/pearl-organization/study-sharding-sphere-demo 文章目录 1. 概述2. 使用限制3. 案例演示3.…

ReactNative实现文本渐变

我们直接上图&#xff0c;可以看到上面文本的效果&#xff0c;使用SVG实现 1.首先还是要引入react-native-svg库 2.使用该库下面的LinearGradient和Text 好&#xff0c;话不多说&#xff0c;我们看具体代码 <Svg width{422} height{30} viewBox{0 0 422 30}><Defs&…

linux i2c驱动实例之ISL29035

目录 概述 1 认识ISL29035 1.1 ISL29035特征 1.2 ISL29035工作电路 1.3 ISL29035工作时序分析 1.4 ISL29035相关的寄存器 1.4.1 COMMAND-1( 0x00 ) 1.4.2 COMMAND-11&#xff08;0x01&#xff09; 1.4.3 DATA寄存器&#xff08;0x02和0x03&#xff09; 1.4.4 中断报警…

linux时钟类型

背景&#xff1a;在线程中使用wait时&#xff0c;中间修改了系统时间&#xff0c;线程一直阻塞&#xff0c;并未向下执行。 原因分析&#xff1a;wait等待时间采用了系统时间去等待&#xff0c;系统时间向后修改后&#xff0c;无法等到相应的时间点&#xff0c;从而导致线程阻…

解决Django应用部署时激活链接缺少端口号的问题

引言 在当今技术迅速发展的时代&#xff0c;前后端分离已经成为现代Web开发的一项标准实践。然而&#xff0c;当我们将这些先进的架构部署到生产环境时&#xff0c;常常会遇到一些预料之外的挑战。 问题说明 在一个典型的例子中&#xff0c;我在Windows环境下开发了一个采用…

离线环境怎么下载python依赖包

公司内网环境无网络&#xff0c;运行自动化脚本需要安装python模块 1、脚本依赖包及其版本获取&#xff0c;记录在requirements.txt中 pipreqs ./script --encodingutf8 requirements.txt注意&#xff0c;这里是将./script 里的python模块自动扫描并写入到requirements.txt中…