【Linux杂货铺】文件系统


目录

🌈前言🌈

📁 硬盘

 📂 物理结构

 📂 存储结构

 📂 CHS定址法

 📂 操作系统对硬盘的管理和抽象

📁 文件系统

 📂 分区

 📂 分组

 📂 inode号

 分配

 📂 逆向路径解析

分区挂载

目录作用

📁 总结


🌈前言🌈

        欢迎收看本期【Linux杂货铺】内容,本期主要讲解文件系统的概念,其中我们会先讲解什么是硬盘,硬盘的物理和逻辑结构分别是什么样子,最后会讲解操作系统是如何通过文件系统管理硬盘的。

        

📁 硬盘

 📂 物理结构

        硬盘也叫做磁盘,中间有一个盘面,盘面是可读可写可擦除的一个设备,每一个盘面都有一个磁头。盘面会进行高速旋转,磁头在马达和永磁铁的作用下,会左右摆动,通过电磁感应等方式,将0,1这样的数据存储在硬盘上。

        所以硬盘本质上是一个机械设备。

 📂 存储结构

        硬盘读写的基本单位就是:扇区(512 B 或者 4 KB)。

        通过上图得出结论: 1片 = n个磁道(柱面) ; n个磁道(柱面)= m个扇区

 📂 CHS定址法

        了解了磁盘上有盘片,柱面和扇区后,扇区就是磁盘读写的基本单位,想要找到数据,就要找到指定盘片上指定柱面上的指定扇区,这就是CHS定址法。

        1. 找到指定的磁头(Header)

        2. 找到指定的磁道/柱面(Cylinder)

        3. 找到指定的扇区(Sector)

        所以得出结论,盘片为什么要告诉旋转?定位指定扇区。磁头为什么要左右摆动?定位指定的磁道

 📂 操作系统对硬盘的管理和抽象

        如果OS直接使用CHS,耦合度太高(硬件改变,影响软件,软件也要改变),同时也为了方便实现内核进行磁盘管理,所以需要进行逻辑抽象。OS和磁盘进行交互的时候,基本单位是4KB(8个连续的Sector)

        我们将一个个圆的磁盘抽象成一个巨大的数组,每一个元素就是一个sector,我们就会有一个扇区数组 sector disk_array[N]。

        有了数组,天然的就会有下标index,我们就可以使用下标,通过某种算法,转换为CHS地址,这样就进行了解耦。

        举个例子,我们有个硬盘,每个面有1000个扇区,10个磁道,即每1个磁道有100个扇区。

        index / 1000 = H

        index % 1000 = temp [0 , 999]

        temp / 100 = C

        temp % 100 = S

        我们先确定在哪个盘面,在确定在哪个柱面,最终定位到在哪个扇区。

        OS每次操作只能是512B的话,效率太低。所以一般而言,磁盘访问的基本单位是512B,OS与磁盘交互的基本单位是4KB(8 * sector)。一次I/O读取更多数据,提高了效率。

        8个连续的扇区,就称作数据块。每一个块都有一个块号,我们通过 块号 * 8 = index ,就能将块号转为sector数组下标,得到扇区的下标就能转为CHS地址。

        所以对OS而言,读取数据,就以块为单位。

        所以我们只要知道了硬盘大小,就能知道有多少个块,每个块的块号也就有了,知道了起始块的块号,连续的读8个sector下标,就能转换为对应的多个CHS地址。

        这就是LBA(逻辑区块地址)。LBA可以意指某个数据区块的地址或是某个地址所指向的数据区块。

        这样就得到了LBA数组,LBA block[N],通过对数组的管理,达到对硬盘的管理,就是先描述,再组织。

📁 文件系统

        接下来,我们使用的是Linux中的ext2文件系统进行讲解。

 📂 分区

         概念:分区是将硬盘空间划分成独立的区域,每个区域可以被单独管理和使用。

 📂 分组

        我们只要管理好一个分区,就能使用相同标准管理好所有分区,进而管理好整个硬盘。

        分完区后,还是太大,所以进行分组,管理好一个组,就能管理好每个组,进而管理好一个分区。这就是分支思想。

        上图是磁盘文件系统。磁盘是典型的块设备,磁盘分区被划分为一个个block,一个block的大小是有格式化确定的,并不可以修改

        这就引入了文件系统的概念,通过文件系统管理好分组,进而管理好分区,从而管理好硬盘,每个分区有自己的文件系统,每个分区的文件系统可以不同。

        此外,我们还需要知道,Linux中,文件的内容和属性分开存储

        Data blocks (数据区):存放文件内容。也是占据区域最大的。

        Block Bitmap(块位图):记录者Data Block 中哪个数据块已经被占用,哪个数据块没有被占用。比特位的位置,表示块号,比特位的内容,表示该块是否被占用。

        inode table (inode节点表):Linux中文件属性是一个大小固定的集合体,大小是128字节,inode内部不包含文件名,并且1个文件对应1个inode。所以在内核里,不看文件名,只看inode号。

        Linux中,文件属性是一个大小固定的集合体(128 B)。其中最重要的字段是inode_num,即inode号,此外data[N]数组里面元素存储着存放内容的块的块号(N一般是15),分为一级,二级,三级等直接和间接映射

ls -li //查看文件的,并且能查看到inode

        inode bitmap:比特位的位置表示第几个inode,内容表示该inode是否空闲可用。

        GDT(块组描述符):块描述符,描述块组的信息。

        超级块(Super Block):存放文件系统本身的结构信息。记录的信息主要有:bolck inode的总量, 未使用的blockinode的数量,一个blockinode的大小,最近一次挂载的时间,最近一次写入数据的 时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏,可以说整个 文件系统结构就被破坏了。super block 存放在多个block中(2~3个),但不是每个block中都有。

        以上我们就对文件系统有了基本的概念,所以我么将硬盘分区后,分组并且写入文件系统,这就是格式化。所以格式化的本质,就是在硬盘中写入文件系统。

 📂 inode号

 分配

        inode编号的分配是以分区为单位进行分配。所以超级块 和 GDT 记录着每个分组的其实inode,结束inode,以此将inode分配个不同区域(分组)。inode bitmap 和 inode table是从0开始的,所以知道inode ,在 - 起始inode,就能对应到inode bitmap和i节点表中对应的下标,找到对应的文件属性,进而找到文件内容。

        所以不同分区可能有相同的inode,但1个分区内不能有相同的inode。

        Dateblock也是同样的原理,数据块也是整体分配,也有statr块号,end块号,有对应的块号也能映射到对应组的块号里面。

        inode映射到对应的组后,优先使用当前组的数据块,除非文件非常大,否则不建议跨组访问。但 inode 和 数据块 是可以跨组访问的。

        总结,在分区内知道了inode,就能确定在哪个分组,在组内减起始inode,就能找到inode bitmap,检测是否被用,再在i节点表中找到或存储inode属性,进而在数据块中找到对应的文件内容。

 📂 逆向路径解析

        前文中,我们讲解在内核中,操作一个文件,使用的是文件的inode,但用户使用的是文件名,所以文件名一定和inode存在映射关系。映射关系存储在哪呢?

        目录,也是一个文件,文件内容就是 文件名 和 inode的映射关系。所以有了目录,就有了文件名和inode的映射关系。

        但目录也是一个文件呀,所以目录也会查找自己的目录,找到自己的inode号,一直找到根目录为止,这就是所谓的逆向路径解析。

目录的r权限:是否允许度目录内容,即文件名:inode的映射关系,拿不到inode,就读不了。

目录的w权限:先当前目录写文件名:inode的映射关系

        逆向路径解析是OS自己做的,根据文件路径,找到文件inode,这也就是为什么要有路径的原因了,也是为什么一个目录下不能建立同名文件。

        但是逆向路径解析不是每一次都进行的,Linux会缓存常用的路径结构。

分区挂载

        之前,我们都是在一个分区内知道了inode,但是我们如何知道我们在哪个分区呢?在Linux中,分区需要挂载到指定目录,即将分区和目录进行关联,进入分区就是进入目录。

目录作用

        1. 确定在哪个分区 ;

        2. 文件名:inode的映射关系,找到指定文件的inode

        那么目录/路径谁提供的呢?我 或者 进程已经提供了。即内核文件系统提前写入并组织好,然后我们提供的。

        例如,打开一个文件open(),第一个参数需要你提供文件名,open早就提供了cwd(当前路径),拼接上你的文件名,就能得到一个路径,然后找到inode,进而创建或读写文件内容。

        总结一下:文件的创建,会在目录下创建,而路径是由内核文件系统提起写入并组织好,我们提供文件名拼接形成。如进程的cwd(存储当前路径) + 文件名 ,从而在指定目录下创建文件。再根据路径的前缀确定在哪个分区,在指定分区下申请位图,块,属性等资源,进行文件操作。

📁 总结

        以上,我们就对Linux中的文件系统做了详解,开始,我们介绍了硬盘这一物理设备,介绍了它的物理结构,存储结构以及OS如何管理硬盘,之后,我们讲解什么OS如何通过文件系统管理好分组,进而管理好分区,从而管理好整个硬盘。最后,讲解了inode是如何来的,目录和分区的关系,总结了如何创建,读写文件的。

        以上,就是本期【Linux杂货铺】的主要内容了,如果感觉本期内容对你有帮助,欢迎点赞,收藏,关注 Thanks♪(・ω・)ノ

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/810873.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

1113. 红与黑--Flood Fill 算法

目录 1113. 红与黑--Flood Fill 算法---宽搜(BFS) 输入格式 输出格式 数据范围 输入样例: 输出样例: 思路: 代码: 运行结果: 1113. 红与黑--Flood Fill 算法---宽搜(BFS&am…

股票价格预测 | Python股票价格数据导入和处理

文章目录 文章概述代码设计导入处理文章概述 股票价格预测 | Python股票价格数据导入和处理 代码设计 导入 import os import numpy as np import csv import pandas as pd import matplotlib.pyplot

python入门(一)配置环境和选择IDE

Python,作为一种简洁易懂的编程语言,近年来在全球范围内受到了广泛的关注和追捧。它不仅语法简单明了,易于上手,而且拥有强大的第三方库和广泛的应用领域。从数据分析、机器学习到Web开发,Python都能发挥出色的性能&am…

4.8QT

将按钮3,基于qt4版本连接实现点击按钮3,实现关闭窗口。 widget.cpp #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget), btn3(new QPushButton(this)) {ui->s…

区块链相关概念

区块链是什么,就算是做计算机技术开发的程序员,100个当中都没有几个能把这个概念理解明白,更不要说讲清楚了。那对于普通人来说,就更扯了。 除了“挖矿”表面意思似乎比较好理解外,其他的基础概念真TMD绕。 去中心化、…

2024MathorCup(妈妈杯) C题完整思路+数据集+完整代码+高质量成品论文

C题物流网络分中心货量预测及人员排班 (完整的资料数据集代码在文末) 电商物流网络在订单履约中由多个环节组成,其中,分拣中心作为网络的中 间环节,需要将包裹按照不同流向进行分拣并发往下一个场地,最终使…

快速实现一个Hibernate的例子

写第一个简单的Hibernate程序: 具体的开始第一个Hibernate程序之前: 找到jar包, hibernate 的核心包, mysql数据库的连接驱动包, junit测试包 ①创建Hibernate配置文件 ②创建持久化类 也是和数据库中数据表一一对应这个类 ③创建对象-关系映射文件 ④通过hibern…

Android开发基础:对话框,Toast,Notification的使用 选项菜单,上下文菜单,弹出式菜单的使用

目录 一,Android提示消息 1.提示消息的形式 2.对话框 (1)默认对话框的创建步骤 (2) 自定义对话框的创建步骤 3.Toast 4.Notification 二,菜单 1.选项菜单 OptionsMenu 2.上下文菜单 ContextMenu …

LeetCode-1143. 最长公共子序列【字符串 动态规划】

LeetCode-1143. 最长公共子序列【字符串 动态规划】 题目描述:解题思路一:动规五部曲解题思路二:1维DP解题思路三:0 题目描述: 给定两个字符串 text1 和 text2,返回这两个字符串的最长 公共子序列 的长度。…

【2024年MathorCup数模竞赛】C题赛题与解题思路

2024年MathorCup数模竞赛C题 题目 物流网络分拣中心货量预测及人员排班背景求解问题 解题思路问题一问题二问题三问题四 本次竞赛的C题是对物流网络分拣中心的货量预测及人员排班问题进行规划。整个问题可以分为两个部分,一是对时间序列进行预测,二是对人…

【MATLAB源码-第186期】matlab基于MLE算法的8天线阵列DOA估计仿真,对比粗估计、精确估计输出RMSE对比图。

操作环境: MATLAB 2022a 1、算法描述 第一部分:基本概念与系统设置 方向到达估计(Direction of Arrival, DOA)是信号处理中一项重要的技术,主要用于确定信号的到达方向。这种技术在雷达、无线通信和声纳等领域中有…

蓝桥杯省赛冲刺(3)广度优先搜索

广度优先搜索(Breadth-First Search, BFS)是一种在图或树等非线性数据结构中遍历节点的算法,它从起始节点开始,按层级逐步向外扩展,即先访问离起始节点最近的节点,再访问这些节点的邻居,然后是邻…

有关格式输入输出的问题

对于格式输入输出问题&#xff0c;我们最好用c语言编写代码&#xff01;&#xff01;&#xff01; 成绩统计 难点&#xff1a;格式化输出 #include <cstdio> using namespace std; typedef long long ll;ll n,score,a,b;int main() {//及格>60 优秀>85 求及格率…

mysql题目1

tj11: ​ select * from t_student where grade 大一 and major 软件工程 ​ tj12: SELECTt_student.name, count(t_choice.cid)FROMt_choiceINNER JOINt_courseON t_choice.cid t_course.idINNER JOINt_studentON t_choice.sid t_student.id GROUP BYt_choice.sid HAVIN…

《疯狂java讲义》Java AWT图形化编程中文显示

《疯狂java讲义》第六版第十一章AWT中文没有办法显示问题解决 VM Options设置为-Dfile.encodinggbk 需要增加变量 或者这边直接设置gbk 此外如果用swing 就不会产生这个问题了。

ZGC的介绍

背景 在jdk17中已经将ZGC从实验性产品升级到正式产品功能&#xff0c;达到亚毫秒级停顿&#xff0c;毫不留情地将parallel和G1拉开了数量级的差别&#xff0c;无论是平均停顿还是最大停顿时间都能毫不费劲地控制在10ms内。 《深入理解Java虚拟机》在书中这样定义&#xff1a;Z…

Python3.7编程之病毒

基础篇 什么是病毒 病毒&#xff0c;指的是一些通过非法手段获取系统的一些权限&#xff0c;然后进行破坏或者盗取。 病毒分为两类&#xff1a; 1、破坏型 这类病毒往往会将系统弄的乱七八糟&#xff0c;比如把你的U盘删光&#xff0c;把你的系统背景调成黑客图片&#xff0c…

CorelDRAW苹果版提示请重新连接具有文件位置的设备...的解决方法

今天小编想更新一下CorelDRAW2024苹果版&#xff0c;但升级完成依次提示“请重新连接具有文件位置的设备&#xff0c;或选择新文件夹。同时&#xff0c;内容将保存在Corel 默认位置。您可以在恢复文件位置之后移动内容”和“尝试重新启动计算机和应用程序。如果这些操作还是不能…

python 的join函数

join函数是一个对字符串处理的函数 字符串.join(str)的含义是把字符串加入到str的每一个间隙里面 如 str1234 ,.join(str) #打印的结果为 1,2,3,4

逆向案例十九——某音乐搜索页面参数多文件webpack加密,采用全复制加补环境的做法。

网址&#xff1a;搜索 - QQ音乐-千万正版音乐海量无损曲库新歌热歌天天畅听的高品质音乐平台&#xff01; 进行搜索找到数据包&#xff1a; 发现载荷有加密参数sign: 在下方搜索框搜索sign:,进入js加密文件 进入js文件找到加密位置&#xff1a; sign由i赋值&#xff0c;在前面…