【Linux笔记】文件系统与软硬链接

一、文件系统概述

1.1、先来聊一聊“磁盘”

在讲解文件系统之前,我觉得有必要先聊一下“磁盘”,因为我觉得如果弄懂了磁盘的存储原理,大家可能更容易理解文件系统是怎么管理数据的,并且理解计算机是怎么将磁盘抽象到文件系统的。

当然,我们毕竟不是学硬件的,也不需要将磁盘弄得一清二楚,我们只需要搞懂它的大致存储原理即可。

1.1.1、磁盘的运动寻址原理

现在我们用的笔记本电脑已经不装磁盘了,现在的笔记本电脑用都是固态硬盘了。但是理解好磁盘还是能帮助我们更好的理解文件系统。

我们电脑中的磁盘一般都长这样:

没错,就是这个有点像关盘一样的方块,它就是我们电脑中用来存储数据的主要硬件,它的主要构成有两个:磁头和盘片。磁头就是上面图中有点像针尖一样的东西,盘片就是那个圆圆的铁片。

上面的图片可能角度不对,看到的好像就只有一个磁头和盘片,但是整个“磁盘方块”里面可不止一个磁头和盘片,而是有很多个磁头和盘片:

但弄懂磁盘的工作原理只需要弄懂一个磁盘和盘片是怎么工作的就行了,其他的磁头和盘片的工作原理也一定是相同的。

磁盘的工作原理:

磁盘的工作和存储主要是有磁头和盘片来完成的,是通过磁头在磁盘上“扫描”来定位磁盘上的任意位置传递信息存储数据的。

首先磁头是可以来回摆动的,并且盘片可以来回转动,通过磁头和盘片的来回运动,磁头就可以定位到盘片上的任意位置:

这其实就好比在盘片上建立了一个“直角坐标系”,磁头是来回在y轴上来会运动,而盘片的运动就好比在x轴上来会运动,这样这个坐标系内的所有角落都能被磁头所扫描到了:

那磁头的“寻址”究竟是在寻什么呢?

那就要把盘片拿出来好好聊一下了,站在使用磁盘的角度,盘片其实是由很多个“同心环”组成的;

这每一个环有一个名字叫做“磁道”,这就很像是我们现实生活中学校中的环形塑胶跑道。

而磁头的来回摆动其实就是在定位某一个磁道,而对于每一个环形的磁道,我们又可以将其分成很多份,而这每一份这是我们磁盘中的最小存储单元——扇区:

注意:“扇区”并不是上图中像一块三角形“披萨”的一整块区域,而是我上面专门标红色的那一块像一根短的“管子”的区域。

所以磁头和盘片的来回协同工作其实就是在定位磁盘中的最小存储单位——扇区,然后由磁头来传递信息存储数据,至于磁头到底是传递什么信息来存储数据的,我们不用关心,我们只需要知道磁头和盘片协同工作的目的是定位扇区就行了。

1.1.2、磁盘的存储逻辑抽象

那我们的文件系统难道要来控制磁头和盘片的运动来找到对应的扇区吗?

其实不是的,其实文件系统在上层并不关心什么扇区和磁头。

那文件系统是如何定位扇区的呢?

这就需要我们对磁盘进行再次的抽象了,我们上面说到的“磁道”其实我们也可以不把它想象成一个环,也可以把它想象成一个长方形或者是一个长长的带子,就有点像是以前的磁带:

然后我们再把一条条磁带连接成一条更长的磁带,就像下面这样:

所以,这不就是我们经常使用的数组吗?!所以在文件系统中其实并不用关心什么扇区和磁头磁道,只需要找到这个“数组”中的对应位置即可定位扇区,即找到对应的下标,至于真正找到对应的扇区的工作就交给磁盘这个硬件了。

所以对于一个盘片是这样,那对于其它盘片也一定是这样,无非就是上面的数组更长了些,磁盘硬件在寻址的时候多做一些工作比如找对应的磁头,找对应的盘面罢了。

1.2、将磁盘的逻辑再抽象到软件层

上面讲到的扇区是磁盘的最小存储单位,扇区的大小一般是512字节,但是对于文件系统来说,512字节还是太小了,所以在文件系统中最小的存储单位一般是8个扇区,这8个扇区就租成了一个“块”,文件系统的最小存储单位是“块”,一个扇区是512字节,那8个扇区就是4096字节,也就是4Kb,所以文件系统中的最小存储单位块的大小一般是4字节。

但是现在的磁盘一般都有几百GB的大小,大的有几TB大小,这么大的一块空间,如果文件文件系统想要整体管理起来也是压力很大的,所以分区的概念就出来了。

就像上面说的,我们将一个盘片管理好了,那其他的盘片的管理方法既可以照搬之前的盘片的管理方法。文件系统中的分区也是一样,我们只需要将一个分区管理好,那其他的分区也就可以照搬之前的分区的管理方法了。

例如现在有一个500GB的磁盘,那我们就可以将它分成4个分区,其中三个分区每个分区100GB,剩下一个分区是200GB:

这也就是我们平时用的电脑为什么会分出C盘、D盘、E盘、F盘……的原因,我们的电脑上虽然分出了C盘、D盘……但这却不是说明我们的电脑上有多个磁盘哦,这些C盘等等其实都只是“分区”,其实我们的电脑上至始至终都只有一个磁盘!

1.3、磁盘分区怎么管理?

虽然操作系统已经帮我们把整个磁盘分成了几个分区,但是对于一个分区来说,分区还是觉得让它直接来管理100GB到200GB的空间有点压力大,所以分区有将自己分成了好多个“组”,从此以后只要将一个组管理好了,那么分区中的剩下的组的管理方案就可以直接复用一个的管理方案了。

比如我们现在有一个100GB的分区,我们就可以将它分成2GB一组,总共分成50组:

其实上面的一系列从磁盘到分区再从分区到分组,其实就是一种“大事化小、分而治之”的策略,也就是是分治算法的核心思想,所以由此可以看出,操作系统的设计也是有算法的支持的。

那么文件系统最重要做的就是对一个分组进行管理,既然要管理一个组,那么这个组内就一定要有很多管理信息。

一个组内的管理信息大致如下图所示:

所以接下来就是大致的介绍一些组内的各个管理信息模块具体是什么。

1.3.1、inode Table

在讲inode Table之前,我们必须先弄懂什么是inode?

ls指令是我们在shell中经常用到的指令,但是不知道大家有没有用过ls的一个选项-i?使用了这个选项之后,在我们下是的文件面前会比以前多出一列数据:

而这一列多出来的数据就是我们今天要讲的inode。

这一列数据我们以前好像从来没见过啊?事实上,这个inode我们不用见,而且见了也没用,因为只有操作系统有权利使用它。这个inode是操作系统识别一个文件的唯一标识,也就是说操作系统在识别文件的时候只和inode有关,与文件名及其他属性无关!

而这个inode本质上也是一个内核级的结构体,其结构体名称就叫做inode,这个结构体中有很多关于对应文件的属性,包括:大小、权限、所有者、所属组、ACM时间、inode编号等。我们上面查到的显示在文件最前列的其实只是这个结构体的inode编号,操作系统在识别一个文件的时候,其实也是根据这个inode编号来识别的。

而这个inode编号在分区内具有唯一性,跨分区就可能不唯一了,但这没问题因为操作系统在查找一个文件的时候会先确定在哪一个分区。

而在系统内会将文件路径和inode编号建立映射,之后用户在查找一个文件的时候,其实是系统先根据文件路径找到对应的inode编号,再由inode编号找到对应的文件,所以这也就解释了为什么同一个目录下不允许存在同名文件了,因为inode是可以保证唯一的,路径也是可以保证唯一的,而如果文件名在同一个目录下不保证唯一,那么在查找inode的时候就会存在歧义。

所以这个inodeTable就是用来存储该组中存储的所有文件对应的inode结构体,它的本质就是一个结构体数组。

而对应文件的内容其实是存储在Data blocks中的。

1.3.2、Data blocks

其实这个Data blocks才是整个组内的主要存储空间,其他的都是些辅助描述的模块,这个Data blocks里面就是一个个的数据快,即上面所说的有8个扇区组成的4kb大小的“块”:

而这个Data blocks实际上也相当于一个二维数组,所以想要在里面定位某一个块,也只需要找到对应的下标即可。

而inode既然是存储文件属性的结构体,那当然也要存储对应文件所在的块信息了,所以在inode结构体中有一个数组int blocks[N],里面就存储这inode所对应的文件的内容所在的块信息。

所以操作系统在打开一个文件的时候,只需要找到inode,再通过inode中的blocks数组找到文件内容所在的块,讲这些块中的数据加载到内存即可。

1.3.3、Block Bitmap和inode Bitmap

那一个组内肯定能存储很多个文件,所以也就会存在很多个inode,而且一个组内也一定会有很多个数据块,我们怎么知道某一个inode或某一个数据块是否被使用呢?

很显然我们现在只需要知道某一个niode或块是否被使用,而我们以前学过一个很高效的存储是或否的数据结构——位图。

所以Block Bitmap和inode Bitmap正如它们的名字一样是两个位图。

所以我们想要创建一个文件,就只需要分配一个未被使用过的inode编号,然后加载文件属性到inode结构体中,然后在分配一些未被使用过的数据块存储文件的内容。接着再将Block Bitmap和inode Bitmap中对应的比特位为由0置1即可。

而删除一个文件就简单了,我们只需要将Block Bitmap和inode Bitmap中对应的比特位由1置0即可,不需要将对应的inode结构体和数据块内的数据全部清空,因为后面再有新的文件创建的时候这些数据是可以被覆盖的。

1.3.4、super block

而这个super block则存放的是文件系统本身的信息。记录的主要信息有:block和inode的总量,未被使用的block和inode的数量,一个block和inode的大小,最近一次挂载的时间,最近一次写入数据的时间等等等等……

这个super block也是相当重要的,因为它存储的是管理文件系统本身的结构信息,所以若是super block被损坏了,那么整个文件系统也就被破坏了,而文件系统损坏了,电脑也肯定会出很多的问题,也有可能会直接报废了。

正是因为super block如此重要,我们的文件系统就为我们多创建了几份super block的拷贝,放在不同的块组中,一旦有一个super block损坏了,文件系统就会通过备份的super block来自动修复。

1.4、文件系统与用户层的联系

那么文件系统又是怎么和用户层进行联系的呢?或者说我们平时看到的文件名、目录、普通文件的本质是什么呢?

先来看看目录,我们可以试着用vim来打开一个目录文件:

我们发现一个目录文件也是可以用vim打开的,而这个目录文件里面好像写的就是该目录的路径和目录中所有文件的文件名和一个上级目录..

而我们知道Linux的文件结构其实就是一颗多叉树的结构:

而一个目录,在这颗多叉树中我们可以理解成一个父节点,一个普通文件我们可以理解成一个叶结点。

所以也就注定了文件系统在查找一个文件的时候,遇到目录一再要向下寻找,而我们说过操作系统在识别一个文件的时候只认inode,所以目录中的文件名一定就要有与对应的inode的映射关系。

所以目录中的内容就是保存着目录中所有文件的包括自身的文件名和inode的映射关系!而一个普通文件(我们在用户层看到的)就只是一个文件名和inode的映射。

或者说我们看到的只是一个key值,因为inode和文件名可以说是一个互为键值的关系。

二、硬连接与软连接

2.1、什么是硬连接与软连接

硬连接和软连接其实和他们的名字一样,只是起到了一个“链接”作用而已。

先来看软连接:

如果我们想要在系统中创建一个软连接,可以用ln -s指令:

然后我们可以像使用原test.txt文件一样使用test.soft,对它们两个其中任意一个的任何操作都是一样的:

我们可以看到,对于它们两个中任意一个写入,两个文件中的内容都是一致的,那这是不是说明他们两个是同一个文件呢?

根据我们上面所说的,我们也应该知道每一个文件都有一个唯一的inode,所以我们只需要看看这两个文件的inode是否相同即可:

而结果是这两个文件的inode并不相同,所以它们并不是同一个文件,也就是说软连接是一个独立的文件。

那为什么它们的数据会同步呢?

其实大家根据这里的同步效果,可能已经想到了我们windows中的一个类似的链接方式——快捷方式:

事实上,Linux中的这个软连接就相当于windows中的快捷方式,而为什么要有这样的快捷方式其实也很好理解,有些时候我们的程序可能藏的比较深,我们想要访问到它可能需要打开很多的文件夹去寻找,这时候我们就可以在我们的桌面创建一个这样的快捷方式,这样我们以后想访问这个程序就直接打开我们桌面的这个快捷方式即可。

那我们应该怎样理解这个软连接呢?它是怎么做到帮我们快速连接一个文件的呢?

其实很简单,就如我们上面所说的系统在查找一个文件的本质其实就是通过文件的路径去找到对应的inode,所以我们想要找到一个文件就只需要找到这个文件所在的路径即可,所以软连接中存储的其实就是目标文件的路径!

这个其实在windows中就能很好的看出来:

所以结论就是:软连接就是一个独立的普通文件,而这个普通文件中存储的就是目标文件对应的路径,系统在通过软连接打开目标文件时,其实是通过软连接文件中存储的路径去访问对应的目标文件的。

那么什么又是硬链接呢?

如果我们想要在系统中创建一个硬链接,可以使用ln指令:

而硬链接和软连接一样,信息也是同步的:

那它们俩是不是同一个文件呢?我们看一看他们的inode就知道了:

从结果中我们会惊奇的发现,目标文件和硬连接文件的inode竟然是相同的,那这不就说明了它们两个是同一个文件了吗?

严格来说,一个链接并不是一个文件,它只是一个指定目录下的一组文件名和inode的映射关系。

因为操作系统不会做任何浪费时间或空间的事情,如果一个文件和另一个文件完全相同,操作系统是不会为我们多创建一个的!

为什么能这么说呢?怎么证明呢?

我们先来看一个现象,如果我们现在将目标文件log.txt删除会发生什么:

我们会发现硬链接并没有被删除,而且上面的这个圈出来的这个数字由2变成了1,而这个数字就是一个“引用计数”,这个引用计数其实就表示的是当今有多少个文件名与该inode进行映射。

所以结论是:硬链接并不是一个独立的文件,它只是一个文件名与inode的映射关系。

2.2、每个目录中的默认的硬连接

上面说到引用计数表示的是,有多少个文件名与一个inode有映射关系,但是不知道大家是否发现一个奇怪的现象,就是如果我们新建一个空目录,它的引用计数默认是2:

这是因为我们创建的新目录它里面并不完全是空的,每一个新的目录中都有一个隐藏的"."表示当前目录:

而这个.其实就是操作系统为每一个目录创建的一个默认的硬链接,我们通过观察它们的inode就可以看出:

那同理的,每一个目录中也有一个.. 表示上级目录,所以接下来的现象也就不奇怪了:

我们在newdir里面新建了一个newnewdir之后,newdir的引用计数就变成了三,这是因为newnewdir里面有一个..的硬链接指向了newdir:

所以我们现在也就明白了,其实我们以前刚开始学到的.和..其实是两个硬链接啊。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/671320.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

unity实现第一人称和第三人称

在角色设置两个挂载点,第一人称时,相机放在eys上面,切换第三人称时,放置到3rd节点上面,调整节点位置,达到期望效果 代码 void ThirdView(){Debug.Log("切换到第三人称");camera.SetParent(third…

SaperaCamExpert(相机专家)中文使用指南

参考:SaperaCamExpert中文使用指南.PDF 文章目录 软件介绍安装首次打开资源占用率功能主界面布局菜单栏FileViewPre-Processing:预处理 Tools: 快捷键:新建;打开;保存;帮助Device窗体属性树图像…

【MATLAB】使用梯度提升树在回归预测任务中进行特征选择(深度学习的数据集处理)

1.梯度提升树在神经网络的应用 使用梯度提升树进行特征选择的好处在于可以得到特征的重要性分数,从而识别出对目标变量预测最具影响力的特征。这有助于简化模型并提高其泛化能力,减少过拟合的风险,并且可以加快模型训练和推理速度。此外&…

莉莉与神奇花朵的冒险

现在,我将根据这些步骤编写一个对话形式的童话故事。 在很久很久以前的一个小村庄里,有一个勤劳善良的小女孩叫莉莉。她住在一间小茅屋里,和她的奶奶一起生活。奶奶年纪大了,行动不便,所以莉莉每天都要照顾她。 一天&a…

springboot war包部署 和jar包部署

文章目录 war包部署设置打包方式为war排除内嵌的tomcat在插件中指定入口类打包测试 jar包部署设置打包方式执行打包测试访问修改插件版本指定jsp打包配置 重新打包测试 war包部署 设置打包方式为war 执行项目打包的方式为 "war" 默认创建springboot项目打包都是ja…

vscode的ssh忽然连不上服务器:远程主机可能不符合glibc和libstdc++ VS Code服务器的先决条件

vscode自动更新了一下就发现连不上服务器了,我寻思估计一大堆人都寄了,一搜,果然哈哈哈哈 然后我直接搜一天内新发布的博客,还真给我搜到了这个问题,按照这个问题里面的回答(vscode1.86无法远程连接waitin…

2024.2.6日总结(小程序开发3)

页面配置 页面配置和全局配置的关系: 小程序中,app.json中的window节点,可以全局配置小程序中每个页面的窗口表现 如果某些小程序想要有特殊的窗口表现,可以用页面级别的.json配置文件实现这个需求 页面配置和全局配置冲突时&…

程序员为什么不喜欢关电脑?

目录 标题:程序员为何乐见电脑长时间处于关闭状态? 引言: 一、思维的延续性: 二、环境的连续性: 三、长时间开机的原因: 四、恢复成本的考量: 结论: 特别的: 不是…

亿某通电子文档安全管理系统 UploadFileToCatalog SQL注入漏洞

免责声明:文章来源互联网收集整理,请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失,均由使用者本人负责,所产生的一切不良后果与文章作者无关。该…

Python __file__属性:查看模块的源文件路径

除可以查看模块的帮助信息之外,还可以直接阅读模块的源代码来掌握模块功能,提升 Python 编程能力。 不管学习哪种编程语言,认真阅读那些优秀的框架、库的源代码都是非常好的学习方法。 通过模块的 __file__ 属性即可查看到指定模块的源文件…

防范恶意勒索攻击!亚信安全发布《勒索家族和勒索事件监控报告》

本周态势快速感知 本周全球共监测到勒索事件81起,事件数量有所下降,比上月降低20%。 lockbit3.0仍然是影响最严重的勒索家族;akira和incransom也是两个活动频繁的恶意家族,需要注意防范。 本周alphv勒索组织窃取MBC法律专业公司…

LangChain 最近发布的一个重要功能:LangGraph

LangGraph 是 LangChain 最近发布的一个重要功能,LangChain 进入多代理框架领域。通过建立在LangChain 之上,LangGraph 使开发人员可以轻松创建强大的代理运行时。 LangChain 使用其表达语言(LCEL)为开发人员构建定制链提供技术支…

基于ESP-WROOM-32的双串口通信并显示到OLED显示屏上

目录 开发板引脚图 Arduino环境配置1.ESP32开发版下载2.Arduino开发板选择 -> ESP32 Dev Module3.安装驱动库 接线图Arduino代码现象演示 开发板 ESP-WROOM-32 引脚图 Arduino环境配置 1.ESP32开发版下载 选择 esp32 by Espressif Systems 2.Arduino开发板选择 -> E…

网络爬虫,使用存放在C的谷歌驱动报错

月 06, 2024 11:43:40 上午 org.openqa.selenium.os.OsProcess checkForError 严重: org.apache.commons.exec.ExecuteException: Execution failed (Exit value: -559038737. Caused by java.io.IOException: Cannot run program "C:\chromedriver121.exe" (in dir…

百面嵌入式专栏(面试题)进程管理相关面试题1.0

沉淀、分享、成长,让自己和他人都能有所收获!😄 📢本篇我们将介绍进程管理相关面试题 。 一、进程管理相关面试题 进程是什么?操作系统如何描述和抽象一个进程?进程是否有生命周期?如何标识一个进程?进程与进程之间的关系如何?Linux操作系统的进程0是什么?Linux操…

Unity类银河恶魔城学习记录2-1.2.3.4.5 背景和摄像机相关设置 P42-p45

Alex教程每一P的教程原代码加上我自己的理解初步理解写的注释,可供学习Alex教程的人参考 此代码仅为较上一P有所改变的代码 【Unity教程】从0编程制作类银河恶魔城游戏_哔哩哔哩_bilibili ParallaxBackground.cs using System.Collections; using System.Collect…

Leetcode刷题笔记题解(C++):590. N 叉树的后序遍历

思路&#xff1a;类似于二叉树的排序&#xff0c;这里需要将子树进行依次递归遍历&#xff0c;前序遍历也与之类似 /* // Definition for a Node. class Node { public:int val;vector<Node*> children;Node() {}Node(int _val) {val _val;}Node(int _val, vector<N…

编辑最爱,轻松制作GIF图片,这几款MacOS工具不能少!

GIF是图片的一种格式&#xff0c;是动态图片&#xff0c;如果说一图胜千言&#xff0c;那么一张动态gif图片恐怕就是一本书了。想要编辑独一无二的GIF图片&#xff0c;这几款MacOS工具不能少&#xff01; LICEcap➤Gif录制工具 LICEcap for Mac软件&#xff0c;操作功能非常的…

国图公考:公务员面试资格复审需要准备什么?

参加国考面试的考生在资格审核阶段需要准备以下材料&#xff1a; 1、本人身份证、学生证或工作证复印件。 2、公共科目笔试准考证复印件。 3、考试报名登记表。 4、本(专)科、研究生各阶段学历、学位证书(应届毕业生没有可以暂时不提供)。 5、报名资料上填写的各类证书材料…

Express框架介绍—node.js

Express—Node.js 官网传送门(opens new window) 基于 Node.js 平台&#xff0c;快速、开放、极简的 Web 开发框架 Express 是用于快速创建服务器的第三方模块。 Express 初体验 基本使用 安装 Express&#xff1a; npm install express创建服务器&#xff0c;监听客户端请…