【Linux】详解文件系统以及周边知识

一、磁盘的基本知识

        磁盘中可以被划分成一个一个的环,每个环都是一个磁道。每个磁道又可以被均分成一个一个的扇区,扇区是磁盘IO的基本单位(想要修改扇区中的一个比特位就必须把该扇区的全部比特位都加载到内存中)。磁盘中的盘面,磁道和扇区都是有编号的。要访问一个扇区中的内容,必须通过磁头先定位到哪一个磁道(柱面cylinder),再确定要读取哪一个盘面(磁头head),最后确定磁道上的哪一个扇区(sector),这种定位法被称为CHS定位法

1.1、磁盘逻辑结构的理解

         磁盘盘面的每个磁道我们都可以想象成把它扯出来,就变成了一个线性的结构,如果把每一个磁道都拼接在一起,再把每一个盘面拼接在一起,就形成了一个比较长的线性结构,就变得类似于磁带了。假设磁盘每一个盘面的大小为200GB,一共有四个盘面,假设每一个扇区大小为512kb,那800GB就可以被分成1677721600个扇区大小。那么如果把这个线性结构看成是一个数组的话,那么我们每次拿着要访问的扇区对应的数组下标通过对应的算法转化成CHS地址就能访问到该扇区了,该工作是由磁盘完成的。所以,操作系统需要知道磁盘有多少个扇面,每个扇面的大小是多少,每个扇区的大小是多少,每个磁道有多少个扇区,这个在操作系统内部编程的时候就可以统一使用线性地址,要访问磁盘数据时,将线性地址交给磁盘,磁盘会自己将线性地址转化成CHS地址,就可以实现操作系统对数据的读取和写入了。

 二、文件系统底层的实现原理

2.1、系统层面的数据块

         但是在操作系统层面上,会认为一次只和磁盘交互一个扇区的数据数据量太小了。在操作系统文件系统认为,IO的基本单位是4kb,也就是8个扇区(假设),也就是说操作系统和磁盘一次最小交换的数据量为8个扇区。那操作系统又可以对磁盘中的800GB进行重新分块,以8个扇区为一个数据块,第一个数据块数组下标编号为1,第二个数据块数组下标编号为2,以此类推,这种编址叫做LBA地址(Logical Block Address)。这个操作系统要对某个数据块进行读取或写入的时候,就只需要拿着数据块的数组编号乘8再加上[0,1,2,3,4,5,6,7],就可以找到对应连续的8个扇区,将8个扇区的线性地址交给磁盘转化成CHS地址就可以对这8个扇区进行读取或写入了。

2.2、分区和分组 

        上面我们已经谈了磁盘和操作系统对于存储空间的分块问题,接下来可以聊一聊操作系统如何对这800GB的空间进行管理了。在实际的情况中,操作系统并不是将这800GB的空间都当成一个整体来维护的,操作系统会对这800GB的空间进行分区(也就是我们平常电脑中所见的C盘,D盘,E盘),分区下面又会有分组,通过一个分组的管理经验再沿用到其它的分组中(当然了也可以沿用其它管理经验),就可以将800GB中所有的分组和分区都管理好了。

         Linux磁盘文件特性分为文件内容加上文件属性,文件属性包括类型,大小,权限,时间,inode编号等等......文件名不属于文件属性),一个文件的inode编号在它所属的分区内是唯一的系统中标识一个文件用的不是文件名,用的是它的inode编号。内容和属性是分开存储的。在磁盘中,文件的属性存储在struct inode结构体中,大小为128字节。操作系统一个数据块的大小为4kb(同上),也就是说一个数据块可以存储32个struct inode结构体。

2.3、组的管理模式

        为了管理好每一个分组中的10GB空间,系统将10GB进行了模块化管理。

i节点表(inode Table):存放文件属性 ,如文件大小,所有者,最近修改时间等。

inode位图(inode Bitmap):每个bit表示一个inode是否空闲可用。

数据区(Data blocks):存放文件内容 。

块位图(Block Bitmap):Block Bitmap中记录着Data Block中哪个数据块已经被占用,哪个数据块没有被占用。

Block Group:ext2文件系统会根据分区的大小划分为数个Block Group。而每个Block Group都有着相同的结构组成。

超级块(Super Block):在磁盘中,每个分区都有一个super block,且只有个别的组有super block。存放文件系统本身的结构信息。记录的信息主要有:block和inode的总量, 未使用的block和inode的数量,一个block和inode的大小,最近一次挂载的时间,最近一次写入数据的时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏,可以说整个 文件系统结构就被破坏了。

GDT,Group Descriptor Table:块组描述符,描述块组属性信息。

        创建一个文件需要在一个组的inodeBitmap中从左向右遍历找到第一个非1的比特位,将该比特位置1,并通过该比特位索引到inodeTable中对应的位置申请一个struct inode结构体,将该填的属性一填,在Block Bitmap找到非1的比特位,置1并将数据填入到Data blocks对应的数据块中。删除一个文件只需要将其在inode Bitmap和Block Bitmap中所占有的比特位置0即可,而不需要再磁盘中将对应的数据全部删除掉,这也是为什么我们删除一个文件比下载一个文件快得多的本质原因每一个分区的每一个分组都有一个起始编号,struct inode结构体的inode编号可以理解成就是该分组的起始编号加上在inode Bitmap中的偏移量。这样就可以做到一个文件的inode编号在它所属的分区内是唯一的。        

        为了将文件的属性和内容之间建立起联系,struct inode结构体中还存在一个int block[15]的数组用来表征这个分组内的哪些数据块属于这个文件。block数组下标[0,11]直接保存的就是Data blocks中的编号(一级索引);[12,13]不直接保存编号,而保存的是其它保存数据的数据块对应的编号(二级索引),[14]保存就是三级索引,这样可以有效增加保存文件数据的数据块的个数,进一步的可以使一个文件保存更多的数据。

三、重谈文件的增删查改

        在Linux系统中,目录也是文件,其中目录的内容中就保存了目录中的文件的inode编号和文件名之间的映射关系这就是为什么如果我们对一个目录没有w权限,我们就无法在这个目录中新建文件的原因。因为新建文件要将文件的inode编号和文件名之间的映射关系写到目录的内容当中,本质就是修改目录的内容,操作系统就不让我修改。删除一个文件时,拿着文件名在当前目录中做字符串匹配,当匹配成功时,将所在分组的inodebitmap和blockbitmap中对应的比特位由一置零,再在所处目录的内容中将文件名和inode的映射关系删除掉,这样一个文件就被删除了。

四、重谈文件路径

        查找一个文件,在内核当中,都要递归似的帮我们找到根目录,从根目录进行路径解析。因为我们要得到一个文件的内容,就要先拿到它的inode编号,可是我们只有文件名啊,那怎么办?文件名和它的inode编号是存储在它所在的目录中的,所以要到目录的内容中去找。可是目录我们也只是知道目录名啊,我们又要去上级目录中找该目录的inode编号,依次类推,直到找到根目录,根目录的inode编号系统是已知的,所以我们就可以逆向找到所有目录的inode编号,进而找到我们的文件的inode编号,也就找到文件内容了。这就是文件路径最本质的作用

五、挂载的理解

        挂载(Mounting)是指由操作系统使一个存储设备(诸如硬盘、CD-ROM或网络共享)上的计算机文件和目录可供用户通过计算机的文件系统访问的一个过程一个被写入文件系统的分区要被Linux操作系统使用,必须将其挂载到一个目录下。分区的访问都是通过所挂载的路径访问的。通过文件路径前缀就可以知道文件处于哪一个分区中

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/783708.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】详解软硬链接

一、软硬链接的建立方法 1.1软链接的建立 假设在当前目录下有一个test.txt文件,要对其建立软链接,做法如下: ln就是link的意思,-s表示软链接,test.txt要建立软链接的文件名,后面跟上要建立的软链接文件名…

魔改一个过游戏保护的CE

csdn审核不通过 网易云课堂有配套的免费视频 int0x3 - 主页 文章都传到github了 Notes/外挂/魔改CE at master MrXiao7/Notes GitHub 为什么要编译自己的CE 在游戏逆向的过程中,很多游戏有保护,我们运行原版CE的时候会被检测到 比如我们开着CE运…

MySQL数据库MHA高可用集群

前言 MySQL 数据库 MHA(Master High Availability)高可用集群是一种用于提高 MySQL 数据库可用性的解决方案。它通过自动故障切换和监控来确保数据库系统在主服务器发生故障时能够快速切换到备用服务器;在 MHA 高可用集群中,Mast…

单细胞分析|映射和注释查询数据集

reference映射简介 在本文中,我们首先构建一个reference,然后演示如何利用该reference来注释新的查询数据集。生成后,该reference可用于通过cell类型标签传输和将查询cell投影到reference UMAP 等任务来分析其他查询数据集。值得注意的是&…

2024年 前端JavaScript 进阶 第2天 笔记

2.1-内容和创建对象方式 2.2-164-构造函数 2.3-new实例化执行过程 2.4-实例成员和静态成员 2.5-基本包装类型 2.6-0bject静态方法 2.7-数组reduce累计方法 对象数组 加0 2.7-数组find、every和转换为真 --说明手册文档 MDN Web Docs 2.8-字符串常见方法 2.3 String 1.常见实例…

【微服务框架】微服务简介

个人名片: 🐼作者简介:一名大三在校生,喜欢AI编程🎋 🐻‍❄️个人主页🥇:落798. 🐼个人WeChat:hmmwx53 🕊️系列专栏:🖼️…

2010-2021年各省碳排放测算数据(含原始数据+计算过程+结果)

2010-2021年各省碳排放测算数据(含原始数据计算过程结果) 1、时间:2010-2021年 2、指标:原煤(万吨)、原煤(万吨CO2)、焦炭(万吨)、焦炭(万吨CO2)、汽油(万吨)、汽油(万吨CO2)、煤油(万吨)、煤油(万吨CO2)、柴油(万吨)、柴油(万吨…

比较转录组分析揭示了116种山茶属(Camellia)植物的深层系统发育和次生代谢物演化-文献精读分享1

Comparative transcriptomic analysis unveils the deep phylogeny and secondary metabolite evolution of 116 Camellia plants ,比较转录组分析的一篇文献。 SUMMARY 茶花植物包括200多个种类,具有极大的多样性和巨大的经济、观赏和文化价值。我们对…

[机器学习]练习切比雪夫距离

切比雪夫距离(Chebyshev distance) 切比雪夫距离是指在几何空间中两点之间的最大差值,或者说是两点在各个坐标轴上差值的最大绝对值。它以数学家彼得切比雪夫(Peter Chebyshev)的名字命名。 在二维空间中,切比雪夫距离可以表示为…

黄金涨是商品牛市的领先信号

自2022年11月以来,黄金价格持续上涨,目前已经突破历史新高,历史上黄金上涨,大多是商品全面牛市的领先信号。在2008年Q4、2019年也出现过,黄金比其他商品更强,但随后的2009年和2020年均是商品的全面牛市。同…

spring注解@EventListener实现监听原理

文章目录 EventListener使用方式EventListener实现原理1.引入时机2 初始化时机3 作用时机->将加了EventListener注解的方法识别出来,并封装为监听器,加载spring容器中 总结 EventListener使用方式 package com.cyl.listener;import org.springframew…

【EasyExcel】多sheet、追加列

业务-EasyExcel多sheet、追加列 背景 最近接到一个导出Excel的业务,需求就是多sheet,每个sheet导出不同结构,第一个sheet里面能够根据最后一列动态的追加列。原本使用的 pig4cloud 架子,使用 ResponseExcel注解方式组装返回数据…

设计模式深度解析:AI如何影响装饰器模式与组合模式的选择与应用

​🌈 个人主页:danci_ 🔥 系列专栏:《设计模式》《MYSQL应用》 💪🏻 制定明确可量化的目标,坚持默默的做事。 AI如何影响装饰器模式与组合模式的选择与应用 在今天这个快速发展的技术时代&#…

Segger Embedded Studio IDE使用体验——默认的Section和Linker的设置

Segger Embedded Studio IDE使用体验之一——默认的Section和Linker的设置 一、简介二、操作2.1 编译后代码分析2.1.1 符号浏览器2.1.2 读取elf文件和map文件 2.2 调试2.2.1 查看变量2.2.2 设置供电 2.3 运行环境设置2.3.1 编译器2.3.2 汇编器2.3.3 包含其他文件2.3.4 .bss和.d…

基于百度地图实现Android定位功能实现(一)

Android集成百度地图 文章目录 Android集成百度地图前言准备工作创建工程申请密钥 在项目中集成BaiduMap SDK创建地图 前言 本案例使用百度地图实现在Android中集成地图,并且实现了普通地图/卫星地图,以及路况图和热状图功能; 参考技术文档&…

MTU/TCPMSS/VLAN/ACCESS/TRUNK/HYBRID

MTU RFC标准定义以太网的默认MTU值为1500 最小64字节是为了保证最极端的冲突能被检测到,64字节是能被检测到的最小值;最大不超过1518字节是为了防止过长的帧传输时间过长而占用共享链路太长时间导致其他业务阻塞。所以规定以太网帧大小为64~1518字节&am…

C++入门(二)

目录 函数重载: 函数重载概念: 参数类型不同: 参数个数不同: 参数类型顺序不同: C支持函数重载的原理--名字修饰: 引用: 引用概念: 引用特性: 常引用&#xff1…

JJJ:linux系统中第一个进程

以linux4.19内核linux系统中第一个进程。 执行shell指令 ps -ef 结果如下: xxxxxx-virtual-machine:~$ ps -ef UID PID PPID C STIME TTY TIME CMD root 1 0 0 20:55 ? 00:00:02 /sbin/init splash root …

【机器学习300问】58、什么是词袋模型和N-gram模型?

词袋模型(Bag of Words, BoW)和N-gram模型主要用于早期的自然语言处理任务,上文中我介绍了机器是如何读懂文本的四个阶段,这篇文章带大家来看看在不同阶段中会用到的两个模型——词袋模型和N-gram模型。如果没有读过我之前的文章&…

Nodejs 第六十章(http缓存)

HTTP缓存 HTTP 缓存主要分为两大类:强缓存和协商缓存。这两种缓存都通过 HTTP 响应头来控制,目的是提高网站性能。 强缓存介绍 强缓存之后则不需要向服务器发送请求,而是从浏览器缓存读取分为(内存缓存)| &#xff…