[Linux][基础IO][二][缓冲区][理解文件系统]详细解读

目录

  • 1.缓冲区
    • 0.缓冲区的刷新策略
    • 1.何为缓冲区?
    • 2.总结
  • 2.理解文件系统
    • 0.文件元数据
    • 1.了解文件系统 --> 理解inode
    • 2.软硬链接

1.缓冲区

0.缓冲区的刷新策略

  • 一般情况
    1. 立即刷新
    2. 行刷新(行缓冲)
    3. 满刷新(全缓冲)
  • 特殊情况
    1. 用户强制刷新(fflush)
    2. 进程退出
  • 所有的设备,永远都倾向于全缓冲
    • 缓冲区满了,才刷新 --> 需要更少的IO次数 --> 更少次的外设访问 --> 提高效率
    • 和外部设备IO的时候,数据量的大小不是主要矛盾,和外设预备IO的过程是最耗费时间的
  • 一般而言
    • 行缓冲的设备文件 --> 显示器
    • 全缓冲的设备文件 --> 磁盘文件
  • 缓冲策略 = 一般 + 特殊

1.何为缓冲区?

int main()
{const char *msg0 = "hello printf\n";const char *msg1 = "hello fwrite\n";const char *msg2 = "hello write\n";printf("%s", msg0);fwrite(msg1, strlen(msg0), 1, stdout);write(1, msg2, strlen(msg2));fork();return 0;
}// 运行结果:  
// hello printf
// hello fwrite
// hello write
  • 但如果对进程实现输出重定向呢? ./hello > file
运行结果:  
hello write
hello printf
hello fwrite
hello printf
hello fwrite
  • 发现printf和fwrite(库函数)都输出了2次,而write只输出了一次(系统调用)
    • 一般C库函数写入文件时是全缓冲的,而写入显示器是行缓冲
      • printf&fwrite库函数会自带缓冲区(进度条例子就可以说明)
    • 当发生重定向到普通文件时,数据的缓冲方式由行缓冲变成了全缓冲
      • 而放在缓冲区中的数据,就不会被立即刷新,甚至fork之后刷新
      • 但是进程退出之后,会统一刷新,写入文件当中
    • fork的时候,父子数据会发生写时拷贝,所以当父进程准备刷新的时候,子进程也就有了同样的一份数据,随即产生两份数据
    • write****没有变化,说明没有所谓的缓冲

2.总结

  • printf&fwrite库函数会自带缓冲区,而write系统调用没有带缓冲区
    • 这里所说的缓冲区, 都是用户级缓冲区
    • 其实为了提升整机性能,OS也会提供相关内核级缓冲区,不过不再我们讨论范围之内
  • 那这个缓冲区谁提供呢?
    • printf&fwrite是库函数, write是系统调用,库函数在系统调用的“上层”, 是对系统调用的“封装”
    • 但是write没有缓冲区,而printf&fwrite有 –> 该缓冲区是二次加上的,又因为是C,所以由C标准库提供

2.理解文件系统

0.文件元数据

  • ls -l读取存储在磁盘上的文件信息,然后显示出来
    在这里插入图片描述
模式 | 硬链接数 | 文件所有者 | 组 | 大小 | 最后修改时间 | 文件名
  • 这个信息除了通过ls -l来读取,还有一个stat命令能够看到更多信息
    在这里插入图片描述

1.了解文件系统 --> 理解inode

  • 可将磁盘抽象成线性的结构 --> 数组 <-- 类比磁带理解

    • 若想访问一个扇区,只要知道数组的下标即可
  • 对磁盘的管理 --> 对该数组的管理

    • 将数据存储到磁盘 --> 将数据存储到该数组
    • 找到磁盘特定扇区的位置 --> 找到数组特定的位置
  • 磁盘是典型的块设备,硬盘分区被划分为一个个的block

    • 磁盘可被分区 --> 对磁盘的管理 --> 对一个小分区的管理 --> 对一个块的管理
    • 一个block的大小是由格式化的时候确定的,并且不可以更改
      ![[Pasted image 20240223221244.png]]
  • Linux管理磁盘文件,是将文件内容和文件属性分开管理的

    • 文件 = 内容 + 属性
  • Block Group:ext2文件系统会根据分区的大小划分为数个Block Group

  • Super Block存放文件系统本身的结构信息(文件系统的属性信息),记录的信息主要有:

    • bolck和inode的总量
    • 未使用的block和inode的数量
    • 一个block和inode的大小
    • 最近一次挂载的时间,最近一次写入数据的时间,最近一次检验磁盘的时间等其他文件系统的相关信息
    • Super Block的信息被破坏,可以说整个文件系统结构就被破坏了
  • GDT:块组描述符,描述块组属性信息

    • 这个块组多大?已经使用了多少?
    • 有多少个inode?已经占用了多少个了?还剩多少个?
    • 一共有多少个block?使用了多少?
  • Block Bitmap:记录着Data Block中哪个数据块已经被占用,哪个数据块没有被占用

    • 如:10000+个blocks,10000+比特位,比特位和特定的block一一对应,比特位为1,代表该block被占用,否则表示可用
  • inode Bitmap:每个bit表示一个inode是否空闲可用

    • 如:10000+个inode,10000+比特位,比特位和特定的inode一一对应,比特位为1,代表该inode被占用,否则表示可用
  • inode Table:存放文件属性

    • 如:文件大小,所有者,最近修改时间等
    • inode是一个大小为128字节的空间,保存的是对应文件的属性
    • 块组内,所有文件的inode空间的集合,需要标识唯一性,每一个inode块,都要有一个inode编号
    • 一般而言:一个文件,一个inode,一个inode编号
  • Data blocks存放文件内容

    • 多个4KB(扇区*8)大小的集合,保存的都是特性文件的内容
    • 为什么不以512字节为单位? – 磁盘的基本单位扇区的大小 --> 512字节
      • 太小了,有可能会导致多次IO,进而导致效率的降低
      • 如果OS使用和磁盘一样的大小,万一磁盘基本大小变了的话,OS的源代码要不要进行更改?
      • 这样做到了 硬件 和 软件(OS) 进行解耦
  • 将属性和数据分开存放的想法看起来很简单,但实际上是如何工作的?

  • 创建一个新文件主要有以下4个操作:

  1. 存储属性
    • 内核先找到一个空闲的i节点(这里是263466),内核把文件信息记录到其中
  2. 存储数据
    • 该文件需要存储在三个磁盘块,内核找到了三个空闲块:300,500,800
    • 将内核缓冲区的第一块数据复制到300,下一块复制到500,以此类推
  3. 记录分配情况
    • 文件内容按顺序300,500,800存放,内核在inode上的磁盘分布区记录了上述块列表
  4. 添加文件名到目录
    • 新的文件名abc,Linux如何在当前的目录中记录这个文件?
    • 内核将入口(263466,abc)添加到目录文件,文件名和inode之间的对应关系将文件名和文件的内容及属性连接起来
  • 注意:

    • 目录是文件吗?
      • 是,有自己的inode,有自己的data block
      • data block下存的是 文件名:inode映射关系
      • 文件名、inode互为key值
    • 明明磁盘还有空间,为什么创建文件失败?
      • inode****是固定的,data block是固定的
      • 可能是inode数量不够了,也可能是data block数量不够了,导致无法分配

2.软硬链接

  • 软硬链接的本质区别:有没有独立的inode

  • 真正找到磁盘上文件的并不是文件名,而是inode

    • 在Linux中可以让多个文件名对应于同一个inode
  • 理解硬链接

    • 硬链接没有独立的inode --> 硬链接不是一个独立的文件
    • 硬链接是通过inode引用另外一个文件
      • 创建硬链接,不是真正的创建新文件
    • 创建硬链接,究竟做了什么?
      • 在指定的目录下,建立了 文件名 和 指定inode的映射关系 – 仅此而已
    • 硬链接通过引用计数来判断有多少个文件名和某inode有关联
      在这里插入图片描述
  • 理解软链接

    • 软连接有独立的inode --> 软链接是一个独立的文件
    • 软链接是通过名字引用另外一个文件
      • 可以理解成为:软连接的文件内容,是指向的文件对应的路径
      • 应用:相当于Windows下的快捷方式
  • 设置软硬链接

ln target_filename filename设置硬链接
ln -s target_filename filename设置软链接

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/819386.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

conda配置多版本python

安装conda 以下任选下载 Anaconda Miniconda 配置conda环境变量 比如windows&#xff0c;在配置我的电脑中的环境变量&#xff0c;在系统变量的Path中新增下面内容 需要根据实际目录进行更改 D:\soft\miniconda3 D:\soft\miniconda3\Scripts D:\soft\miniconda3\Library\bi…

Java的Future机制详解

Java的Future机制详解 一、为什么出现Future机制二、Future的相关类图2.1 Future 接口2.2 FutureTask 类 三、FutureTask的使用方法四、FutureTask源码分析4.1 state字段4.2 其他变量4.4 构造函数4.5 run方法及其他 一、为什么出现Future机制 常见的两种创建线程的方式。一种是…

Python进阶编程 --- 2.MySQL、pymysql、PySpark

文章目录 第一章&#xff1a;SQL基础入门1.1 数据库数据库如何存储数据 1.2 数据库和SQL的关系1.3 MySQL版本1.4 命令提示符内使用MySQL1.5 SQL概述1.5.1 SQL语言分类1.5.2 SQL语言特性 1.6 DDL库管理表管理 1.7 DML - 数据操作1.8 DQL - 查询和计算数据1.8.1 基础数据查询1.8.…

HDFS Lease详解

本文主要介绍hdfs lease的设计以及实现。 写在前面 https://www.cnblogs.com/jhcelue/p/6783076.html https://blog.csdn.net/yexiguafu/article/details/118890014 https://www.jianshu.com/p/33e1a5a2b876 https://blog.csdn.net/breakout_alex/article/details/1014569…

行业模板|DataEase批发零售大屏模板推荐

DataEase开源数据可视化分析平台于2022年6月发布模板市场&#xff08;https://templates-de.fit2cloud.com&#xff09;&#xff0c;并于2024年1月新增适用于DataEase v2版本的模板分类。模板市场旨在为DataEase用户提供专业、美观、拿来即用的大屏模板&#xff0c;方便用户根据…

【Canvas与艺术】绘制斜置黄色三角biohazard标志

【关键点】 径向渐变色和文字按角度偏转。 【成果图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>使用Html5/Canvas绘制…

spring-cloud微服务gateway

核心部分&#xff1a;routes(路由)&#xff0c; predicates(断言)&#xff0c;filters(过滤器) id&#xff1a;可以理解为是这组配置的一个id值&#xff0c;请保证他的唯一的&#xff0c;可以设置为和服务名一致 uri&#xff1a;可以理解为是通过条件匹配之后需要路由到&…

2024 CKA 基础操作教程(十二)

题目内容 考点相关内容分析 Pods Pod 是可以在 Kubernetes 中创建和管理的、最小的可部署的计算单元。 Pod 是 Kubernetes 中的原子单元&#xff0c;用于封装应用程序的一个或多个容器、存储资源、唯一的网络 IP&#xff0c;以及有关如何运行容器的选项。Pod 提供了一个共享的…

一些实用的工具网站

200 css渐变底色 https://webgradients.com/ 200动画效果复制 https://css-loaders.com/classic/ 二次贝塞尔曲线 https://blogs.sitepointstatic.com/examples/tech/canvas-curves/bezier-curve.html 三次贝塞尔曲线 https://blogs.sitepointstatic.com/examples/tech/c…

Day92:系统攻防-WindowsLinux远程探针本地自检任意执行权限提升入口点

目录 操作系统-远程漏扫-Nessus&Nexpose&Goby Nessus Nexpose 知识点&#xff1a; 1、远程漏扫-Nessus&Nexpose&Goby 2、本地漏扫-Wesng&Tiquan&Suggester 3、利用场景-远程利用&本地利用&利用条件 操作系统-远程漏扫-Nessus&Nexpose&a…

Python——详细解析目标检测xml格式标注转换为txt格式

本文简述了目标检测xml格式标注的内容&#xff0c;以及yolo系列模型所需的txt格式标注的内容。并提供了一个简单的&#xff0c;可以将xml格式标注文件转换为txt格式标注文件的python脚本。 1. xml格式文件内容 <size>标签下为图片信息&#xff0c;包括 <width> …

​​​​​​​iOS配置隐私清单文件App Privacy Configuration

推送到TestFlight后邮件收到警告信息如下&#xff0c;主要关于新的隐私政策需要补充&#xff1a; Hello, We noticed one or more issues with a recent submission for TestFlight review for the following app: AABBCC Version 10.10.10 Build 10 Although submission for …

servlet的三个重要的类(httpServlet 、httpServletRequst、 httpServletResponse)

一、httpServlet 写一个servlet代码一般都是要继承httpServlet 这个类&#xff0c;然后重写里面的方法 但是它有一个特点&#xff0c;根据之前写的代码&#xff0c;我们发现好像没有写main方法也能正常执行。 原因是&#xff1a;这个代码不是直接运行的&#xff0c;而是放到…

文章解读与仿真程序复现思路——中国电机工程学报EI\CSCD\北大核心《应用图论建模输电网的电力现货市场出清模型》

本专栏栏目提供文章与程序复现思路&#xff0c;具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

JavaSE图书管理系统实战

代码仓库地址&#xff1a;Java图书管理系统 1.前言 该项目将JavaSE的封装继承多态三大特性&#xff0c;使用了大量面向对象的操作&#xff0c;有利于巩固理解 &#xff08;1&#xff09;实现效果 2.实现步骤 第一步先把框架搭建起来&#xff0c;即创建出人&#xff1a;管理员和…

RocketMQ 02 功能大纲介绍

RocketMQ 02 主流的MQ有很多&#xff0c;比如ActiveMQ、RabbitMQ、RocketMQ、Kafka、ZeroMQ等。 之前阿里巴巴也是使用ActiveMQ&#xff0c;随着业务发展&#xff0c;ActiveMQ IO 模块出现瓶颈&#xff0c;后来阿里巴巴 通过一系列优化但是还是不能很好的解决&#xff0c;之后…

MySQL底层架构

MySQL底层架构 连接器 验证客户端连接的用户名密码、校验权限、维持和管理连接。 客户端如果超过 wailt_timeout 没有动静&#xff0c;连接器会主动将它断开&#xff0c;此时客户端再次发送请求的话&#xff0c;就会收到错误&#xff1a;lost connection to MySQL server dur…

【Modelsim】保持波形格式重编译and波形的保存与查看

文章目录 保持原波形格式重编译波形的保持与查看保存波形打开工程查看波形 保持原波形格式重编译 Modelsim 仿真设置好波形格式后&#xff0c;若需要修改代码并保持原波形格式重新查看波形&#xff0c;只需将文件重新编译后仿真即可。 1.修改代码后Project页面的代码状态变成…

外网如何访问内网数据库?

在当今信息时代&#xff0c;随着互联网的快速发展&#xff0c;很多企业和个人都面临着外网访问内网数据库的需求。外网访问内网数据库可以实现远程操作&#xff0c;方便用户在任何地点使用移动设备进行数据管理和查询。本文将介绍一种名为【天联】的组网产品&#xff0c;它是一…

SkyWalking 为所有的API接口增加 tag

背景胡扯 线上接口报错&#xff0c;接着被 SkyWalking 抓到&#xff0c;然后 SkyWalking 触发告警&#xff0c;最后老板你&#xff0c;让你辛苦一下&#xff0c;在明早上班前把这个bug 改了&#xff0c;并告诉你你是全公司的希望。谁说不是呢&#xff1f;为公司业务保驾护航&a…