【Linux取经路】文件系统之被打开的文件——文件描述符的引入

在这里插入图片描述

文章目录

  • 一、明确基本共识
  • 二、C语言文件接口回顾
    • 2.1 文件的打开操作
    • 2.2 文件的读取写入操作
    • 2.3 三个标准输入输出流
  • 三、文件有关的系统调用
    • 3.1 open
      • 3.1.1 比特位级别的标志位传递方式
    • 3.2 write
      • 3.2.1 模拟实现 w 选项
      • 3.2.2 模拟实现 a 选项
    • 3.3 read
  • 四、访问文件的本质
    • 4.1 再来认识 FILE
    • 4.2 再来理解关闭文件
  • 五、结语

一、明确基本共识

  • 文件等于内容加属性,内容和和属性都是数据,不管是内容还是属性都要在磁盘中保存。

  • 文件分为打开的文件和没打开的文件。

  • 打开的文件本质是进程打开的,要研究打开的文件,本质是研究进程和文件的关系。

  • 对文件的所有操作(打开文件、读取文件、向文件写入)等,都是通过代码来实现的,而代码最终是由 CPU 去执行的,根据冯诺依曼结构体系,CPU 不能直接和外设打交道,因此一个被打开的文件,第一步一定是先将其加载到内存。

  • 一个进程能够打开多个文件,所以在操作系统内部一定存在大量的被打开的文件,操作系统还是通过先描述,再组织的方式对打开的文件进行管理。每个被打开的文件都必须有自己的文件打开对象,其中一一定包含了文件的很多属性,将这些文件对象以某种特殊的数据结构组织起来,最终对文件的管理,就变成了对某种数据结构的维护(增删查改)。

  • 没打开的文件一般都是在磁盘上放着,对于没打开的文件,由于没打开的文件非常多,所以对于没打开的文件我们最关心文件如何被分门别类的放置好,分门别类的放置好是为了快速的进行增删查改。

二、C语言文件接口回顾

2.1 文件的打开操作

// 文件打开接口
FILE *fopen(const char *path, const char *mode);

第一个参数 path ,表示要打开的文件路径,或者文件名。如果只有文件名前面没写路径,表示打开当前路径下的文件。这里又涉及到当前路径,在前一篇文章中实现 cd 指令的时候就讲过什么是当前路径。总的来说,当前工作路径是一个进程 PCB 中维护的一个属性。一个可执行程序在被加载到内存成为进程创建出对应的 PCB 对象的时候,PCB 对象中就维护了一个叫做 cwd 的属性,该属性就表示进程当前的工作路径。

在这里插入图片描述
如果 fopen 函数的第一个参数只传递了文件名,最终在打开文件的时候,操作系统会去 cwd 指向的工作路径下查找该文件。

第二个参数 mode,这个参数有很多可选项,今天只介绍个别选项,关于所有选项的详细介绍请看我之前的文章【C语言进阶】文件操作。

  • w选项:只要是以 w 选项打开的文件,在写入之前都会对文件做清空处理,然后从头开始写入。

  • a选项:在文件结尾进行追加写。

小Tips:我们之前介绍的重定向,> 本质上就对应使用的是 w 选项,>> 本质上就对应使用的是 a 选项。

2.2 文件的读取写入操作

和文件读取写入的相关接口,以及使用方法,今天也不过多介绍,详细介绍请看我之前写的文章【C语言进阶】文件操作。今天只想通过 fwrite 接口跟大家明确一件事情。

// fwrite 接口声明
size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream);
int main()
{FILE *fp = fopen("log.txt", "w");if (fp == NULL){// 打开失败perror("fopen");return errno;}// 打开成功,对文件进行相关的操作// ...char* str = "Hello Linux!";fwrite(str, strlen(str), 1, fp);// 操作结束,关闭文件fclose(fp);return 0;
}

fwrite 接口的第二个参数 size 表示每一个要写入的对象的大小。在向文件写入字符串的时候,该参数是字符串的长度还是字符串的长度加一呢?因为 strlen 计算出来的字符串长度是不包含结尾的 \0,加一的小伙伴觉得要把 \0 也写到文件里面,但是 \0 真的需要写入文件嘛?其实 \0 并不需要写入文件中,因为字符串以 \0 结尾只是 C 语言这么规定的,我们把一个字符串写入文件后,可能通过其它的语言去读取该文件,我们并不希望读到与该字符串无关的内容 \0。下面是加一的结果:

在这里插入图片描述
\0 也是字符,只不过不可显,在被写入到文件后,vim 编辑器会把它识别成 ^@,对 Hello Linux 来说,^@ 就是多余的无用字符。我们不希望它在文件中出现。

2.3 三个标准输入输出流

C程序在启动时候,默认会打开三个标准流文件:

  • stdin:标准输入流——键盘文件

  • stdout:标准输出流——显示器文件

  • stderr:标准错误流——显示器文件

三、文件有关的系统调用

文件最初是在磁盘上的,磁盘是外部设备,访问磁盘文件其实是访问硬件,在计算机层状结构中,硬件是处于最底层的,操作系统帮我们把这些硬件管理起来,并且操作系统是不相信用户的,因此操作系统不允许我们直接去访问硬件,而是给我们提供了系统调用接口,几乎所有的库只要是访问硬件设备,必定要封装系统调用。也就是说我们平时在C语言里面使用的 fopenprintffprintffscanf等函数都一定是封装了系统调用。

3.1 open

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);
  • 第一参数 pathname:表示要打开或创建的目标文件

  • 第二个参数 flags:标志位选项。O_RDPPNLY:只读打开;O_WRONLY:只写打开;O_RDWR:读,写打开。这三个常量,必须指定一个且只能指定一个。O_CREAT:若文件不存在,则创建它。需要使用 mode 参数,来指明新文件的访问权限。O_APPEND:追加写;O_TRUNC:文件打开的时候先清空。

  • 第三个参数 mode:新创建文件的默认权限,要考虑权限掩码,可以配合 umask 系统调用接口来设置自己想要的效果。umask 系统调用产生的效果就只对当前进程创建的文件有关。

  • 返回值:成功,返回新打开的文件描述符,关于文件描述符是什么,将在后文为大家介绍;失败,返回-1。

小Tipsopen 函数具体使用哪个,和具体的应用场景有关,如目标文件不存在,需要 open 创建,则第三个参数表示创建文件的默认权限。如果不需要创建新文件,使用两个参数的 open

3.1.1 比特位级别的标志位传递方式

#define ONE (1<<0) // 1
#define TWO (1<<1) // 2
#define FOU (1<<2) // 4
#define EIG (1<<3) // 8void show(int flags)
{if(flags & ONE) printf("function1\n");if(flags & TWO) printf("function2\n");if(flags & FOU) printf("function3\n");if(flags & EIG) printf("function4\n");return;
}int main()
{printf("--------------------------------------\n");show(ONE);printf("--------------------------------------\n");show(ONE | TWO);printf("--------------------------------------\n");show(ONE | TWO | FOU );printf("--------------------------------------\n");show(ONE | TWO | FOU | EIG);printf("--------------------------------------\n");return 0;
}

在这里插入图片描述
小Tips:这种比特位级别的标志位传递方式,使用户可以在函数调用的时候采用按位或的方式传递多个选项实现不同的功能。open 函数的第二个参数就是采用这种方式就是这样。

3.2 write

#include <unistd.h>ssize_t write(int fd, const void *buf, size_t count);
  • 第一个参数 fd:表示待写入文件的文件描述符。

  • 第二个参数 buf:指向待写入的文件内容。

  • 第三个参数 count:待写入内容的大小,单位是字节。

  • 返回值:实际上写入的字节数。

3.2.1 模拟实现 w 选项

int main()
{umask(0); // 将权限掩码设置成全0int fd = open("log.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666); // 以读的方式打开,若文件不存在就创建,打开文件时清空if(fd < 0){printf("open file\n");return errno;}const char* str = "aaa";ssize_t ret = write(fd, str, strlen(str));close(fd);return 0;
}

在这里插入图片描述

3.2.2 模拟实现 a 选项

int main()
{umask(0); // 将权限掩码设置成全0int fd = open("log.txt", O_WRONLY | O_CREAT | O_APPEND, 0666); // 以读的方式打开,若文件不存在就创建,以追加的方式进行写入if(fd < 0){printf("open file\n");return errno;}const char* str = "aaa";ssize_t ret = write(fd, str, strlen(str));close(fd);return 0;
}

在这里插入图片描述

3.3 read

#include <unistd.h>ssize_t read(int fd, void *buf, size_t count);
  • 第一个参数 fd:要读取文件的文件描述符。

  • 第二个参数 buf:指向一段空间,该空间用来存储读取到的内容。

  • 第三个参数 count:参数二指向空间的大小。

四、访问文件的本质

在这里插入图片描述

总结:一个被打开的文件,加载到内存,会为该文件创建一个 struct file 结构体对象,操作系统对文件的管理本质上就是对 struct file 结构体对象的管理,操作系统会将当前所有被打开文件的 struct file 对象以双链表的形式组织起来。进程的 PCB 对象中有一个 struct files_struct 类型的指针,指向该类型的一个对象,该类型对象里面记录了当前进程所打开的所有文件新信息,其中中维护了一个 struct file* 类型的数组,数组的内容就指向了当前进程所打开的文件结构体对象,简言之就是指向了当前进程打开的文件。我们将这个数组就叫做文件描述符表,数组的下标就叫做文件描述符(因此文件描述符一定大于0)。open 函数的返回值其实就是文件描述符,即只要当前进程打开一个新文件,操作系统就会按照从前往后的顺序从该进程的文件描述符表中分配一个数组下标,该下标对应的内存空间中存储的就是该文件结构的地址。此后要对该文件进行任何操作,只需要知道它对应的数组下标即可。

int main()
{umask(0); // 将权限掩码设置成全0int fd1 = open("log1.txt", O_WRONLY | O_CREAT | O_APPEND, 0666); // 以读的方式打开,若文件不存在就创建,以追加的方式进行写入int fd2 = open("log2.txt", O_WRONLY | O_CREAT | O_APPEND, 0666);int fd3 = open("log3.txt", O_WRONLY | O_CREAT | O_APPEND, 0666);int fd4 = open("log4.txt", O_WRONLY | O_CREAT | O_APPEND, 0666);printf("fd1: %d\n", fd1);printf("fd2: %d\n", fd2);printf("fd3: %d\n", fd3);printf("fd4: %d\n", fd4);return 0;
}

在这里插入图片描述
小Tips:通过结果可以看出,进程新打开的文件,其下标只能从3,开始,这是因为 C 程序在运行起来的时候操作系统会默认帮我们打开三个流,标准输入流 stdin 对应键盘文件,下标为0;标准输出流 stdout 对应显示器文件,下标为1;标准错误流 stderr 对应显示器文件,下标为2。从这里可以的出一个结论,默认打开三个标准输入输出流并不是 C 语言的特性,而是操作系统的特性,所有语言编写的程序运行起来后都会打开。操作系统为什么要帮我们打开呢?因为电脑在开机的时候,键盘和显示器就已经被打开了,我们在编程的时候,一般都会用键盘输入和通过显示器查看结果。

文件描述符对应的分配规则:从0下标开始,寻找最小的没有使用的数组位置,它的下标就是新打开文件的文件描述符。

4.1 再来认识 FILE

FILE 是 C 语言库中自己封装的一个结构体,在 C 语言中,通过 FILE 对象去描述文件。可以确定,FILE 中一定封装了文件描述符。如下面代码,FILE 中的 _fileno 属性就是文件描述符。

int main()
{printf("stdin->fd: %d\n", stdin->_fileno); // 标准输入printf("stdout->fd: %d\n", stdout->_fileno); //标准输出printf("stderr->fd: %d\n", stderr->_fileno); // 标准错误return 0;
}

在这里插入图片描述

4.2 再来理解关闭文件

一个文件可以被多个进程同时打开,最常见的比如键盘文件,显示器文件。在 struct file 对象中有一个 f_count 字段,叫做当前文件的引用计数,记录了当前文件被多少个进程打开了,在进程视角关闭文件就是调用 close 系统调用,将对应下标里面的内容置为 NULL,这是进程系统需要执行的工作。置空后操作系统会把该文件描述对应文件结构体对象中的 f_count 字段减减,然后判断 f_count 是否为0,如果不为0就什么也不干,如果为0,操作系统才将对应的 struct file 对象回收,这是文件系统执行的工作。从这儿可以看出,文件描述符表的存在,将进程系统和文件系统进行了完美的解藕。这不禁让我想起了前面的虚拟地址(进程地址空间)和页表的存在将进程系统和内存系统进行解藕。Linux 操作系统的设计真的让人拍案叫绝!

int main()
{close(1); // 将 stdout 关闭int ret = printf("stdin->fd: %d\n", stdin->_fileno);printf("stdout->fd: %d\n", stdout->_fileno);printf("stderr->fd: %d\n", stderr->_fileno);fprintf(stderr, "printf ret: %d\n", ret);return 0;
}

在这里插入图片描述
代码分析close(1) 表示将标准输出关闭,1下标指向显示器文件,printf 就是向标准输出中进行写入,关闭后,三条 printf 函数都没有将内容成功打印到显示器上。根据上面的分析,虽然把标准输出关了,但是标准错误也指向显示器,所以在调用 fprintf 向标准错误中写入时,我们可以在显示器上看到打印结果。其次,printf 执行成功,返回值表示写入的字符个数,可以看出虽然我们通过系统调用直接把标准输出给关了,但是 printf 还是认为它写入成功。

五、结语

今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下,春人的主页还有很多有趣的文章,欢迎小伙伴们前去点评,您的支持就是春人前进的动力!

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/685148.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#系列-EntityFrameworkCore.SqlServer.NodaTime实例(37)

EntityFrameworkCore.SqlServer.NodaTime 是一个扩展包&#xff0c;它允许你使用 NodaTime 库中的日期和时间类型与 SQL Server 数据库进行交互。NodaTime 是一个流行的.NET 日期和时间库&#xff0c;它提供了比 .NET 内置的 DateTime 和 DateTimeOffset 类型更丰富的功能和更好…

探讨:工业物联网,纯上报设备的数采

事情是这样的&#xff0c;有一台设备是modbus-tcp协议&#xff0c;手工操作测量&#xff0c;自动发送测量结果&#xff0c;就这&#xff0c;没别的了。 开始看起来挺简单&#xff0c;连接上去就等着收数据嘛&#xff0c;多简单&#xff01;后来发现麻烦得很啊&#xff0c;关键的…

【深度学习】S2 数学基础 P4 概率论

目录 基本概率论概率论公理随机变量 多个随机变量联合概率条件概率贝叶斯定理求和法则独立性 期望与方差小结 基本概率论 机器学习本质上&#xff0c;就是做出预测。而概率论提供了一种量化和表达不确定性水平的方法&#xff0c;可以帮助我们量化对某个结果的确定性程度。 在…

状态模式:灵活管理对象状态的设计策略

状态模式&#xff1a;灵活管理对象状态的设计策略 在软件开发的过程中&#xff0c;我们经常会遇到对象根据其内部状态的改变而改变其行为的场景。传统的处理方式可能会使用大量的条件判断语句来处理不同的状态转换以及相应的行为&#xff0c;这不仅使得代码难以维护&#xff0…

【UI自动化测试技术】自动化测试研究:Python+Selenium+Pytest+Allure,详解UI自动化测试,iframe、窗口等控件切换(精)(五)

导言 在上一篇文章里&#xff0c;我们一起学习了键盘事件、鼠标事件以及其它的一些特殊情况的处理。这篇文章我们一起学习Selenium中一些特殊窗口以及iframe&#xff0c;如何处理。 学习目标 了解对浏览器的基本功能操作&#xff08;本节重点&#xff09;学习如何对弹窗进行操…

素数算法(普通求解,埃氏筛,欧拉筛)

素数算法&#xff08;常规求解&#xff0c;埃氏筛&#xff0c;欧拉筛&#xff09; 1. 常规求解1.1 原理解释1.2 算法实现 2 . 埃氏筛2.1 原理解释2.2 算法实现 3. 欧拉筛3.1 原理解释3.2 算法实现 1. 常规求解 1.1 原理解释 枚举法是一种简单的求解素数的方法&#xff0c;其基…

黑马程序员java部分笔记(持续更新)九点五:数组的动态初始化与常见问题

为什么有动态初始化呢? 当 不知道数组里几个元素的具体值时用动态初始化 动态初始化&#xff1a;初始化时只指定数组长度&#xff0c;由系统分配初始值 格式&#xff1a;数据类型[]数组名new 数据类型[数组长度]; 特点&#xff1a;在创建的时候有自己指定数组长度&#xff0c;…

Java的集合框架和泛型

文章目录 集合框架什么是集合框架类和接口总览 集合框架的重要性背后所涉及的数据结构以及算法什么是数据结构容器背后对应的数据结构什么是算法 包装类基本数据类型和对应的包装类装箱和拆箱自动装箱和自动拆箱 泛型什么是泛型引出泛型语法泛型类泛型的上界(没有下界)泛型方法…

心理辅导|高校心理教育辅导系统|基于Springboot的高校心理教育辅导系统设计与实现(源码+数据库+文档)

高校心理教育辅导系统目录 目录 基于Springboot的高校心理教育辅导系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、学生功能模块的实现 &#xff08;1&#xff09;学生登录界面 &#xff08;2&#xff09;留言反馈界面 &#xff08;3&#xff09;试卷列表界…

方式0控制流水灯循环点亮

#include<reg51.h> //包含51单片机寄存器定义的头文件 #include<intrins.h> //包含函数_nop_()定义的头文件 unsigned char code Tab[]={0xFE,0xFD,0xFB,0xF7,0xEF,0xDF,0xBF,0x7F};//流水灯控制码,该数组被定义为全局变量 sbit P17=P1^7; /*****************…

100.网游逆向分析与插件开发-网络通信封包解析-C++还原网络通信系统发送功能

内容参考于&#xff1a;易道云信息技术研究院VIP课 上一个内容&#xff1a;数据包组织与发送过程逆向分析 码云地址&#xff08;游戏窗口化助手 分支&#xff09;&#xff1a;https://gitee.com/dye_your_fingers/sro_-ex.git 码云版本号&#xff1a;ec54e9ae1ca0efe96b87d5…

C/C++如何把指针所指向的指针设为空指针?

实践出真知&#xff0c;指针对于初学的友友来说&#xff0c;头都要大了。喵喵一直遵循在实践中学&#xff0c;在学习中实践&#xff0c;相信你也会有所得&#xff01; 以下是该问题的解决方案&#xff1a; int** ptrPtr new int*; // 创建指向指针的指针 int* ptr new int;…

《动手学深度学习(PyTorch版)》笔记8.2

注&#xff1a;书中对代码的讲解并不详细&#xff0c;本文对很多细节做了详细注释。另外&#xff0c;书上的源代码是在Jupyter Notebook上运行的&#xff0c;较为分散&#xff0c;本文将代码集中起来&#xff0c;并加以完善&#xff0c;全部用vscode在python 3.9.18下测试通过&…

基于Springboot的社区物资交易互助平台(有报告)。Javaee项目,springboot项目。

演示视频&#xff1a; 基于Springboot的社区物资交易互助平台&#xff08;有报告&#xff09;。Javaee项目&#xff0c;springboot项目。 项目介绍&#xff1a; 采用M&#xff08;model&#xff09;V&#xff08;view&#xff09;C&#xff08;controller&#xff09;三层体系…

深度学习||YOLO(You Only Look Once)深度学习的实时目标检测算法(YOLOv1~YOLOv5)

目录 YOLOv1: YOLOv2: YOLOv3: YOLOv4: YOLOv5: 总结: YOLO(You Only Look Once)是一系列基于深度学习的实时目标检测算法。 自从2015年首次被提出以来,YOLO系列不断发展,推出了多个版本,包括YOLOv1, YOLOv2, YOLOv3, YOLOv4, 和YOLOv5等。下面是对YOLO系列的详解…

【光学】学习记录1-几何光学的近轴理论

课程来源&#xff1a;b站资源-光学-中科大-崔宏滨老师&#xff08;感谢&#xff09;&#xff0c;本系列仅为自学笔记 【光学 中科大 崔宏滨老师 1080p高清修复&#xff08;全集&#xff09;】https://www.bilibili.com/video/BV1NG4y1C7T9?p2&vd_source7ba37b2cff2a1b783…

MATLAB计算极限和微积分

一.函数与极限 计算极限&#xff1a;lim(3*x^2/(2x1))&#xff0c;x分别趋于0和1&#xff0c;代码如下&#xff1a; syms x; limit(3*x*x/(2*x1),x,0) limit(3*x*x/(2*x1),x,1) 结果分别为0和1&#xff1a; 1.计算双侧极限 计算极限&#xff1a;lim(3*x^2/(2x1))&#xff0…

wordpress日主题模版Ripro-v5 6.4开心版

RiPro主题全新V5版本&#xff0c;&#xff08;原RiPro v2旧版已停更&#xff09;是一个优秀且功能强大、速度极快&#xff0c;易于管理、现代化的WordPress虚拟资源商城主题。支持首页模块化布局和WP原生小工具模块化首页可拖拽设置&#xff0c;让您的网站设计体验更加舒适。同…

linux进程控制【程序替换】

目录 前言&#xff1a; 1.替换原理 ​编辑 2.替换函数 2.1函数 execl 2.2函数 execv 2.3函数 execlp 2.4函数 execvp 2.5函数 execle 2.6函数 execve 2.7函数 execvpe 前言&#xff1a; 前面我们介绍了进程控制中的创建&#xff0c;退出等待&#xff0c;本章节我们将…

计算机的分类

计算机的分类 1.个人移动设备。这个比较好理解&#xff0c;比较常见的是手机&#xff0c;平板电脑。 2.桌面计算机。这类计算机范围比较广泛&#xff0c;包括低端的上网本&#xff0c;台式计算机&#xff0c;笔记本电脑和高端的工作站。核心部件都是表大规模集成电路技术的cp…