文章目录
- 铺垫
- 文件的系统调用接口
- 文件描述符
- 缓冲区
铺垫
- 文件=文件内容 + 文件属性
- 访问文件之前,都要先打开文件,而要访问,修改,编辑文件,文件就必须加载到内存中
- 程序运行起来变成进程,被CPU调度,打开文件
- 文件分为内存文件和磁盘文件。内存文件:一个文件在被进程访问
- 一定时间段内,系统中存在多个进程,也可能同时存在更多的被打开的文件,所以操作系统要对打开的文件进行管理:先描述,在组织。所以操作系统中一定要有描述被打开文件的结构体。
所以进程和文件一定是密切相关的。
文件的系统调用接口
我们知道,操作系统要对软硬件资源做管理,所以要想访问文件,不能直接操作,必须调用系统调用。
filename:要打开的文件名
flags:打开文件时可以传入多个参数选项,用一个或多个参数进行或运算
参数:
O_WRONLY:只写打开
O_RDONLY:只读打开
O_RDER:读写打开
O_CREAT:如果文件不存在就创建
O_TRUNC:打开文件时清空文件内容
O_APPEND:追加写
mode:创建文件时的权限
所以fopen中,
w = O_CREAT | O_WRONLY | O_TRUNC
a = O_CREAT | O_WRONLY | O_APPEND
r = O_RDONLY
open系统调用成功时返回新打开的文件描述符,失败返回-1
同样的,其他系统调用都会用到文件描述符fd
文件描述符
创建一批文件,发现文件描述符从3开始不断递增,那么0,1,2呢?
Linux进程默认情况下会右3个缺省打开的文件描述符,分别是标准输入0,标准输出1,标准错误2。
所以文件描述符就是从0开始的整数,文件描述符的分配规则:找到从0开始的最小的没有被使用的整数作为新的文件描述符。当我们打开文件时,操作系统要创建出对应的内核数据结构管理文件,于是就有了file结构体,表示一个被打开文件。进程执行open系统调用,就必须让进程和文件关联起来,每个进程都有一个指针files,指向一张表files_struct,每个元素都指向一个被打开文件,下标就是被打开文件的文件描述符。所以文件描述符的本质就是数组下标。
缓冲区
缓冲区本质是一块内存区域,我们说的缓冲区和内核中的缓冲区没有关系,是语言层面的缓冲区,C语言自带缓冲区。
为什么要有缓冲区:a.提高使用者的效率 b.聚集数据,一次拷贝,提高整体效率,减少拷贝次数,调用系统调用是有成本的。
文件缓冲区在哪:文件缓冲区是被FILE结构体所维护的,一个文件维护一个缓冲区。