送给大家一句话:
要相信,所有的不美好都是为了迎接美好,所有的困难都会为努力让道。
—— 简蔓《巧克力色微凉青春》
开始理解基础 IO 吧!
- 1 前言
- 2 知识回顾
- 3 理解文件
- 3.1 进程和文件的关系
- 3.2 文件的系统调用
- open
- write
- 文件 fd 值
- 3.3 语言层如何理解
- Thanks♪(・ω・)ノ谢谢阅读!!!
- 下一篇文章见!!!
1 前言
在C语言已经掌握文件操作的一些接口,接下来我们来从操作系统的层面来理解文件操作!!!
基础IO的篇章我们将讲解以下内容:
- 复习C文件IO相关操作
- 认识文件相关系统调用接口
- 认识文件描述符,理解重定向
- 对比fd和FILE,理解系统调用和库函数的关系
- 理解文件系统中inode的概念
- 认识软硬链接,对比区别
- 认识动态静态库,学会结合gcc选项,制作动静态库
2 知识回顾
C语言中要进行文件操作,就一定要先打开这个文件:fopen()
,并用一个文件指针来接收
例如:FILE* fp = fopen("log.txt","w")
打开也有可能会失败,所以还要检查fp是否为空指针。当我们使用完文件之后一定一定要关闭文件:fclose(fp)
我们要进行文件操作,前提是我们的程序跑起来了!文件打开和关闭,是CPU在执行我们的程序。所以可以推断出来:
- 打开文件的本质是进程打开文件!!!
- 文件没有被打开的时候,文件在哪里??? 当然是磁盘了
- 进程可以打开多个文件!!! (系统中同样可以存在多个进程) 很多的情况下,OS内部存在大量被打开的文件!那操作系统就要对打开的文件进行管理!! (
那么每个打开的文件在OS内部都存在一个对应描述文件属性的结构体,类似PCB
) - 文件 = 属性 + 内容
- 注意文件写入方式:
r Open text file for reading.The stream is positioned at the beginning of the file.r+ Open for reading and writing.The stream is positioned at the beginning of the file.w Truncate(缩短) file to zero length or create text file for writing.The stream is positioned at the beginning of the file.w+ Open for reading and writing.The file is created if it does not exist, otherwise it is truncated.The stream is positioned at the beginning of the file.a Open for appending (writing at end of file).The file is created if it does not exist.The stream is positioned at the end of the file.a+ Open for reading and appending (writing at end of file).The file is created if it does not exist. The initial file positionfor reading is at the beginning of the file,but output is always appended to the end of the file.
3 理解文件
3.1 进程和文件的关系
3.2 文件的系统调用
open
各个语言的文件接口基本都是不一样的,那么语言之间有没有共性呢???
我们来看一个系统调用:open()
,我们先认识使用一下:
int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);
第一个参数和C语言fopen的第一个参数一致(表示文件路径或当前目录下的文件名)
第二个参数表示想怎样打开文件,传入的是标志位
第三个参数表示创建文件的权限
会返回一个数字表示是否打开成功。
1 #include<sys/types.h> 2 #include<sys/stat.h> 3 #include<stdio.h> 4 #include<fcntl.h> 5 6 int main() 7 { // 以只读形式打开 , 文件不存在就创建8 int fd = open("log.txt",O_WRONLY|O_CREAT); 9 if(fd < 0) 10 { 11 perror("open"); 12 return 1; 13 } 14 }
运行代码:
可以看的我们成功创建了一个新文件,但是文件的权限好像不对(这里因为我们没有设置对应权限,所以是乱码!)
所以才有了第三个参数,来帮助我们确定权限
int fd = open("log.txt",O_WRONLY|O_CREAT,0666);
我们在来看看
哎呦???怎么权限还是不对,我们设置的是666应该是rw-rw-rw-
啊???这是因为创建的文件会收到文件掩码的影响:
所以会出现这样的情况,那怎么解决呢?
我们可以使用umask()
系统调用,动态修改掩码值(只在该进程中起作用),来达到我们预期的结果:
1 #include<sys/types.h>2 #include<sys/stat.h>3 #include<stdio.h>4 #include<fcntl.h>5 6 int main()7 {8 umask(0); 9 int fd = open("log.txt",O_WRONLY|O_CREAT,0666); 10 if(fd < 0) 11 { 12 perror("open"); 13 return 1; 14 } 15 }
这样就创建出来我们预期的效果了!!!
我们再来看看 flag 标志位,它是一个32位的整数,每个比特位代表一个对应功能(OS常用的系统调用接口的常用方法),也就是位图!!!每个宏定义都是一个对应比特位设置为1,想要实现多个功能就进行 | 按位与操作就可以了!!!
常用的标志位参数:
O_RDONLY: 只读打开
O_WRONLY: 只写打开
O_RDWR : 读,写打开
上面三个常量,必须指定一个且只能指定一个O_CREAT : 若文件不存在,则创建它。需要使用mode选项,来指明新文件的访问权限
O_APPEND: 追加写
write
接下来我们写入来试试。
1 #include<sys/types.h>2 #include<sys/stat.h>3 #include<stdio.h>4 #include<fcntl.h>5 6 int main()7 {8 umask(0);9 int fd = open("log.txt",O_WRONLY|O_CREAT,0666);10 if(fd < 0)11 {12 perror("open");13 return 1;14 }15 16 const char* message = "hello linux file!\n";17 write(fd , message,strlen(message));18 19 close(fd);20 return 0; 21 }
这样就成功写入进去了(注意没有写入\0哦)
但是我们在写入aaaa
时会发现,原本文件并没有清空,也就是open默认不会清空文件!!!,这时我们加入新的标记位O_TRUNC
,就能打开文件就清空了!现在就不会出现叠加的情况了!通过不同的标识位可以做到不同功能(比如追加写入)
文件 fd 值
接下来我们来认识一下文件fd:
#include<sys/types.h> 2 #include<sys/stat.h> 3 #include<stdio.h> 4 #include<fcntl.h> 5 #include<string.h> 6 7 int main() 8 { 9 int fda = open("loga.txt",O_WRONLY|O_CREAT|O_TRUNC); 10 printf("fda: %d\n",fda); 11 12 int fdb = open("logb.txt",O_WRONLY|O_CREAT|O_TRUNC); 13 printf("fda: %d\n",fdb); 14 15 int fdc = open("logc.txt",O_WRONLY|O_CREAT|O_TRUNC); 16 printf("fda: %d\n",fdc) ; 17 return 018 }
来看效果:
每个文件都有对应的不同的fd值(类似进程的 pid),为什么是从3开始的呢,因为0 1 2
,都是已经设置好的文件:
- 0 : 标准输入 – 键盘
- 1 : 标准输出 – 显示器
- 2 : 标准错误 – 显示器
在语言层(比如C语言),也会默认打开这三个(stdin stdout stderr)。我们使用文件对应的fd值,也可以实现写入操作了。
那么在操作系统内部,是如何实现的呢?
文件的管理类似进程管理,会有对应的struct file
l来进行管理,而且多个进程可能打开同一个文件,所以进程里也一定有管理该进程打开的文件的结构体(struct files_struct
),里面包含一个指针数组,每个指针都指向对应的文件,数组的下标也就是每个文件的fd值,所以上层的系统调用使用fd值(数组下标)就能访问对应文件!!!
这时也就可以总结一下open系统调用做了哪些事情:
- 创建file
- 开辟文件缓冲区的空间,加载文件数据
- 查进程的文件描述符表(struct files_struct *file)
- file 地址,填入对应表的下表中
- 返回下标(fd)
3.3 语言层如何理解
C语言中FILE
其实是一个结构体类型,内部一定会封装文件fd!!!来看
#include<sys/types.h> 2 #include<sys/stat.h> 3 #include<stdio.h> 4 #include<fcntl.h> 5 #include<string.h> 6 7 int main() 8 { 9 10 printf("stdin->fd: %d\n",stdin->_fileno); 11 printf("stdin->fd: %d\n",stdout->_fileno); 12 printf("stdin->fd: %d\n",stderr->_fileno); 13 14 FILE* fp = fopen("log.txt","w"); 15 if(fp == NULL) return 1; 16 printf("fd : %d\n",fp->_fileno); 17 18 FILE* fp1 = fopen("log1.txt","w"); 19 if(fp1 == NULL) return 1; 20 printf("fd : %d\n",fp1->_fileno); 21 22 FILE* fp2 = fopen("log2.txt","w"); 23 if(fp2 == NULL) return 1; 24 printf("fd : %d\n",fp2->_fileno); 25 return 026 }
来看运行效果:
怎么样,我们的猜测没有问题!!!所以语言层的文件操作函数,本质底层是对系统调用的封装!通过不同标志位的封装来体现w r a+
等不同打开类型!
我们在使用文件操作时,一般都要使用语言层的系统调用,来保证代码的可移植性。因为不同系统的系统调用可以会不一样!
下一篇文章我们来看文件操作的应用!!!