如果没有文件,我们写的程序的数据都存储在内存中,当程序退出,内存回收,数据就丢失了,下次再运行程序,已经看不到上次运行的数据了,而为了将数据持久性的保存,就需要使用文件。
一、什么是文件
磁盘(硬盘)上的文件就是文件。
但是在程序设计中,我们一般谈论两种文件:程序文件,数据文件(从文件功能的角度来分类)。
1.1 程序文件
程序文件包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
1.2 数据文件
文件的内容除了可以是程序,还可以是程序运行时读写的数据,比如程序运行时需要从中读取数据的文件,或者输出内容的文件。
本篇博客谈论的数据文件。
在以前我们程序所处理数据的输入输出都是以终端为对象,即从终端的键盘输入数据,运行结果显示在显示屏上。
但是我们也可以将数据输出到磁盘上,当需要时再从磁盘上将数据读取到内存中使用,这里处理的就是磁盘中的文件。
1.3 文件名
每一个文件都有一个独属于自己的文件标识,方便用户识别和引用
为了方便,文件标识常被称为文件名
文件名包含三个部分:文件路径 + 文件名主干 + 文件后缀
例如:C:\Users\1\Desktop\C代码\c-code-submission\X形图案\X形图案\test.c
- 在\之前的内容表示文件所在路径,比如这个test.c文件在C盘,桌面目录中C代码目录下的c-code-submission目录下的X形图案目录下X形图案目录下的位置
- 该文件的文件名主干是test
- 该文件的文件后缀是.c
二、二进制文件和文本文件
根据数据的组织形式,数据文件可以分为文本文件和二进制文件。
- 我们都知道,数据在内存中都是以二进制形式存储的,如果不加以转换直接输出到外存的文件中,这种文件就是二进制文件。
- 如果要求在外存上以ASCII码形式存储,那么就需要在存储前加以转换。这种以ASCII码形式存储的文件就是文本文件。
在文件读写中会拓展一个数据在文件中的存储。
三 、文件的使用
我们喝饮料一般分为三步:1. 打开瓶盖,2. 喝饮料,3. 观赏瓶盖。
文件使用与喝饮料一样,也分为三步:1. 打开文件,2. 读写文件,3. 关上文件。
3.1 流和标准流
在讲解文件之前,我们需要引入流的概念。
3.1.1 流
我们的程序需要输出到各种外部设备,也需要从外部设备中获取数据,不同的外部设备的输入输出操作各不相同,为了方便程序员对各种设备进行操作,我们抽象出了流的概念,我们可以把流想象成流淌着字符的河。
C程序针对文件,画面,键盘等的数据输入输出操作都是通过流操作的。
一般情况下,我们想向流里写数据,或者从流中读取数据,都是要打开流,然后操作。
3.1.2 标准流
那为什么我们从键盘输入数据,向屏幕上输出数据,并没有打开流呢?
那是因为C语言程序在启动时,默认打开3个流:
- stdin - 标准输入流,在大多数环境中从键盘输入,scanf函数就是从标准输入流中读取数据。
- stdout - 标准输出流,大多数环境中输出至显示屏界面,printf函数就是将信息输出到标准输出流中。
- stderr - 标准错误流,大多数环境中输出到显示屏界面。
由于默认打开了这三个流,我们使用scanf,printf等函数就可以直接进行输入输出操作。
stdin,stdout,stderr这三个流的类型是:FILE*,通常称为文件指针。
在C语言中,就是通过FILE*的文件指针来维护流的各种操作。
3.2 文件指针
根据上面流的概念,我们需要对文件进行操作需要一个至关重要的桥梁——文件指针。
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件的状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的,取名FILE。
我们用图来更直观展示:
例如,VS2013编译环境提供的stdio.h头文件中有以下的文件类型声明:
struct _iobuf {char* _ptr;int _cnt;char* _base;int _flag;int _file;int _charbuf;int _bufsiz;char* _tmpfname;
};
typedef struct _iobuf FILE;
- 不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。
- 每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节。
- 一般都是通过一个FILE的指针来维护这个FILE结构体的变量,这样使用起来更加方便。
现在我们可以创建一个FILE类型的指针变量:
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件的文件信息区就能访问该文件。也就是说,通过文件指针变量能够间接找到与它相关联的文件。
例如:
3.3 文件的打开和关闭
现在我们已经能够访问一个文件了,接下来就是如何打开文件,读写文件,关闭文件。
注意:
- 文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
- 在编写程序的时候,再打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
- ANSI C规定使用fopen函数来打开文件,fclose函数来关闭文件。
3.3.1 打开——fopen函数
功能:打开文件。
返回值:FILE*的指针
对于返回值,如果打开成功,则是一个有效地址,如果打开失败,则返回NULL。
从fopen函数的定义上可以知道fopen有两个const char*的参数:filename和mode
filename:传入要打开的文件名(分为相对路径和绝对路径)。
①相对路径
例如:test.txt就是相对路径
相对路径是一个相对于当前源文件所在目录的一个路径。(必须与当前源文件在同一目录下)
我们看一下这个文件的位置:
②绝对路径
使用了绝对路径,我们打开的文件就不在局限于当前源文件同一目录下,可以使其他地方的文件。
总结:绝对路径不容易出错,但不够简便。相对路径是一个相对于当前源文件所在目录的一个路径,比绝对路径要简便,而且当某个外层文件夹的位置改动时,相对路径是不需要改变的,而绝对路径需要。
mode:文件的打开模式。下面是文件的打开模式:
注意:当使用“w”,“wb”,“w+”,“wb+”打开一个已经存在的文件时,会清空该文件所有内容。
3.3.2 关闭——fclose函数
功能:关闭文件
fclose函数只有一个参数:FILE* stream。
stream:传入要关闭的文件的文件指针。
返回值:整型。如果关闭成功返回0,关闭失败返回EOF(-1)。
下面是使用示例:
注意:不能对同一个指针连续fclose多次,否则编译器报错。
四、文件的读写
我们打开文件后,自然要对打开的文件进行读写操作,下面我们详细讲解如何进行文件读写。
文件的读写分为两种:顺序读写和随机读写。
4.1 文件顺序读写
对于顺序读写,我们经常使用一下函数:
下面来一一介绍。
4.1.1 字符输入——fgetc函数
功能:从文件中得到一个字符。
参数stream:要读取的文件的文件指针。
返回值:整型。返回的是这个字符的ASCII码值。
有些人觉得读取的是字符,为什么要返回它的ASCII码值呢,直接返回这个字符不行吗?这就涉及到文件末尾了。
如果这个函数读取到文件末尾或者读取出错,该函数会返回EOF(-1)。
运用实例:
先在文件中存一些数据
#include<stdio.h>
int main()
{FILE* pf = fopen("test.txt", "r");//打开文件//文件操作//判断文件是否打开成功if (pf == NULL){printf("打开失败\n");return 1;}//读取文件int c = fgetc(pf);printf("%c ", c);//关闭文件fclose(pf);pf = NULL;return 0;
}
运行结果:
4.1.2 字符输出——fputc函数
功能:写入一个字符到文件中。
参数有两个:int character;FILE* stream
character:被写入的字符的ASCII码值,被写入时这个值要是unsigned char范围内的。
stream:一个指向打开的文件的指针。
返回值:整型。返回这个字符的ASCII码值。
同样,如果写入出错,返回EOF(-1)。所以返回值为int,而不是char。
运行示例:
我们让文件清空
#include<stdio.h>
int main()
{FILE* pf = fopen("test.txt", "w");//打开文件//要写入文件,以“w”模式打开文件//文件操作//判断文件是否打开成功if (pf == NULL){printf("打开失败\n");return 1;}//写入文件int c = 'a';fputc(c, pf);//关闭文件fclose(pf);pf = NULL;return 0;
}
运行结果:
4.1.3 文本行输入——fgets函数
功能:从文件中得到字符串。
该函数有三个参数:char* str,int num,FILE* stream
- str:指向复制读取的字符串的 char数组的指针。
- num:要复制到 str 中的最大字符数(包括终止 null 字符)。
- stream:指向标识输入流的 FILE 对象的指针。
返回值:指向该字符串的地址。
成功后,该函数返回 str。
如果在尝试读取字符时遇到文件末尾,则设置 eof 指示符 (feof)。如果在读取任何字符之前发生这种情况,则返回的指针为空指针(并且 str 的内容保持不变)。
如果发生读取错误,则设置错误指示符 (ferror),并返回 null 指针(但 str 指向的内容可能已更改)。
使用示例:
注意:该函数读取成功有两种结果:
①读取到了最大个数num时,这时函数并不会读取num个字符,只会读取num-1个,第num个字符会自动补充为'\0'。
很明显,a[9] != 'g',反而a[9] == '\0'。
②还未读取到num-1个字符时,读取到了换行符'\n',会结束读取,并在后面补上'\0'。所以,该函数最多只能读取一行的数据,也就知道了这函数叫文本行输入函数的原因。
这种情况,我们要将文件中的内容全部读取,而文件中有两行数据,就要使用两次fgets函数:
4.1.4 文本行输出——fputs函数
功能:写入一字符串到文件中。
参数有两个:const char* str;FILE* stream
- str:指向一个要存放到文件里的字符串的指针。
- stream:指向接收字符串的文件的指针。
返回值: 成功后,将返回一个非负值。
出错时,该函数返回 EOF 并设置错误指示器 (ferror)。
使用示例:
注意:fputs函数会把整个字符串全部写入文件,而且会读取换行符('\n')。
4.1.5 格式化输入——fscanf函数
功能:从文件中读取格式化的数据。
参数:
- stream:指向要读取数据的文件的指针。
- format:被接受的数据的格式(与scanf一样,有%d,%s,%c等格式)。
- …表示接收要读取的数据的变量名(与scanf后面的要输入的变量名一样)。
返回值:
- 成功后,该函数返回成功填充的参数列表的项数。此计数可能与预期的项目数匹配,也可能由于匹配失败、读取错误或文件末尾的范围而更少(甚至为零)。
- 如果在读取时发生读取错误或到达文件末尾,则设置正确的指示器(feof 或 ferror)。而且,如果在成功读取任何数据之前发生任何情况,则返回 EOF。
实际上,fscanf函数只比scanf多了stream这一个参数,如果stream为标准输入(stdin)时,与scanf函数没有区别。
使用示例:
4.1.6 格式化输出——fprintf函数
功能:将格式化的数据输入到文件中。
参数:
- stream:指向要写入数据的文件的指针。
- format:被写入的数据的格式(与printf一样,有%d,%s,%c等格式)。
- …表示要输出到文件里的数据的变量名(与printf后面的变量名一样)。
返回值:
- 成功后,将返回写入的字符总数。
- 如果发生写入错误,则设置错误指示符 (ferror) 并返回负数
fprintf与printf也只多了一个stream参数,表示写入的文件,当stream为标准输出(stdout)时,与printf的作用没有区别。
使用示例:
4.1.7 二进制输入——fread函数
对于二进制的文件,我们需要使用二进制的方式来读取,接下来介绍二进制输入输出函数。
注意:二进制的输入输出都是以字节为单位。
功能:从文件中读取数据块。
参数:
- ptr:指向大小至少为 (size*count) 字节的内存块的指针,转换为 void*。
- size:要读取的每个元素的大小(以字节为单位)。
- count:元素数,每个元素的大小为字节。
- stream:指向指定输入流的 FILE 对象的指针。
返回值:
- 返回成功读取的元素总数。
- 如果此数字与 count 参数不同,则表示读取时发生读取错误或到达文件末尾。在这两种情况下,都设置了正确的指标,可以分别使用 ferror 和 feof 进行检查。
- 如果 size 或 count 为零,则该函数返回零,并且 ptr 指向的流状态和内容保持不变。
二进制文件无法使用txt文件打开来获得想要的信息。
4.1.8 二进制输出——fwrite函数
功能:将数据块写入文件中。
参数:
- ptr:指向要写入的元素数组的指针,转换为 const void*。
- size:要写入的每个元素的大小(以字节为单位)。
- count:元素数,每个元素的大小为字节。
- stream:指向指定输出流的 FILE 对象的指针。
返回值:
- 返回成功写入的元素总数。
- 如果此数字与 count 参数不同,则写入错误会阻止函数完成。在这种情况下,将为流设置错误指示器 (ferror)。
- 如果 size 或 count 为零,则函数返回零,错误指示器保持不变。
使用示例:
4.1.9 拓展——sscanf,sprintf解析
4.1.9.1 sscanf函数
功能:从字符串中读取格式化数据。
参数:
- s:被读取的字符串。
- format:被接受的数据的格式(与scanf一样,有%d,%s,%c等格式)。
- …(附加参数):接收要读取的数据的变量名(与scanf后面的要输入的变量名一样)。
返回值:成功后,该函数返回成功填充的参数列表中的项数。此计数可以与预期的项目数匹配,也可以在匹配失败的情况下更少(甚至为零)。如果在成功解释任何数据之前发生输入失败,则返回 EOF。
使用示例:
4.1.9.2 sprintf函数
功能:将格式化的数据转换成字符串。
参数:
- str:指向转换的字符串的指针。
- format:被写入的数据的格式(与printf一样,有%d,%s,%c等格式)。
- …:输出到字符串里的数据的变量名(与printf后面的变量名一样)。
返回值:成功后,将返回写入的字符总数。此计数不包括自动追加在字符串末尾的其他 null 字符。
失败时,返回负数。
使用示例:
4.2 文件随机读写
当用到文件随机读写,我们常会使用这三个函数:fseek,ftell,rewind。
4.2.1 fseek函数
功能:根据文件指针当前位置和偏移量重新定位文件指针。
参数:
- stream:指向要改变定位的文件的指针。
- offset:二进制文件:传入要偏移的偏移量。文本文件:零或 ftell 返回的值(不能直接传除0以外的整数,结果可能达不到预期,一定传ftell的返回值)。
- origin:设置stream指针的起始位置。
origin有以下3个参数:
- SEEK_SET:设置在文件开头。
- SEEK_CUR:设置在指针的当前位置。(不改变指针位置)
- SEEK_END:设置在文件结尾。
返回值:如果成功,该函数将返回零。否则,它将返回非零值。
如果发生读取或写入错误,则设置错误指示符 (ferror)。
使用示例:
4.2.2 ftell函数
功能:返回文件指针相对于起始位置的偏移量。
参数:stream:指向要计算偏移量的文件的指针。
返回值:成功后,返回位置指标的当前值。
失败时,返回 -1L,并将 errno 设置为特定于系统的正值。
使用示例:
4.2.3 rewind函数
功能:让指针的位置回到文件的起始位置。
参数:stream:指向要回到起始位置的文件的指针。
返回值:无。
使用示例:
五、文件读取结束的判定
feof和ferror这个函数会被许多人错误用来文件是否结束,我们来了解一下这两个函数以及如何判断文件是否读取结束。
5.1 feof函数
功能:当文件读取结束时,判断读取结束的原因是否是:遇到文件尾结束。
参数:stream:传入需要判断的文件的指针。
返回值:与到文件末尾而读取结束则返回非0值,其他原因返回0。
使用示例将与后面判断是否读取结束的用例在一起。
5.2 ferror函数
功能:判断读取的时候是否发生了错误。
参数:stream:传入要判断是否读取出错的文件的指针。
返回值:如果发生了错误则返回非0值,如果没有错误返回0。
5.3 文本文件判断
在前面的顺序读写函数中,我们通过其返回值可以判断是否读取结束。
文本文件读取是否结束,判断返回值是否为EOF(fgetc),或者NULL(fgets)。
例如:
- fgetc判断是否为EOF
- fgets判断是否为NULL
使用示例:
5.4 二进制文件判断
二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:fread判断返回值是否小于实际要读的个数。
使用示例:
六、文件缓冲区
我们看看下面这个代码及其输出来感受一下:
这里我们可以得到一个结论:
因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。
如果不做,可能导致读写文件的问题。