目录
前言
1. 为什么使用文件?
2. 什么是文件?
2.1 程序文件
2.2 数据文件
2.3 文件名
3. ⼆进制文件和文本文件?
4. 文件的打开和关闭
4.1 流和标准流
4.1.1 流
4.1.2 标准流
4.2 文件指针
4.3 文件的打开和关闭
5. 文件的顺序读写
5.1 fputc()
5.2 fgetc()
5.3 fputs()
5.4 fgets()
5.6 fprintf()
5.6 fscanf()
5.7 fwrite()
5.8 fread()
6.对比一组函数:
7. 文件的随机读写
7.1 fseek
7.2 ftell
7.3 rewind
8. 文件读取结束的判定
8.1 被错误使用的 feof
8.2 ferror
9. 文件缓冲区
前言
在C语言中,文件操作是指对文件进行读写和管理的一系列活动。这些操作是通过C标准库中的文件处理函数来实现的,使得程序员能够创建、打开、关闭、读取和写入文件。
在计算机程序设计中,文件是存储在外部介质(如硬盘、SSD、USB驱动器等)上的数据的集合。C语言提供了一套丰富的文件操作接口,允许程序员以多种方式与这些文件交互。无论是文本文件还是二进制文件,C语言的文件操作函数都为数据的持久化存储和信息的交换提供了基础支持。
文件操作的核心目的是实现以下基本功能:
- 创建新文件:可以在文件系统中创建新的文件实体。
- 写入数据:可以将数据写入到文件中,以保存信息。
- 读取数据:可以从文件中读取以前保存的数据。
- 文件管理:可以对文件进行重命名、删除、移动和其他管理操作。
为了实现这些功能,C语言定义了一组标准的库函数,这些函数在stdio.h
头文件中声明。以下是一些常用的文件操作函数:
fopen
:打开一个文件,并返回一个文件指针用于后续的文件操作。fclose
:关闭一个已打开的文件,释放相关资源。fgetc
、fputc
:分别用于从文件中读取单个字符和向文件中写入单个字符。fgets
、fputs
:分别用于从文件中读取一行字符串和向文件中写入一行字符串。fread
、fwrite
:用于以二进制形式高效地读取和写入数据块。fseek
、ftell
:用于在文件中移动文件指针的位置和获取当前位置。rewind
:将文件指针重置到文件的开头。remove
:删除一个文件。
使用这些函数时,程序员需要了解文件的操作模式,如只读、只写、读写更新等。此外,还需要处理可能出现的错误,如文件不存在、权限不足、磁盘空间不足等情况。
在编写涉及文件操作的C语言程序时,应当遵循良好的编程实践,包括检查函数调用的返回值以确保操作成功,以及在使用完毕后正确关闭文件。这些细节对于确保数据的完整性和程序的健壮性至关重要。
总之,C语言的文件操作是系统编程和应用程序开发中不可或缺的一部分,它为数据的持久存储和程序间通信提供了强有力的支持。通过掌握C语言的文件操作,程序员可以有效地管理和处理存储在外部介质上的数据 。
正文开始
1. 为什么使用文件?
如果没有⽂件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失 了,等再次运行程序,是看不到上次程序的数据的,如果要将数据进行持久化的保存,我们可以使用文件。
2. 什么是文件?
磁盘(硬盘)上的文件是文件。
但是在程序设计中,我们⼀般谈的文件有两种:程序文件、数据文件(从文件功能的⻆度来分类 的)。
2.1 程序文件
程序文件包括源程序⽂件(后缀为.c),⽬标⽂件(windows环境后缀为.obj),可执⾏程序(windows 环境后缀为.exe)。
2.2 数据文件
⽂件的内容不⼀定是程序,⽽是程序运行时读写的数据,⽐如程序运行需要从中读取数据的文件,或者输出内容的文件。
本章讨论的是数据⽂件
在以前各章所处理数据的输⼊输出都是以终端为对象的,即从终端的键盘输⼊数据,运行结果显⽰到 显示器上。
其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使⽤,这⾥处理的就是磁盘上文件。
2.3 文件名
⼀个⽂件要有⼀个唯⼀的⽂件标识,以便⽤户识别和引⽤。
⽂件名包含3部分:⽂件路径+⽂件名主⼲+文件后缀
例如: c:\code\test.txt
为了⽅便起见,文件标识常被称为文件名。
3. ⼆进制文件和文本文件?
根据数据的组织形式,数据文件被称为文本文件或者⼆进制文件。
数据在内存中以⼆进制的形式存储,如果不加转换的输出到外存的⽂件中,就是⼆进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的⽂件就是文本文件。
⼀个数据在⽂件中是怎么存储的呢?
字符⼀律以ASCII形式存储,数值型数据既可以⽤ASCII形式存储,也可以使⽤⼆进制形式存储。如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占⽤5个字节(每个字符⼀个字节),⽽ ⼆进制形式输出,则在磁盘上只占4个字节(VS2019测试)。
测试代码:
//2.文件的测试代码,将数字以二进制的形式存进txt文件中
int main()
{int a = 10000;//打开文件FILE* pf = fopen("test.txt", "wb");//写文件fwrite(&a, sizeof(a), 1, pf);//关闭文件fclose(pf);pf = NULL;return 0;
}
4. 文件的打开和关闭
4.1 流和标准流
4.1.1 流
我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输⼊输出 操作各不相同,为了⽅便程序员对各种设备进行方便的操作,我们抽象出了流的概念,我们可以把流 想象成流淌着字符的河。
C程序针对文件、画面、键盘等的数据输⼊输出操作都是通过流操作的。
⼀般情况下,我们要想向流⾥写数据,或者从流中读取数据,都是要打开流,然后操作。
4.1.2 标准流
那为什么我们从键盘输⼊数据,向屏幕上输出数据,并没有打开流呢?
那是因为C语⾔程序在启动的时候,默认打开了3个流:
- stdin - 标准输⼊流,在⼤多数的环境中从键盘输⼊,scanf函数就是从标准输⼊流中读取数据。
- stdout - 标准输出流,⼤多数的环境中输出⾄显⽰器界⾯,printf函数就是将信息输出到标准输出 流中。
- stderr - 标准错误流,⼤多数环境中输出到显示器界⾯。
这是默认打开了这三个流,我们使⽤scanf、printf等函数就可以直接进⾏输⼊输出操作的。
stdin、stdout、stderr 三个流的类型是: FILE * ,通常称为⽂件指针。
C语⾔中,就是通过 FILE* 的⽂件指针来维护流的各种操作的。
4.2 文件指针
缓冲⽂件系统中,关键的概念是“⽂件类型指针”,简称“文件指针”。
每个被使⽤的⽂件都在内存中开辟了⼀个相应的⽂件信息区,⽤来存放⽂件的相关信息(如⽂件的名 字,⽂件状态及⽂件当前的位置等)。这些信息是保存在⼀个结构体变量中的。该结构体类型是由系 统声明的,取名 FILE.
例如,VS2013 编译环境提供的 stdio.h 头⽂件中有以下的文件类型申明:
struct _iobuf {char *_ptr;int _cnt;char *_base;int _flag;int _file;int _charbuf;int _bufsiz;char *_tmpfname;
};
typedef struct _iobuf FILE;
不同的C编译器的FILE类型包含的内容不完全相同,但是⼤同小异。
每当打开⼀个⽂件的时候,系统会根据⽂件的情况⾃动创建⼀个FILE结构的变量,并填充其中的信 息,使⽤者不必关心细节。
⼀般都是通过⼀个FILE的指针来维护这个FILE结构的变量,这样使⽤起来更加方便。
下⾯我们可以创建⼀个FILE*的指针变量:
FILE* pf;//⽂件指针变量
定义pf是⼀个指向FILE类型数据的指针变量。可以使pf指向某个⽂件的⽂件信息区(是⼀个结构体变 量)。通过该⽂件信息区中的信息就能够访问该⽂件。也就是说,通过⽂件指针变量能够间接找到与它关联的⽂件。
比如:
4.3 文件的打开和关闭
文件在读写之前应该先打开文件,在使⽤结束之后应该关闭文件。
在编写程序的时候,在打开⽂件的同时,都会返回⼀个FILE*的指针变量指向该⽂件,也相当于建立了指针和文件的关系。
ANSIC 规定使用fopen 函数来打开⽂件,fclose 来关闭⽂件。
//打开⽂件
FILE * fopen ( const char * filename, const char * mode );
//关闭⽂件
int fclose ( FILE * stream );
mode表示文件的打开模式,下面都是文件的打开模式:
int main()
{FILE* pf = fopen("myfile.txt", "w");if (pf == NULL){perror("fopen");}fputs("fopen example", pf);fclose(pf);pf = NULL;return 0;
}
5. 文件的顺序读写
5.1 fputc()
int fputc( int c, FILE *stream ); //向文件写入字符
int c
:要写入的字符,以整数形式表示。FILE *stream
:指向要写入的文件流的指针。
fputc函数的返回值,如果没有发生错误,它将返回被写入的字符的整数值,通常是其ASCII码值。如果发生错误,则返回EOF(通常是-1),并设置错误标识符。
下面将展示一个列子,演示如何使用fputc()函数:
//2.讲a-z字符挨个写入文件
int main()
{FILE* pf = fopen("myfile.txt", "w");if (pf == NULL){perror("fopen");return 1;}for (int i = 'a'; i <= 'z'; i++){fputc(i, pf);}fclose(pf);pf = NULL;return 0;
}
5.2 fgetc()
int fgetc( FILE *stream ); //从文件中读出字符
FILE *stream
:这是一个指向文件流的指针,指定了要读取字符的文件
当读取成功时,fgetc返回读取到的字符的整数值,通常就是该字符的ASCII码值。如果读取到达文件末尾(EOF),或者发生错误,则函数返回EOF,通常定义为-1。
下面将展示一个列子,演示如何使用fgetc()函数:
//法一
int main()
{char arr[100] = { 0 };FILE* pf = fopen("myfile.txt", "r");if (pf == NULL){perror("fopen");return 1;}for (int i = 0; i < 26; i++){arr[i] = fgetc(pf);printf("%c ", arr[i]);}fclose(pf);pf = NULL;return 0;
}//法二
int main()
{char arr[100] = { 0 };FILE* pf = fopen("myfile.txt", "r");if (pf == NULL){perror("fopen");return 1;}int ch;while ((ch = fgetc(pf)) != EOF){printf("%c ", ch);}fclose(pf);pf = NULL;return 0;
}
5.3 fputs()
int fputs(const char *str, FILE *stream) //从文件中写入字符串
const char *str
:要写入的字符串FILE *stream
:指向要写入的流的指针
fputs函数的返回值,如果没有发生错误,它将返回一个非负整数,表示成功写入的字符数(不包括空字符'\0')。如果发生错误,则返回EOF(通常是-1),并设置错误标识符。
下面将展示一个列子,演示如何使用fputs()函数:
int main()
{char arr[100] = { 0 };FILE* pf = fopen("myfile.txt", "w");if (pf == NULL){perror("fopen");return 1;}fputs("hello world", pf);fclose(pf);pf = NULL;return 0;
}
5.4 fgets()
char *fgets( char *str, int n, FILE *stream ); //从文件中读出字符串
char *str
:字符数组的指针,用于存储读取的字符串。int n
:指定的最大读取字符数FILE *stream
:输入流的指针
fgets的返回值:
- 成功时,fgets返回的是第一个参数
str
,即指向缓冲区的指针,该缓冲区包含了读取到的字符串。 - 如果到达文件末尾或者没有读取到任何字符,则
str
内容保持不变,并返回NULL
。 - 如果在读取过程中发生错误,同样返回
NULL
。此时,可以通过检查feof
或ferror
的状态标志来确定是否发生了错误。
ps:1.这个函数只读一行,不会跨行读,如果长度允许,也会把字符串中的'\n'读进去
2.如果函数第二个的参数是n,它只会读n-1个字符,最后一个会留给'\0'
见下面的代码可以得到
下面将展示一个列子,演示如何使用fgets()函数:
int main()
{FILE* pf = fopen("myfile.txt", "r");if (pf == NULL){perror("fopen>");return 1;}char arr[20] = { 0 };while((fgets(arr, 20, pf)) != NULL)printf("%s", arr);fclose(pf);pf = NULL;return 0;
}
5.6 fprintf()
int fprintf(FILE *stream, const char *format, ...); //将格式化的数据写入文件
FILE *stream
:指向要写入数据的文件流的指针。const char *format
:包含格式说明符的字符串,用于指导如何格式化输出数据。...
:可变参数列表,表示根据format
中的格式说明符提供的变量列表,这些变量的值将被格式化并写入到流中。
返回值:成功写入的字符数,如果发生错误则返回一个负值。
下面将展示一个列子,演示如何使用fprintf()函数:
//将格式化的数据写入文件
struct S
{char name[20];int age;float score;
};
int main()
{struct S s = { "朱钱",20,65.8f };FILE* pf = fopen("myfile.txt", "w");if (pf == NULL){perror("fopen>");return 1;}fprintf(pf, "%s %d %f", s.name, s.age, s.score);fclose(pf);pf = NULL;return 0;
}
5.6 fscanf()
int fscanf(FILE *stream, const char *format, ...) //将文件中数据写入指定的格式化的结构中
FILE *stream
:指向要写入的文件的指针- const char *format是要写入的数据的格式字符串
...
表示可以接收任意数量和类型的参数,用来传递要写入的数据。
函数返回值是成功匹配和赋值的个数。如果到达文件末尾或发生读错误,则返回EOF。
下面将展示一个列子,演示如何使用fscanf()函数:
struct S
{char name[20];int age;float score;
};
int main()
{struct S s = { 0 };FILE* pf = fopen("myfile.txt", "r");if (pf == NULL){perror("fopen>");return 1;}fscanf(pf, "%s %d %f", s.name, &(s.age), &(s.score));printf("%s %d %f", s.name, s.age, s.score);fclose(pf);pf = NULL;return 0;
}
5.7 fwrite()
size_t fwrite(const void *ptr, size_t size, size_t count, FILE *stream);
//将数据从内存中以二进制的形式写入文件
void *ptr
:指向要存储数据的指针。size_t size
:每个数据项的大小(以字节为单位)。size_t count
:要写入的数据项的数量。FILE *stream
:指向被写入数据的文件流的指针。
返回值:成功读取的数据项数,或在出错时返回0。
下面将展示一个列子,演示如何使用fwrite()函数:
int main()
{FILE* pf = fopen("myfile.txt", "w");if (pf == NULL){perror("fopen>");return 1;}int arr[20] = {1,2,3,4,5};fwrite(arr, sizeof(int), 5, pf);fclose(pf);pf = NULL;return 0;
}
5.8 fread()
size_t fread( void *buffer, size_t size, size_t count, FILE *stream );
//将文件中二进制的数据取出来放进内存中
void *ptr
:指向要存储数据的缓冲区的指针。size_t size
:每个数据项的大小(以字节为单位)。size_t count
:要读取的数据项的数量。FILE *stream
:指向要读取的文件流的指针。
返回值:成功读取的数据项数,或在出错时返回0。
下面将展示一个列子,演示如何使用fread()函数:
//fread
//法一
int main()
{FILE* pf = fopen("myfile.txt", "r");if (pf == NULL){perror("fopen>");return 1;}int arr[20] = { 1,2,3,4,5 };fread(arr, sizeof(int), 5, pf);for (int i = 0; i < 5; i++){printf("%d ", arr[i]);}fclose(pf);pf = NULL;return 0;
}//法二
int main()
{FILE* pf = fopen("myfile.txt", "r");if (pf == NULL){perror("fopen>");return 1;}int arr[20];/*fread(arr, sizeof(int), 5, pf);*/int i = 0;while (fread(arr+i, sizeof(int), 1, pf)){printf("%d ", arr[0]);i++;}fclose(pf);pf = NULL;return 0;
}
6.对比一组函数:
scanf/fscanf/sscanfprintf/fprintf/sprintf
下面是一段代码来演示sprintf和sscanf函数的使用
//sprintf————将格式化的数据转换为字符串
//sscanf————将字符串转换为格式化的数据
struct S
{char name[20];int age;float score;
};
int main()
{struct S s = { "张三",20,65.9f };char arr[20];sprintf(arr, "%s %d %f", s.name, s.age, s.score);printf("%s ", arr);struct S s1;sscanf(arr, "%s %d %f", s1.name, &(s1.age), &(s1.score));printf("%s %d %f", s1.name, s1.age, s1.score);return 0;
}
7. 文件的随机读写
在文件读取的时候,没读取一个字符,光标都会往后一位,
7.1 fseek
int fseek( FILE *stream, long offset, int origin );
//用于改变文件内部的指针位置。
FILE *stream
:指向要操作的文件流的指针。long int offset
:偏移量,表示从指定位置移动多少个字节。int whence
:基准位置,通常为文件开头、当前位置或文件末尾。
文件头 SEEK_SET
当前位置 SEEK_CUR
文件尾 SEEK_END
返回值:成功时返回0,失败时返回非零值。
下面来演示一下如何使用fseek函数
int main()
{FILE* pf = fopen("myfile.txt", "r");if (pf == NULL){perror("fopen>");return 1;}int ret = fgetc(pf);printf("%c\n", ret);//此时我需要读到f,就可以使用fseek函数来改变光标的位置fseek(pf, 4, SEEK_CUR);ret = fgetc(pf);printf("%c\n", ret);fclose(pf);pf = NULL;return 0;
}
7.2 ftell
long int ftell ( FILE * stream );
//返回⽂件指针相对于起始位置的偏移量
下面来演示一下如何使用ftell函数
int main()
{FILE* pFile;long size;pFile = fopen("myfile.txt", "rb");if (pFile == NULL)perror("Error opening file");else{fseek(pFile, 0, SEEK_END); // non-portablesize = ftell(pFile);fclose(pFile);printf("Size of myfile.txt: %ld bytes.\n", size);}return 0;
}
7.3 rewind
void rewind ( FILE * stream );
//让⽂件指针的位置回到⽂件的起始位置
int main()
{//打开文件FILE* pf = fopen("myfile.txt", "r");if (pf == NULL){perror("fopen>");return 1;}//文件操作int ret = fgetc(pf);printf("%c\n", ret);//此时我需要读到f,就的使用fseek来改变光标位置fseek(pf, 4, SEEK_CUR);ret = fgetc(pf);printf("%c\n", ret);//此时我想要读到a,该怎么搞呢?fseek(pf, -3, SEEK_END);ret = fgetc(pf);printf("%c\n", ret);printf("%d\n", ftell(pf));rewind(pf);ret = fgetc(pf);printf("%c\n", ret);//关闭文件fclose(pf);pf = NULL;return 0;
}
8. 文件读取结束的判定
8.1 被错误使用的 feof
牢记:在⽂件读取过程中,不能⽤feof函数的返回值直接来判断⽂件的是否结束。
feof 的作⽤是:当⽂件读取结束的时候,判断是读取结束的原因是否是:遇到⽂件尾结束。
返回值:如果文件流已达到末尾,则返回非零值(通常为1);如果没有到达文件末尾,则返回0。
1. ⽂本⽂件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets ) 例如:
- fgetc 判断是否为 EOF
- fgets 判断返回值是否为 NULL .
2. ⼆进制⽂件的读取结束判断,判断返回值是否⼩于实际要读的个数。
例如:
- fread判断返回值是否⼩于实际要读的个数。
下面我们来演示一下feof函数的使用方法
int main()
{//打开文件FILE* pf = fopen("myfile.txt", "r");if (pf == NULL){perror("fopen>");return 1;}//文件操作int ret = 0;while ((ret = fgetc(pf)) != EOF){printf("%c\n", ret);}if (feof(pf)){printf("遇到文件末尾,读取正常结束!");}else if (ferror(pf)){perror("fgetc>");}//关闭文件fclose(pf);pf = NULL;return 0;
}
8.2 ferror
用于检查文件流中是否发生了错误。
如果文件流中发生了错误,则返回非零值;如果没有发生错误,则返回0。
下面我们来演示一下ferror函数的使用
int main()
{//打开文件FILE* pf = fopen("myfile.txt", "r");if (pf == NULL){perror("fopen>");return 1;}//文件操作for (char i = 'a'; i <= 'z'; i++){fputc(i, pf);}if (feof(pf)){printf("遇到文件末尾,读取正常结束!");}else if (ferror(pf)){perror("fputc>");}//关闭文件fclose(pf);pf = NULL;return 0;
}
9. 文件缓冲区
ANSIC 标准采⽤“缓冲⽂件系统” 处理的数据⽂件的,所谓缓冲⽂件系统是指系统⾃动地在内存中为 程序中每⼀个正在使⽤的⽂件开辟⼀块“⽂件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓 冲区,装满缓冲区后才⼀起送到磁盘上。如果从磁盘向计算机读⼊数据,则从磁盘⽂件中读取数据输 ⼊到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓 冲区的⼤⼩根据C编译系统决定的。
#include <stdio.h>
#include <windows.h>
//VS2022 WIN11环境测试
int main()
{FILE* pf = fopen("test.txt", "w");fputs("abcdef", pf);//先将代码放在输出缓冲区printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");Sleep(10000);printf("刷新缓冲区\n");fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到⽂件(磁盘)//注:fflush 在⾼版本的VS上不能使⽤了printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");Sleep(10000);fclose(pf);//注:fclose在关闭⽂件的时候,也会刷新缓冲区pf = NULL;return 0;
}
这⾥可以得出⼀个结论: 因为有缓冲区的存在,C语⾔在操作文件的时候,需要做刷新缓冲区或者在⽂件操作结束的时候关闭文件。如果不做,可能导致读写文件的问题。