C语言文件操作
什么是文件
磁盘上的数据是文件。
但是在程序设计中,我们一般谈的文件有两种:程序文件(例如.c,.h这一类编译,链接过程中的文件),数据文件。
程序文件
包括源程序文件(后缀为.c),目标文件(windows环境的后缀为.obj,linux环境的后缀为.o),可执行程序(windows的后缀为.exe,习惯上linux环境下没有后缀)。
数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
文件名
一个文件要有一个文件标识,以便用户识别和引用。
文件名包含三个部分:文件路径+文件名主干+文件后缀。
例如:c:\code\test.txt。
为了方便,文件标识通常被称为文件名。
文件类型
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
1.数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
2.如果要求在外存中以Ascii码的形式存储,则需要在存储之前进行转换。以ASCII字符形式存储的形式就是文本文件。
3.字符一律以ASCII形式存储,数值型既可以用ASCII形式存储,也可以用二进制形式存储。
如果有整数10000,如果以ASCII码的形式存储到磁盘,则在磁盘中占用五个字节,如果以二进制存入,则在磁盘中占用四个字节。下面来看一下为什么是这样存的。
再来看一下以二进制形式存入的代码:
#include<stdio.h>int main()
{int a = 10000;//创建一个文件指针,以只写的形式打开或创建test.txt,后面会讲FILE* pf = fopen("test.txt", "wb");//二进制的形式写入文件中fwrite(&a, 4, 1, pf);fclose(pf);pf = NULL;
}
在vs中以二进制编辑器打开test.txt的结果如下:
前面的00000000是没有意义的地址,而后面的数据确实是10000的16进制位。
文件指针
缓冲文件系统中,关键的概念是:“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区。
打算读写一个文件时:
1.打开文件 2.被打开的文件就维护了一个文件信息区
每当打开一个文件的时候,系统就会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不用关心细节。
一般都是通过FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
我们来创建一个FILE*指针变量:
FILE* pf;
定义pf是一个指向FILE类型数据的指针变量,可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就可以访问该文件。也就是说,通过文件指针变量就可以找到与它相关联的文件。
比如:
文件的打开与关闭
文件操作的基本步骤:打开文件->读写文件->关闭文件
在编写程序时,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针与文件的关系。
ANSIC规定使用fopen函数来打开文件,fclose来关闭文件。(头文件为:stdio.h)
使用方式
FILE* fopen(const char* filename,//文件名称
const char* mode//文件的使用方式
)int fclose(FILE* stream);//文件指针
以下为文件的所有打开方式(注意当指定文件不存在时的情况):
举个小栗子:
#include <stdio.h>int main()
{FILE* pf;//test.txt为相对路径,表明这个文件就在程序内。pf = fopen("test.txt", "w");//如果文件指针pf不为真再进行操作if (pf != NULL){//文本行输出函数fputs,一会会讲。fputs("fopen example", pf);//关闭文件fclose(pf);//将文件指针置为空pf = NULL;}return 0;
}
文件的顺序读写
C语言程序只要运行起来,默认打开三个流(stream)
注:流的定义:文件中的流(stream)是指数据在输入和输出设备(例如硬盘、键盘、显示器等)与程序之间的传输通道。流可以被看作是一个字节序列的抽象,它将输入和输出抽象为一个连续的数据流,使得程序可以通过流来访问和处理文件的内容。
1.标准输入流 stdin FILE*:用于键盘接收输入数据。
2.标准输出流 stdout FILE*:用于向屏幕输出数据。
3.标准错误流 stderr FILE*:用于向屏幕输出错误信息。
重要函数的对比与使用
fgetc与fputc
1.函数原型:
int fgetc(FILE* stream);
功能:用于读取文件,
fgetc
用于从指定的文件流(stream
)中读取一个字符,并返回读取的字符的整数表示(ASCII码值)。如果到达文件末尾或出现读取错误,它会返回EOF
(End of File)。2.函数原型:
int fputc(int ch, FILE* stream);
功能:用于写入文件,
fputc
函数将指定的字符ch
写入到指定的文件流stream
中。如果成功写入,返回写入的字符;如果发生错误,返回EOF
(通常是 -1)。
fscanf与fprintf
fscanf
函数:
函数原型:
int fscanf(FILE *stream, const char *format, ...);
功能:
fscanf
从指定的文件流中读取数据,并根据指定的格式字符串进行解析。它类似于scanf
,但是它从文件中读取数据而不是从标准输入读取。fscanf
返回成功读取和解析的项目数,如果发生读取错误或到达文件末尾,它会返回EOF
。
2.
fprintf
函数:
函数原型:
int fprintf(FILE *stream, const char *format, ...);
功能:
fprintf
向指定的文件流中写入数据,根据指定的格式字符串格式化数据并写入文件。它类似于printf
,但是将输出数据写入文件而不是标准输出。fprintf
返回成功写入的字符数,如果发生写入错误,它会返回负值。
sscanf和sprintf
1.sscanf
函数:
函数原型:
int sscanf(const char *str, const char *format, ...);
功能:
sscanf
从指定的字符串str
中读取数据,并根据指定的格式字符串进行解析。它类似于scanf
,但是从字符串中读取数据而不是从标准输入读取。sscanf
返回成功读取和解析的项目数。
2.sprintf
函数:
函数原型:
int sprintf(char *str, const char *format, ...);
功能:
sprintf
根据指定的格式字符串format
将数据格式化输出到字符串str
中。它类似于printf
,但是将输出数据写入到字符串而不是标准输出。sprintf
返回成功写入的字符数。
举个栗子:
#include <stdio.h>int main()
{char str[] = "20 20";int num1, num2;sscanf(str, "%d %d", &num1, &num2);printf("the two numbers are %d and %d", num1, num2);return 0;
}
结果:
文件的随机读写
fseek函数:根据文件的起始位置和偏移量来定义文件指针.
int fseek(FILE* stream,//文件指针long int offset,//偏移量,是整数就正向偏移,是负数就负向偏移int origin//起始位置
//包括:SEEK_SET(文件起始位置),SEEK_CUR(文件指针当前位置),SEEK_END(文件结束位置)
)
举个例子:
#include <stdio.h>int main()
{FILE* pf;pf = fopen("test.txt", "wb");fputs("this is an apple", pf);fseek(pf, 9, SEEK_SET);fputs("sam", pf);fclose(pf);pf = NULL;return 0;
}
可见:在字符串偏移量为9的位置之后将字符串"sam"插入了进去。
pftell函数:计算文件指针相当于起始位置的偏移量。
long int ftell(FILE* stream)
举个例子:
#include <stdio.h>int main()
{FILE* pf;long size;pf = fopen("test.txt", "rb");if (pf == NULL){perror("Error opening file");}else{fseek(pf, 0, SEEK_END);size = ftell(pf);fclose(pf);pf = NULL;printf("size of myfile.txt:%ld bytes.\n", size);}return 0;
}
这里还是读的原来的字符串this is asampple ,所以算出的结果为16.
rewind函数:让文件指针回到文件的起始位置
void* rewind(FILE* stream).
#include <stdio.h>int main()
{int n;FILE* pf;//创建一个字符串char buffer[27];//为了读和写建立了一个新的文件myfile.txtpf = fopen("myfile.txt", "w+");//利用文件指针向文件依次写入A到Z26个字符for (n = 'A'; n <= 'Z'; n++){fputc(n, pf);}//让文件返回到起始位置rewind(pf);//又再次在文件开始位置读取26个字符并放入buffer中fread(buffer, 1, 26, pf);fclose(pf);pf = NULL;//第27个元素设为'\0',以便截断字符串buffer[26] = '\0';puts(buffer);return 0;
}
文件结束的判定
被错误使用的feof
牢记:在文件读取的过程中,不能用feof函数的返回值直接用来判断文件是否结束。
而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇见文件尾结束。
那么应该怎样判断文件是否结束呢?
1.文本文件是否结束,判断返回值是否为EOF(fgetc),或者NULL(fgets)
例如:fgetc判断是否为EOF。
fgets判断返回值是否为NULL。
2.二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:fread判断返回值是否小于要读的数。
正确的使用方法如下:
文本文件
#include <stdio.h>
#include <stdlib.h>int main()
{int c;//注意int ,不是char,要求处理EOF。FILE* fp = fopen("test.txt", "r");if (fp == NULL){perror("File opening filed!");return;}//fgetc当读取失败的时候或者遇见文件尾的时候,都会返回EOFwhile ((c = fgetc(fp)) != EOF){putchar(c);}//判断是什么原因结束的if (ferror(fp)){puts("\nI\O error when reading");}else if (feof(fp)){puts("\nEnd of file reached successfully");}fclose(fp);fp = NULL;return 0;
}
好了,文件指针就讲到这里,欢迎各位大佬指点!