目录
缓冲区
一个样例
现象解释
缓冲区存在的位置
缓冲区
在刚开始学习C语言的时候我们就听过缓冲区这个名词,很是晦涩难懂;在Linux下进程退出时也包含缓冲区,因此缓冲区到底是什么?有什么作用?
让我们先从一个小故事说起:
身在西藏上大学的张三有一个在海南的朋友李四,李四马上过生日了张三想要送李四一个键盘;于是张三定了各种交通工具的票,自己带着键盘千里迢迢的跑到海南张三的楼下送给张三,又千里迢迢的原路返回,这一来回耽误了张三好多的时间和精力。
又是一年,李四又过生日了;张三想送李四一个鼠标。打听到自己家和张三家楼下都有菜鸟驿站于是将鼠标交给菜鸟驿站,通过菜鸟驿站的快递小哥千里迢迢的将鼠标送到李四家楼下的菜鸟驿站。张三自己不用跑这一个来回。但是菜鸟驿站不可能因为张三一个鼠标进行派送,先暂存一部分快递要等到快递车装满进行派送,或者一行存储柜子满了在派送。但是也有可能特殊情况顾客“加钱”,想要直接派送。
上面这个故事中的菜鸟驿站就是我们口中的缓冲区。
缓冲区的作用:提高使用者的效率
因此缓冲区是内存空间的一部分。也就是说,在内存空间中预留了一定的存储空间,这些存储空间用来缓冲输入或输出的数据,这部分预留的空间就叫做缓冲区。
暂存快递等到快递车装满派送:全缓冲(缓冲区满了刷新)
“加钱”直接派送:无缓冲(立即刷新)
暂存一行存储柜派送:行缓冲(一行满了刷新)
这是一般的刷新策略,特殊情况:
- 强制刷新
- 进程推出的时候,一般要进行刷新缓冲区
一般对于显示器文件:行刷新(行缓冲),对于磁盘上的文件:全缓冲
一个样例
1 #include<stdio.h>2 #include<string.h>3 #include<unistd.h> 4 int main()5 {6 fprintf(stdout,"hello fprintf\n");7 printf("hello print\n");8 fputs("hello fputs\n",stdout);9 10 //系统调用11 const char * str = "system call : hello write\n";12 write(1,str,strlen(str));13 return 0;14 }
1 #include<stdio.h>2 #include<string.h>3 #include<unistd.h>4 int main()5 {6 fprintf(stdout,"hello fprintf\n");7 printf("hello print\n");8 fputs("hello fputs\n",stdout);9 10 //系统调用11 const char * str = "system call : hello write\n";12 write(1,str,strlen(str));13 fork(); 14 return 0;15 }
上面第一种情况在最后没有创建子进程直接执行和重定向到某个文件中也没有什么问题,就是在重定向时系统调用接口先执行;
第二种情况是在程序运行最后使用fork函数创建子进程直接执行程序时没有问题,但是在重定向时除了系统调用,剩下的语句被执行了两次。
现象解释
- 当我们直接向显示器进行打印的时候,显示器文件的刷新方式是行刷新。而代码输出的所有字符串,都有”\n",fork之前数据已经全部刷新包括system call。
- 重定向到log.txt,本质是向磁盘文件中写入,我们系统对于数据的刷新方式已经由行刷新变成了全缓冲。
- 全缓冲意味着缓冲区变大,实际写入的简单数据不足以把缓冲区写满,fork执行的时候数据依旧在缓冲区中。
- 当前阶段的缓冲区是用户缓冲区是C语言和操作系统没有任何关系。
- C/C++提供的缓冲区,里面保存的是用户的数据,是属于当前进程;如果把这个数据交给操作系统,这个数据就数据操作系统。
- 当进程推出的时候,一般要进行刷新缓冲区,即使这个数据没有满足刷新条件;刷新缓冲区属于对文件的写入操作;fork立马退出,任意一个进程在推出的时候都会刷新缓冲区,就要发生写时拷贝。
- 系统调用没有使用C语言的缓冲区,直接写入到操作系统,不属于进城了不发生写时拷贝。
- 从C语言的缓冲区写入到操作系统中这个过程就是刷新
缓冲区存在的位置
我们在使用C语言的一些文件操作接口时会发现很多函数的的返回值或者函数参数的类型为FILE*,之前的文章中我们提到过Linux下的文件描述符也是在FILE中的;不难猜测出C语言中的缓冲区存在在FILE中。当我们查看C语言的源码可以证实这一点:
我们来看看FILE的部分结构
typedef struct _IO_FILE FILE; 在/usr/include/stdio.h
在/usr/include/libio.h
struct _IO_FILE {
int _flags; /* High-order word is _IO_MAGIC; rest is flags. */
#define _IO_file_flags _flags
//缓冲区相关
/* The following pointers correspond to the C++ streambuf protocol. */
/* Note: Tk uses the _IO_read_ptr and _IO_read_end fields directly. */
char* _IO_read_ptr; /* Current read pointer */
char* _IO_read_end; /* End of get area. */
char* _IO_read_base; /* Start of putback+get area. */
char* _IO_write_base; /* Start of put area. */
char* _IO_write_ptr; /* Current put pointer. */
char* _IO_write_end; /* End of put area. */
char* _IO_buf_base; /* Start of reserve area. */
char* _IO_buf_end; /* End of reserve area. */
/* The following fields are used to support backing up and undo. */
char *_IO_save_base; /* Pointer to start of non-current get area. */
char *_IO_backup_base; /* Pointer to first valid character of backup area */
char *_IO_save_end; /* Pointer to end of non-current get area. */
struct _IO_marker *_markers;
struct _IO_FILE *_chain;
int _fileno; //封装的文件描述符
#if 0
int _blksize;
#else
int _flags2;
#endif
_IO_off_t _old_offset; /* This used to be _offset but it's too small. */
#define __HAVE_COLUMN /* temporary */
/* 1+column number of pbase(); 0 is unknown. */
unsigned short _cur_column;
signed char _vtable_offset;
char _shortbuf[1];
/* char* _save_gptr; char* _save_egptr; */
_IO_lock_t *_lock;
#ifdef _IO_USE_OLD_IO_FILE
};
今天对Linux下缓冲区的分享到这就结束了,希望大家读完后有很大的收获,也可以在评论区点评文章中的内容和分享自己的看法;个人主页还有很多精彩的内容。您三连的支持就是我前进的动力,感谢大家的支持!!!