用Linux的视角来理解缓冲区概念

缓冲区的认识

缓冲区(buffer)是存储数据的临时存储区域。当我们用C语言向文件中写入数据时,数据并不会直接的写到文件中,中途还经过了缓冲区,而我们需要对缓冲区的数据进行刷新,那么数据才算写到文件当中。而缓冲区通常是一块内存区域,可以是数组、队列、链表等数据结构。

代码举例

int main()
{//C接口FILE* fp=fopen("log.txt","w");//创建文件const char* buffer = "hello buffer\n"; fwrite(buffer,strlen(buffer),1,fp);//文件写入//系统接口close(fp->_fileno);return 0;
}

此时的数据其实就是写进了缓冲区中,但是我们此时的调用接口是不一样的,关闭文件调用的是系统调用接口,而且FILE结构体中是封装了文件描述符的。先认识后续会讲述原因。


其实我们是可以将我们缓冲区中的数据给刷新出来:

int main()
{FILE* fp=fopen("log.txt","w");const char* buffer = "hello buffer\n"; fwrite(buffer,strlen(buffer),1,fp);fflush(fp);//刷新缓冲区close(fp->_fileno);return 0;
}

 

 为什么要有缓冲区的存在

其实缓冲区的存在就是为了减少对数据的访问次数,当我们输入输出数据的时候,其实就是对文件信息进行交互的(一切皆文件)。我们为了避免每一次的文件访问IO操作,从而会降低效率,所以说可以建立一个像缓冲区这样的中转站,将数据与缓冲区交互,然后将所有的数据都接收处理好了以后再交给文件。

缓冲区的刷新方式

  1. 立即刷新(无缓冲)
  2. 行刷新(行缓冲)
  3. 缓冲区满了刷新(全缓冲)
  4. 强制刷新

一般对于显示器文件的刷新方式是行刷新(\n也是进行行刷新),而一般磁盘上的文件的刷新方式就是缓冲区满了再刷新。 我们也可以通过fflush函数强制的进行刷新缓冲区。


此时就可以浅浅的解释我们开始写的代码的,因为我们的一般文件的刷新策略是缓冲区满了才刷新的,这正是因为我们向log.txt这个文件里写的数据没有写满缓冲区,所以导致缓冲区没有刷新,从而该文件中并没有数据。其实如果你多写一些数据进去的话其实是可以写满的。

 

缓冲区与操作系统无关

 结论我们写代码时的缓冲区其实是属于C语言的,与操作系统并无关系。


int main()
{FILE* fp=fopen("log.txt","w");const char* buffer = "helllo buffer\n"; fwrite(buffer,strlen(buffer),1,fp);fclose(fp);//C语言接口return 0;
}

 该段代码的区别就是用了C语言接口关闭文件。而我们开头的那段代码是系统调用关闭文件。仅仅换了一种关闭方式就导致了文件中一个有数据一个没数据。所以说可以知道,C语言中的fclose其实是封装了系统调用的close,但是还多了一个步骤:刷新缓冲区。

也可以说明系统调用接口其实是没有缓冲区这个概念的,缓冲区其实是我们C语言库中后期封装好的。

 

 经典样例

代码一:

int main()
{printf("C:printf\n");fprintf(stdout,"C:fprintf\n");fputs("C:fputs\n",stdout);const char* arr = "system:write\n";write(1,arr,strlen(arr));return 0;
}


代码二:

int main()
{printf("C:printf\n");fprintf(stdout,"C:fprintf\n");fputs("C:fputs\n",stdout);const char* arr = "system:write\n";write(1,arr,strlen(arr));fork();//创建子进程return 0;
}


就上面的两段代码唯一的区别就是在程序结束之前是否创建了子进程。

现象就是:代码一没有创建子进程,而且就如我们意想的结果一样正常打印数据到log.txt文件当中,而代码二在打印结束的时候创建了子进程,最终log.txt文件中的数据打印了两份,除了系统调用write函数之外。

其实在我们./test.exe > log.txt 将本应该打印到显示器文件的数据重定向到log.txt文件当中时,就改变了缓冲区的刷新策略,从原先的行数新变成了缓冲区满了再刷新。所以在执行fork函数创建子进程之前的所有数据依旧还是存在缓冲区当中,而创建子进程后,父子进程代码共享,数据采用写时拷贝的方式存在着。当假设父进程先结束退出以后,此时父进程的缓冲区就会被强制刷新(也就是相当于清空缓冲区数据),而此时的子进程必然是会发生写时拷贝,数据独有一份,所以最终子进程退出时缓冲区的数据也会被强制刷新,所以最终数据就有两份了。

而针对于系统调用write函数并不是将数据写进缓冲区当中,而是直接写到操作系统中,因此以上操作就与该函数无关。

 

缓冲区在哪里  

我们知道缓冲区与操作系统无关,所以缓冲区在哪里呢,其实就在FILE的结构体中。

就那我们比较熟悉的函数fflush,该函数的作用是刷新缓冲区,而参数就是FILE*的文件指针,所以此时其实就可以看出端倪了。

FILE其实是一个结构体,我们前面知道FILE结构体当中封装了文件描述符,其实也有缓冲区,其实就是一些指针。

         

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/613875.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java获取IP地址及对应的归属地

目录 前言 一、获取访问的IP地址 二、通过IP地址获取对应的归属地 2.1 Ip2region 2.1.1 高达 99.9 % 的查询准确率 2.1.2 Ip2region V2.0 特性 2.1.3 多语言以及查询客户端的支持 2.2 Ip2region xdb Java 查询客户端实现 2.2.1 引入 Maven 仓库 2.2.2 ip2region.xdb …

【.NET Core】可为null类型详解

【.NET Core】可为null类型详解 文章目录 【.NET Core】可为null类型详解一、概述二、可为空的值类型2.1 声明和赋值2.2 检查可为空值类型2.3 基础类型与可为空的值类型互换2.4 可为空的值类型装箱和取消装箱2.5 如何确定可为空的值类型 三、可为 null 的引用类型 一、概述 nu…

用通俗易懂的方式讲解:在 Langchain 中建立一个多模态的 RAG 管道

写在前面 语言模型的出现彻底改变了我们从文件中提取信息的方式。然而,我们知道图片,通常是图表和表格,经常包含关键信息,但基于文本的语言模型无法处理媒体文件。 例如,我们以前只能使用 PDF 文件中的文本来查找答案…

C#编程-实现线程声明周期

实现线程声明周期 当System.Threading.Thread类的对象被创建的时候,线程的生命周期开始。线程的生命周期在完成任务时结束。在线程的生命周期中有各种状态。这些状态是: 未启动状态可运行状态不可运行状态死亡状态下图显示了线程的各种状态和引起线程从一个状态变为另一个状…

欢乐的周末 - 华为OD统一考试

OD统一考试 题解: Java / Python / C++ 题目描述 小华和小为是很要好的朋友,他们约定周末一起吃饭。 通过手机交流,他们在地图上选择了多个聚餐地点(由于自然地形等原因,部分聚餐地点不可达)。求小华和小为都能到达的聚餐地点有多少个? 输入描述 第一行输入m和n,m代表…

C练习——递归求第n个人年龄

题目: 有n个人坐在一起,第n个人比第n-1个人大2岁,第n-1个人比第n-2个人大2岁,以此类推,……,第1个人是10岁。请问第n个人年龄多大? 解析: 简单循环也能求解 但按题意要求递归求解…

Spark SQL进阶

DataFrame详解 清洗相关API 去重API 删除空缺值的API 替换缺失值的API from pyspark import SparkConf, SparkContext import os from pyspark.sql import SparkSession# 绑定指定的Python解释器 os.environ[SPARK_HOME] /export/server/spark os.environ[PYSPARK_PYTHON]…

渗透线应用-取料呼叫FC(SCL源代码)

渗透线应用相关文章可以参考下面文章链接: https://rxxw-control.blog.csdn.net/article/details/135526725https://rxxw-control.blog.csdn.net/article/details/135526725渗透线小车控制 https://rxxw-control.blog.csdn.net/article/details/133611151

【算法】基础算法001之双指针

👀樊梓慕:个人主页 🎥个人专栏:《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》《C》《Linux》《算法》 🌝每一个不曾起舞的日子,都是对生命的辜负 目录 前言 1.数组分块&#xf…

【JaveWeb教程】(20) MySQL数据库开发之 基本查询、条件查询、聚合函数、分组查询、排序查询、分页查询 详细代码示例讲解

目录 1. 数据库操作-DQL1.1 介绍1.2 语法1.3 基本查询1.4 条件查询1.5 聚合函数1.6 分组查询1.7 排序查询1.8 分页查询1.9 案例1.9.1 案例一1.9.2 案例二 在上次学习的内容中,我们讲解了: 使用DDL语句来操作数据库以及表结构(数据库设计&…

C++学习笔记(三十二):c++ 堆内存与栈内存比较

本节对堆和栈内存进行描述。 应用程序启动后,操作系统将整个程序加载到内存,分配相应的物理ram,确保程序可以正常运行。堆和栈是ram中存在的两个区域。栈通常是一个预定义大小的内存区域,一般是2M字节左右。堆也是预定了默认值的…

12、JVM高频面试题

1、JVM的主要组成部分有哪些 JVM主要分为下面几部分 类加载器:负责将字节码文件加载到内存中 运行时数据区:用于保存java程序运行过程中需要用到的数据和相关信息 执行引擎:字节码文件并不能直接交给底层操作系统去执行,因此需要…

NumPy 数据操作实用指南:从基础到高效(下)

文章接上篇: In [53]: from PIL import Image In [60]: dog Image.open(./dog.jpg) dog . . . In [61]: dog_datanp.array(dog) # 图片数据是ndarray # 彩色照片三维:高度,宽度,像素(表示不同颜色)&…

C语言操作符与表达式详解

目录 操作符的分类: (1)算数操作符 (2)移位操作符 (3)位操作符 (4)赋值操作符 (5)单目操作符 (6)关系操作符 &…

CSS 选择器全攻略:从入门到精通(下)

🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云…

pytorch11:模型加载与保存、finetune迁移训练

目录 一、模型加载与保存1.1 序列化与反序列化概念1.2 pytorch中的序列化与反序列化1.3 模型保存的两种方法1.4 模型加载两种方法 二、断点训练2.1 断点保存代码2.2 断点恢复代码 三、finetune3.1 迁移学习3.2 模型的迁移学习3.2 模型微调步骤3.2.1 模型微调步骤3.2.2 模型微调…

Asp .Net Core 系列: 集成 CORS跨域配置

文章目录 什么是CORS?Asp .Net Core 种如何配置CORS?CorsPolicyBuilder类详解注册以及使用策略三种方式EnableCors 和 DisableCors 特性关于带证书与不带证书代码的实现跨源(cross-origin)不带请求证书(Credentials)跨源(cross-origin&…

c++析构函数

析构函数的简述 1. 析构函数和构造函数类似,是c规定当对象的生命周期结束时,默认你会调用析构函数。 2. 同理,当我们不写析构函数的时候,编译器会自动生成一个空实现的析构函数。 3. 析构函数只能编译器自己调用,我们…

CSS 选择器全攻略:从入门到精通(上)

🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云…

JavaScript从入门到精通系列第三十一篇:详解JavaScript中的字符串和正则表达式相关的方法

文章目录 知识回顾 1:概念回顾 2:正则表达式字面量 一:字符串中正则表达式方法 1:split 2:search 3:match 4:replace 知识回顾 1:概念回顾 正则表达式用于定义一些字符串的…