【Linux】:重定向和缓冲区

朋友们、伙计们,我们又见面了,本期来给大家带来关于重定向和缓冲区的相关知识点,如果看完之后对你有一定的启发,那么请留下你的三连,祝大家心想事成!

C 语 言 专 栏:C语言:从入门到精通

数据结构专栏:数据结构

个  人  主  页 :stackY、

C + + 专 栏   :C++

Linux 专 栏  :Linux

目录

1. 重定向

1.1 输出重定向 

1.2 追加重定向

1.3 输入重定向

1.4 重定向系统调用接口

2. 标准错误stderr

3. 缓冲区

3.1 缓冲区存在的价值

3.2 缓冲区的刷新方式

3.3 分析样例 

3.4 用户缓冲区和内核缓冲区

3.5 何为刷新

3.6 FILE结构体


1. 重定向

重定向这个概念在前面Linux常见指令章节就介绍过它的指令以及用法,那么本节来一起深入了解一下重定向:

1.1 输出重定向 

echo 字符串 > 文件 :将本来输出在显示器文件(标准输出)上的字符串输出至指定的文件。

标准输出对应的文件fd是1。

下面用代码来实现一下重定向的功能:
 

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <string.h>#define FILE_NAME "log.txt"int main()
{// 关闭标准输出close(1);int fd = open(FILE_NAME, O_WRONLY | O_CREAT | O_TRUNC, 0666);printf("fd: %d\n", fd);fprintf(stdout, "stdout->fd: %d\n", stdout->_fileno);// 刷新fflush(stdout);close(fd);
}

先看结果,再分析代码:

我们都知道文件fd的分配规则,是寻找最小的未被使用的fd进行分配,所以我们先把1号文件描述符关闭,然后再打开文件时,1号文件描述符就被新打开的文件分配走了,这些C语言打印函数,默认是往1号文件描述符对应的文件中打印,简单的说就是它们只认识1这个数字,并不会在乎这个文件到底是不是显示器文件,所以才会把数据打印到新打开的文件中。

至于这里为什么要加这个fflush用来刷新缓冲区在后续会详细介绍。

1.2 追加重定向

追加重定向直接把打开文件时的方式从清空改为追加即可:

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <string.h>#define FILE_NAME "log.txt"int main()
{// 关闭标准输出close(1);//int fd = open(FILE_NAME, O_WRONLY | O_CREAT | O_TRUNC, 0666);int fd = open(FILE_NAME, O_WRONLY | O_CREAT | O_APPEND, 0666);printf("fd: %d\n", fd);fprintf(stdout, "stdout->fd: %d\n", stdout->_fileno);// 刷新fflush(stdout);close(fd);
}


1.3 输入重定向

cat指令默认是从标准输入键盘文件中读取数据;

cat < 文件:本来从键盘读取数据,但是重定向为从指定的文件读取数据。

标准输入对应的文件fd是0。

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <string.h>#define FILE_NAME "log.txt"int main()
{// 关闭标准输入close(0);int fd = open(FILE_NAME, O_RDONLY);char buffer[1024];fread(buffer, 1, sizeof(buffer), stdin);printf("%s\n", buffer);close(fd);
}

当我们把标准输入文件fd关闭后,根据文件fd的分配规则,新创建的文件就被分配到了0号文件fd,C语言的这些读取接口只认识0号文件fd,只认识0这个数组,所以就直接从0号fd对应的文件中直接读取。

重定向之后上层的fd不变,但是底层fd的指向在变化,所以重定向的本质是修改特定文件fd的下标内容。 

1.4 重定向系统调用接口

#include <unistd.h>
int dup2(int oldfd, int newfd);

代码演示:

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>#define FILE_NAME "log.txt"int main()
{int fd = open(FILE_NAME, O_RDONLY);// 重定向dup2(fd, 0);char buffer[1024];fread(buffer, 1, sizeof(buffer), stdin);printf("%s\n", buffer);close(fd);
}

dpu2接口其实是文件描述符级别的数组内容的拷贝!

注意:

程序替换是不影响曾经的重定向;

程序替换没有创建新的进程,它更改的是物理到虚拟的转化以及对应的页表,并不会影响进程PCB,所以程序替换不会影响重定向。 

2. 标准错误stderr

打印结果分为错误打印和正确打印,正确打印对应的是stdin,错误打印对应的是stderr,它们两者都是打印在显示器上的。

有了stderr之后,就可以将正确打印和错误打印的数据分别存储在两个不同的文件,最主要的是为了查错,当程序出错时,直接去存储错误结果文件查找错误原因。

我们在命令行使用的重定向都是简写,完整的写法是:

./exe 1 > log.txt  // 输出重定向至log.txt
./exe 1 > log.txt 2 > &1 // 将标准输出和标准错误都重定向至log.txt
./exe 1 > log.txt 2 > log.txt.error // 标准输出重定向至log.txt,标准错误重定向至log.txt.error

3. 缓冲区

在前面的文件fd章节提到过,读写数据的本质是将内核缓冲区中的数据来回拷贝。

那么我们所理解的缓冲区其实就是一块由操作系统提供的内存空间。

3.1 缓冲区存在的价值

举一个现实中的例子来理解缓冲区:

小明居住在西安,他的好朋友居住在苏州,小华和小明每年都要过生日,双方都会在彼此过生日的时候挑选好生日礼物,小明等到小华过生日的前两个月,直接骑着骑行车从西安历经两个月到了苏州,刚好把他给小华准备的生日礼物送到,小华在小明过生日的时候也一样,都是骑两个月自行车去送礼物,就这样持续了好几年,某一天小明和小华家楼下都开了一家快递公司,每小华过生日的小明直接把礼物交给快递公司,让快递公司托运给小华,当小明把礼物给快递公司时,站在小明的视角礼物已经送走了,但是站在小华的视角,礼物当前还没收到,需要时间,但这个时间肯定比小明骑着自行车送过来要更快。

在这个例子中,这个快递公司扮演的角色就类似于缓冲区,正是有了快递公司的存在,大大提升了小明送礼物的效率。

所以缓冲区的存在可以提高使用者的效率,正是因为有了缓冲区的存在,我们可以积累一部分数据再统一发送,减小了发送成本,提升了发送效率。 

3.2 缓冲区的刷新方式

因为缓冲区可以暂存数据,所以它必须要有对应的刷新策略;
一般策略:

  • 1. 无缓冲(有数据立即刷新)
  • 2. 行缓冲(按行为单位进行刷新)
  • 3. 全缓冲(等到数据写满缓冲区再刷新)

特殊策略:

  • 1. 强制刷新
  • 2. 进程退出的时候,一般要进行刷新缓冲区

对于显示器文件,一般使用的是行刷新策略;

对于磁盘文件,一般使用的是全缓冲策略。

3.3 分析样例 

下面以缓冲区这个概念为基础,分析一下下面这段代码:

#include <stdio.h>
#include <string.h>
#include <unistd.h>int main()
{fprintf(stdout, "C: hello fprintf\n");printf("C: hello printf\n");fputs("C: hello fputs\n", stdout);const char *str = "system call: hello write\n";write(1, str, strlen(str));fork(); // 注意fork的位置!return 0;
}

命令行运行结果:

当我们直接运行是,和预期一致,都是打印在显示器上的,没有任何问题,但是一旦我们重定向至文件,此时就很奇怪了,接下来我们一步一步分析: 

  • 1. 当我们直接向显示器打印,显示器文件的刷新方式是行刷新,我们打印的字符串都有'\n',在fork创建子进程之前,数据已经被刷新完毕,所以三条C接口消息和一条系统调用接口消息。
  • 2.  当我们将内容重定向至文件log.txt,本质就是向磁盘文件进行写入,我们的系统对于数据的刷新策略从行缓冲变成了全缓冲!
  • 3. 全缓冲的策略意味着缓冲区变大,我们写入的简单数据不足以把缓冲区写满,所以在fork执行的时候,数据依旧停留在缓冲区中。
  • 4. 当进程退出的时候,一般要刷新缓冲区,即使数据没有满足刷新条件!
  • 5. 观察文件中的写入结果发现C接口写入的数据是双倍的,但是系统调用接口写入的数据只有一个,所以这里的缓冲区和和操作系统没有关系,只和C语言本身有关!
  • 6. C/C++提供给我们的缓冲区,里面一定保存的是用户的数据,属于当前进程在运行时自己的数据,但是,当我们把数据交给了OS,此时该数据就属于OS,不属于用户了。
  • 7. 刷新缓冲区的这个操作就是把进程的数据写入到操作系统,刷新的操作属于清空、写入,所以,在fork之后,OS检测到了父子进程任意一方要对数据进行写入、清空,此时就发生了写时拷贝,父子进程各有一份数据,所以才会C语言调用的接口写入数据时才会写入两次。
  • 8. 系统调用接口是直接写入到操作系统,不属于进程数据,所以不发生写时拷贝,只会有一份数据。

3.4 用户缓冲区和内核缓冲区

用户缓冲区就是我们使用的C/C++提供的语言级别的缓冲区。

内核缓冲区是由OS提供的一块内存空间。

3.5 何为刷新

我们使用C语言的接口写入数据时首先是要把数据写入到C语言提供的缓冲区的,那么C语言的缓冲区就有对应的刷新策略(行缓冲、全缓冲等),当数据满足刷新策略时,就会将数据写入到内核缓冲区,所以从用户缓冲区写入到内核缓冲区的这个工作就叫做刷新。

内核缓冲区刷新也有它对应的刷新策略。

C/C++语言提供的缓冲区也是为了提高函数调用(printf、fprintf等)的效率。 

3.6 FILE结构体

前面说过FILE结构体中包含了文件描述符,现在来看它里面也必定也包含了C缓冲区

在Linux在命令行输入:vim /usr/include/libio.h +246 就可以查看对应的FILE结构体对象了。

朋友们、伙计们,美好的时光总是短暂的,我们本期的的分享就到此结束,欲知后事如何,请听下回分解~,最后看完别忘了留下你们弥足珍贵的三连喔,感谢大家的支持!    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/871610.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Paddle 打包部署

PaddleOCR 打包部署exe 心酸历程 PaddleOCR部署exe模式PaddleOCR安装到本地(稍后有时间再写)PaddleOCR打包过程异常问题记录&#xff01;&#xff01;&#xff01;&#xff01;No such file or directory: D:\\py_project\\paddleOCR\\dist\\paddleOCR\\_internal\\paddleocr\\…

Excel自动化工具-工作簿中sheet页合并-可自行选择需要处理的工作簿

宝子们可以选择直接下载文章顶部资源包【Excel自动化工具-工作簿中sheet页合并.xlsm】&#xff08;或者在博主的资源里下载&#xff09;&#xff0c;该资源功能为&#xff1a;合并sheet页 或者也可以自己编写宏代码&#xff0c;文章最后有附上源代码 没有office excel 的宝子…

linux之find指令基础

目录 前言一、find .二、find xxx -name "*.c"三、组合查找文件名四、find . -type f五、find . -maxdepth 2 -type f六、find . -type f -perm 777七、find . -type f -name "*.txt" ! -perm 777八、借助-exec命令参考链接 前言 testfind下 check1.c ch…

《乡土中国》重新审视自己的故乡,再出发

《乡土中国》重新审视自己的故乡&#xff0c;再出发 费孝通(1910—2005)&#xff0c;中国社会学家、人类学家。被誉为中国社会学和人类学的奠基人之一。江苏吴江人。1980年获国际应用人类学会马林诺斯基荣誉奖。1981年获英国皇家人类学会赫胥黎奖章。代表作有《乡土中国》《江村…

【周末闲谈】Stable Diffusion会魔法的绘画师

个人主页&#xff1a;【&#x1f60a;个人主页】 系列专栏&#xff1a;【❤️Python】 文章目录 前言Stable Diffusion介绍 使用ComfyUI 和 WebUIComfyUIWebUI 配置需求 Stable Diffusion资源分享吐司AiAUTOMATIC1111Civitai绘世整合包Nenly同学stability.ai 前言 在很早之前&…

【数学建模】2005建模A题:长江水质综合评价与预测

数据的无量纲化处理 数据的无量纲化处理是一种统计学中的预处理技术&#xff0c;主要用于消除数据中的量纲影响&#xff0c;使得不同单位或量级的指标可以相互比较和结合。无量纲化通过调整数据的范围或尺度&#xff0c;使得数据集中的每个特征或变量处于相似的数值区间内。以…

【React】Google 账号之个性化一键登录按钮功能

“使用 Google 帐号登录”功能可快速管理网站上的用户身份验证。用户登录 Google 账号、表示同意&#xff0c;并安全地与平台共享其个人基础资料信息。 官方文档&#xff1a;链接 一、获取 Google API 客户端 ID 打开 Google API 控制台 中的凭据页面 创建或选择 Google API 项…

网络分层及通信过程

网络分层体系 主流的理论体系中主要包含三种网络分层模型&#xff0c;即ISO的七层网络模型、TCP/IP的四层网络模型以及结合两种模型优点的五层网络模型&#xff0c;关于网络模型&#xff0c;主要起到对网络体系的一个整体认识&#xff0c;作为网络知识学习的开始&#xff0c;这…

【并发编程】进程 线程 协程

进程&#xff08;Process&#xff09;、线程&#xff08;Thread&#xff09;和协程&#xff08;Coroutine&#xff09;构成了计算机科学中实现任务并发执行的三种核心抽象机制。通常&#xff0c;为了提高程序的执行效率&#xff0c;开发者会根据应用场景和性能需求&#xff0c;…

Linux对文件访问的基本权限

文件权限控制对文件的访问。 有三种权限类别可应用&#xff1a;读取、写入和执行。 权限对文件和目录的影响&#xff1a; 权限 对文件的影响 对目录的影响 r读取 可以读取文件的内容 可以列出目录的内容 w写入 可以更改文件的内容 可以创建或删除目录中任一文件 x执行…

对照ui图进行大屏幕适配,echerts适配

1.先找到ui图&#xff0c;我这边是1920*1080的屏幕进行的设计 2.在界面找到跟样式的字体大小&#xff0c;进行设置&#xff0c;一般ui设置字体大小便可 3.在js中写入原生js代码 function adapter() {//获取布局视口宽度&#xff0c;布局视口设备横向独立像素值const dpWidth…

【算法专题】快速排序

1. 颜色分类 75. 颜色分类 - 力扣&#xff08;LeetCode&#xff09; 依据题意&#xff0c;我们需要把只包含0、1、2的数组划分为三个部分&#xff0c;事实上&#xff0c;在我们前面学习过的【算法专题】双指针算法-CSDN博客中&#xff0c;有一道题叫做移动零&#xff0c;题目要…

JAVA NIO组件之Buffer详解

❃博主首页 &#xff1a; 「码到三十五」 &#xff0c;同名公众号 :「码到三十五」&#xff0c;wx号 : 「liwu0213」 ☠博主专栏 &#xff1a; <mysql高手> <elasticsearch高手> <源码解读> <java核心> <面试攻关> ♝博主的话 &#xff1a…

Highlight.js示例

图例 代码在图片后面 点赞❤️关注&#x1f64f;收藏⭐️ 源代码 <!DOCTYPE html> <html lang"en"> <head> <meta charset"UTF-8"> <meta name"viewport" content"widthdevice-width, initial-scale1.0"…

7.14实训

当我开始学习各种杀毒软件时&#xff0c;我逐渐意识到信息安全在现代社会中的重要性和复杂性。杀毒软件不仅仅是简单的安装和运行&#xff0c;它涉及到广泛的知识领域&#xff0c;包括计算机网络、恶意软件分析、加密技术等等。在这个过程中&#xff0c;我收获了许多宝贵的经验…

代码随想录算法训练营第30天|LeetCode 452. 用最少数量的箭引爆气球、435. 无重叠区间、763.划分字母区间

1. LeetCode 452. 用最少数量的箭引爆气球 题目链接&#xff1a;https://leetcode.cn/problems/minimum-number-of-arrows-to-burst-balloons/description/ 文章链接&#xff1a;https://programmercarl.com/0452.用最少数量的箭引爆气球.html 视频链接&#xff1a;https://www…

Java 线程池详解

序言 在高并发编程中&#xff0c;线程池是一个非常重要的组件。它不仅能够有效地管理和复用线程资源&#xff0c;还可以提升应用程序的性能和稳定性。本文将详细介绍Java中的线程池机制&#xff0c;以及如何正确地使用线程池。 一、什么是线程池 线程池是一组已经初始化并等…

索引结构与检索原理

一、mysql索引结构 1.BTree索引 [检索原理] 左边列的表格&#xff08;真实数据&#xff09;&#xff0c;右边对应一棵树&#xff0c;树的管度越来越管查询越快。 以下图表的名称为&#xff1a;段区块 硬盘都是长方形的&#xff0c;打了一个封装&#xff0c;里面是一个圆圈…

二分查找和斐波那契查找

这里写自定义目录标题 二分查找斐波那契查找二分查找改进B二分查找改进C 二分查找 int binSearch(int* arr, int lo, int hi,int target) {while (lo < hi){int mid lo ((hi - lo) >> 1);if (arr[mid] > target) hi mid;else if (arr[mid] < target) lo mi…

springBoot 核心原理

自动配置 包扫描规则&#xff1a; 默认的扫描规则 SpringBootApplication 标注的类就是主程序类 &#xff0c;springBoot也只会扫描主程序类所在的包以及下面的子包也可以自定义声明扫描其他包 使用 SpringBootApplication(scanBasePackages “com.test”)使用 ComponentSca…