Linux网络 | 理解TCP面向字节流、打通socket与文件的关系

        前言:我们经常说TCP是面向字节流的, TCP是面向字节流的。 但是, 到底是什么事面向字节流呢? 另外, 我们知道sockfd其实就是文件fd。 但是,为什么sockfd是文件fd呢? 这些问题都在本节内容中的到回答, 同时外加一些小知识点。现在废话不多说, 开始我们的学习吧!

        ps:本节内容建议即便不熟悉TCP报文报头也可以学习哦!

目录

面向字节流

什么是面向字节流 

面向字节流的问题

TCP连接异常问题

进程终止 

机器重启 

机器掉电,网络断开 

打通socket与文件fd


面向字节流

什么是面向字节流 

        由于缓冲区的存在,当我们写100个字节的时候可以一次发送100个字节,也可以发送100次一个字节。我们还可以一次接收100个字节或者接收100次一个字节。

        换句话说就是由于缓冲区的存在,TCP程序的读和写不需要一一匹配。

        而面向数据报就是类似于我们的发邮件,发快递,就是我们发送端发送了几次报文,接收方就得接收几次报文。并且发多少接受多少。 

 

        就比如上层有四个请求,一个请求40个字节。当应用层将数据发送到内核缓冲区的时候内核
缓冲区不关心有几个报文, 它只关心一共多少个字节。就比如现在是160个字节。然后TCP发送
的时候要做的,就是把这160个字节安全稳定的发送到对面!对方的内核缓冲区也只关心一共有
多少个字节的数据要接收!至于报文有多少,报头和有效载荷分离那是上层用户要关心的,下层不关心。

        这其中,TCP传输层只关心字节的流动,所以叫做面向字节流。 

面向字节流的问题

        用户层才有报文的概念,我们发送方是发送多个请求, 接收方就是对报文一个一个的处理
将字节流变成一个一个的请求。这个时候就有数据报粘包问题。

        什么是数据粘包问题——当上层进行读取时,如果不对报文进行一个一个的分离,就可能会多处理或者少处理请求,这种情况, 叫做数据报粘包问题。 

        这个数据报粘包问题, 是相对于用户层的概念。解决粘报: 定协议。
        这个定协议其实就是我们在写tcp协议序列化反序列化的时候那个encode和decode。encode和decode的目的就是为了解决粘报问题。

        所以, 我们以后如何解决数据报的粘报问题?——核心思想就是明确报文和报文之间的边界。

  •         1、定长报文
  •         2、使用特殊字符。就比如今天的报文没有换行符。 所以为了区分报文与报文,我们就可以使用 n来进行区分
  •         3、使用自描述字段 + 定长报头
  •         4、使用自描述字段 + 特殊字符

        所以,面向字节流衍生出了数据报粘报问题,为了解决这个问题,就要使用特定的方案。

TCP连接异常问题

进程终止 

        我们的客户端假设此时和服务端三次握手建立了链接,但是此时客户端突然终止了。那么链接要怎么样?这里我们就要知道,链接和进程 (客户端服务器)之间本身没什么关系,链接和文件是直接相关的。但是我们曾经讲过文件生命周期是随进程的。 所以链接本质是随进程的。
        所以, 结论就是: 对于一个进程来说,它是正常退出还是异常退出, 对于操作系统来说都是退出。那么进程终止, 链接就要断开。就要进行四次挥手。 即: 链接正常自动断开。 

机器重启 

        当我们进行关机的时候,是不是所有的进程都要先关闭? windows有的时候就会问我们是否关闭这些进程,所以,关机的时候,就要先杀掉所有的进程。对于tc来说, 本质也是要断开连接。

机器掉电,网络断开 

        客户端一旦将网线拔掉,客户端时没有机会向服务器中进行四次挥手。因为报文发不出去了。所以服务器不知道客户端已经挂了,他的链接是正常维护的。当客户端再重新联网, 就要重新进行连接,这也是认知不一致问题。

        当服务端发现客户端长时间不发消息,也不回。那么服务端也不能一直保持连接,这就用到了一个叫做:保活机制。 就是一旦时间太长,那么服务端就要认为客户端断开连接了, 就要将连接断掉。 

打通socket与文件fd

        这是我们的进程: 

          

        假如此时打开了一个文件struct file。然后struct file对象里面包含了函数方法以及缓冲区(对于网络来说不重要)以及一个函数指针:private_date。

 

        当我们创建网络套接字时,在我们的操作系统当中,会为我们创建很多数据结构,其中一个就叫做socket 。那private.data就会指向socket这个文件。

        这个socket结构体里面也有一个变量file,能够回指向我们的网络文件。

        所以,在我们的进程层面上,我们只需要利用fd找到对应的文件,就能找到对应的socket全部信息。

        然后这里有一个wait等待队列,这个就是当我们的网络不就虚的时候,就将改网络文件连接到等待队列里。

        socket结构体也有对应的成员函数,也就是说struct file和socket都有自己的方法集。 

 

        sock也是一个重要的属性。 这个sk指针就是指向的sock,这个sock是UDP或者TCP协议结构体的一个成员。什么意思?意思就是说UDP和TCP本身还有一个关于sock的结构体。即udp_sock和tcp_sock。然后,实际上在我们创建tcp套接字时,在底层其实创建的tcp_sock,在我们创建tcp套接字时,在底层其实创建的是udp_sock;然后sock指向的其实是udp_sock或者tcp_sock里面的sock结构体。

        那么他怎么知道指向的时udp或者tcp呢? 其实sock当中有一个lag,区分socket类型
以后,想要访问某一个字段,比如是tcp访问字段,只需要(struct tcp.sock*sk->???就行了。所以,其实这个sk的本质,就是多态。

         我们以前学习文件管理的时候知道struct fle里面的op其实是指向的是网卡的一堆方法。然后soket里面又有网络相关方法。这两个有什么区别呢?
        这个file里面的op其实是对上的,上层数据交给下层。 然后socket里面的op是对下的。

         所以协议栈, 其实就是用特定数据结构表述的协议,用特定协议匹配的方法集合!!!

        服务器收到多个报文,而报文是要被管理的。如何管理呢? 用的是一个sk_buff的结构体进行描述。这个结构体里面有head, data, tail, end。其中head指针就是指向报头的指针。当这个结构体向上或者向下的过程中, 就是报斗指针的向下或者向的过程即封装和解包,本质只要移动指针就可以。

 

 ——————以上就是本节全部内容哦, 如果对友友们有帮助的话可以关注博主, 方便学习更多知识哦!!!    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/69610.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FireFox | Google Chrome | Microsoft Edge 禁用更新 final版

之前的方式要么失效,要么对设备有要求,这次梳理一下对设备、环境几乎没有要求的通用方式,universal & final 版。 1.Firefox 方式 FireFox火狐浏览器企业策略禁止更新_火狐浏览器禁止更新-CSDN博客 这应该是目前最好用的方式。火狐也…

大数据学习之Kafka消息队列、Spark分布式计算框架一

Kafka消息队列 章节一.kafka入门 4.kafka入门_消息队列两种模式 5.kafka入门_架构相关名词 Kafka 入门 _ 架构相关名词 事件 记录了世界或您的业务中 “ 发生了某事 ” 的事实。在文档中 也称为记录或消息。当您向 Kafka 读取或写入数据时,您以事件的 形式执行…

深度学习指标可视化案例

TensorBoard 代码案例:from torch.utils.tensorboard import SummaryWriter import torch import torchvision from torchvision import datasets, transforms# 设置TensorBoard日志路径 writer SummaryWriter(runs/mnist)# 加载数据集 transform transforms.Comp…

Linux文件原生操作

Linux 中一切皆文件,那么 Linux 文件是什么? 在 Linux 中的文件 可以是:传统意义上的有序数据集合,即:文件系统中的物理文件 也可以是:设备,管道,内存。。。(Linux 管理的一切对象…

基于springboot+vue的流浪动物救助系统的设计与实现

开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…

提供一种刷新X410内部EMMC存储器的方法

USRP X410内部采用了16G的EMMC存储器,内有内核和文件系统。官方站[注1]提供了多个版本的EMMC映像文件,并提供了多种刷新方法[注2]。 1,如果内核还能运行只是文件系统破坏,可以从外接USB盘,之后使用mount挂载U盘&#…

CTFSHOW-WEB入门-命令执行29-32

题目:web 29 题目:解题思路:分析代码: error_reporting(0); if(isset($_GET[c])){//get一个c的参数$c $_GET[c];//赋值给Cif(!preg_match("/flag/i", $c)){eval($c);//if C变量里面没有flag,那么就执行C…

探索AI(chatgpt、文心一言、kimi等)提示词的奥秘

大家好,我是老六哥,我正在共享使用AI提高工作效率的技巧。欢迎关注我,共同提高使用AI的技能,让AI成功你的个人助理。 "AI提示词究竟是什么?" 这是许多初学者在接触AI时的共同疑问。 "我阅读了大量关于…

【CS61A 2024秋】Python入门课,全过程记录P4(Week7 Generators开始,更新于2025/1/29)

文章目录 关于基本介绍👋新的问题更好的解决方案Week7Mon Generators阅读材料Lab 05: Iterators, MutabilityQ1: WWPD: List-MutationQ2: Insert Items 关于 个人博客,里面偶尔更新,最近比较忙。发一些总结的帖子和思考。 江湖有缘相见&…

使用 OpenResty 构建高效的动态图片水印代理服务20250127

使用 OpenResty 构建高效的动态图片水印代理服务 在当今数字化的时代,图片在各种业务场景中广泛应用。为了保护版权、统一品牌形象,动态图片水印功能显得尤为重要。然而,直接在后端服务中集成水印功能,往往会带来代码复杂度增加、…

【MySQL — 数据库增删改查操作】深入解析MySQL的 Update 和 Delete 操作

1. 测试数据 mysql> select* from exam1; ----------------------------------------- | id | name | Chinese | Math | English | ----------------------------------------- | 1 | 唐三藏 | 67.0 | 98.0 | 56.0 | | 2 | 孙悟空 | 87.0 | 78.…

webAPI -DOM 相关知识点总结(非常细)

title: WebAPI语法 date: 2025-01-28 12:00:00 tags:- 前端 categories:- 前端WEB API 了解DOM的结构并掌握其基本的操作,体验 DOM 在开发中的作用 API简介 就是使用js来操作html和浏览器 什么是DOM? 就是一个文档对象模型,是用来呈现预计于任意htm…

图论——最小生成树的扩展应用

最小生成树相关原理 acwing1146.新的开始 假设存在一个“超级发电站” 在每一个矿井修发电站相当于从这个“超级发电站”到各个矿井连一条长度为 v [ i ] v[i] v[i]的边。 这样一来这就是一个最短路的模板题。 #include <iostream> #include <cstring> using na…

K8S中高级存储之PV和PVC

高级存储 PV和PVC 由于kubernetes支持的存储系统有很多&#xff0c;要求客户全都掌握&#xff0c;显然不现实。为了能够屏蔽底层存储实现的细节&#xff0c;方便用户使用&#xff0c; kubernetes引入PV和PVC两种资源对象。 PV&#xff08;Persistent Volume&#xff09; PV是…

宝塔面板SSL加密访问设置教程

参考:https://www.bt.cn/bbs/thread-117246-1-1.html 如何快速使用证书加密访问面板 因早期默认未开启https访问所以没有相关的风险提醒&#xff0c;现面板默认已开启https加密访问、提升安全性 由于采用的是服务器内部本身签发证书&#xff0c;不被公网浏览器信任请参考以下步…

深入探讨数据库索引类型:B-tree、Hash、GIN与GiST的对比与应用

title: 深入探讨数据库索引类型:B-tree、Hash、GIN与GiST的对比与应用 date: 2025/1/26 updated: 2025/1/26 author: cmdragon excerpt: 在现代数据库管理系统中,索引技术是提高查询性能的重要手段。当数据量不断增长时,如何快速、有效地访问这些数据成为了数据库设计的核…

21.2-工程中添加FreeRTOS(掌握) 用STM32CubeMX添加FreeRTOS

这个是全网最详细的STM32项目教学视频。 第一篇在这里: 视频在这里 STM32智能小车V3-STM32入门教程-openmv与STM32循迹小车-stm32f103c8t6-电赛 嵌入式学习 PID控制算法 编码器电机 跟随 **V3:HAL库开发、手把手教学下面功能&#xff1a;PID速度控制、PID循迹、PID跟随、遥控、…

【越学学糊涂的Linux系统】Linux指令篇(二)

一、pwd指令&#xff1a; 00x0:打印该用户当前目录下所属的文件路径 看指令框可以看出我用的是一个叫sw的用户&#xff0c;我们的路径就是在一个home目录下的sw目录下的class113文件路径。 也可以说是指出当前所处的工作目录 补充&#xff1a;&#x1f386;​​​​​​​Wi…

LangGraph系列-1:用LangGraph构建简单聊天机器人

在快速发展的人工智能和大型语言模型&#xff08;llm&#xff09;世界中&#xff0c;开发人员不断寻求创建更灵活、更强大、更直观的人工智能代理的方法。 虽然LangChain已经改变了这个领域的游戏规则&#xff0c;允许创建复杂的链和代理&#xff0c;但对代理运行时的更复杂控制…

进程池的制作(linux进程间通信,匿名管道... ...)

目录 一、进程间通信的理解 1.为什么进程间要通信 2.如何进行通信 二、匿名管道 1.管道的理解 2.匿名管道的使用 3.管道的五种特性 4.管道的四种通信情况 5.管道缓冲区容量 三、进程池 1.进程池的理解 2.进程池的制作 四、源码 1.ProcessPool.hpp 2.Task.hpp 3…