网络协议分析 | 应用层:HTTP协议详解、HTTP代理服务器

文章目录

  • 概念
  • URL
  • HTTP协议的特点
  • HTTP协议版本
  • 格式
    • 请求报文
      • 首行
      • 头部
      • 空行
      • 正文
    • 响应报文
      • 首行
      • 头部
      • 空行
      • 正文
    • Cookie与Session
  • HTTP代理服务器
    • 正向代理服务器
    • 反向代理服务器
    • 透明代理服务器


概念

先了解一下 因特网(Internet)万维网(World Wide Web)。

因特网是使用 IP(Internet Protocol,因特网协议) 连接在一起的计算机构成的网络。因特网上有很多服务,包括万维网,以及电子邮件、文件共享、因特网电话等。因此,万维网(World Wide Web,简称Web)只是因特网上的一种服务形式

Tim Berners-Lee 当初发明万维网时,一共创造了三项核心技术:

  • HTTP协议: 超文本传输协议,是用于从 万维网服务器 传输 超文本本地浏览器 的传送协议。
  • URL(Uniform Resource Locator): 统一资源定位符,用于标识唯一资源,也就是我们通常所说的网址。
  • HTML(Hypertext Markup Language): 超文本标记语言,用于构造网页的。

说到HTTP,其实主要是说万维网。但随着越来越多的服务甚至一些没有 传统Web前端界面 的服务开始使用HTTP,这个界限变得越来越模糊。比如,你可以在自己的手机应用中通过HTTP向家里的灯发出开或关的指令。

那么日常中浏览器向web服务器请求网页时交互过程是怎样的呢?

  1. 浏览器根据 DNS(Domain Name System,域名系统)服务器 返回的真实地址请求网页。DNS 主要负责把对人类友好的域名 www.google.com 转换为对机器友好的 IP地址
    PS:我们常说的网址和域名有什么区别?比如 https://www.baidu.com/ 这就是一个网址,而域名指的是 www.baidu.com 这一部分。
  2. 浏览器请求计算机建立对这个 IP地址 的标准 Web端口(80,QUIC协议常用)标准安全Web端口(443,HTTPS协议常用)TCP(Transmission Control Protocol,传输控制协议)连接。
  3. 浏览器连接到 Web服务器 之后会请求网站。这一步就要用到 HTTP 了,具体细节我们在下面讨论。现在,只需知道浏览器会使用HTTPGoogle的服务器 请求 Google主页 就行了。
  4. web服务器 会根据请求的 URL 响应相关内容。访问成功会返回 HTML格式的网页文本 ,访问错误则会返回对应的 HTTP响应码
  5. Web浏览器 负责处理返回的响应。假设返回的响应是 HTML ,则浏览器就会解析 HTML 中的代码,并在内存中构建 DOM(Document Object Model,文档对象模型),一种页面的内部表现形式。处理期间,浏览器可能会发现正常显示页面还需要 其他资源(比如CSS、JavaScript和图片)。
  6. 如果正常显示页面还需要其他资源,Web浏览器 会请求自己需要的额外资源。而每次请求额外资源时,都必须重复1~6步。这是导致上网慢的一个重要因素,因而催生了 HTTP/2 ,其主要目的是使得请求多资源时更有效率。
  7. 浏览器在获取了足够的关键资源后,开始在屏幕上渲染页面。但是,选择在屏幕上渲染的时机又是一个挑战:如果浏览器等到所有资源都下载完毕才渲染,那么用户就要等很久才能看到网页,上网的体验会很差。相反,如果浏览器过早渲染页面,那么伴随着更多资源下载,页面结构也会跳来跳去。假如你正在阅读一篇文章,而页面突然抖动了一下,你不生气才怪。
  8. 在页面刚刚显示在屏幕上之后,浏览器会在后台继续下载其他资源,并在处理完它们之后更新页面。这些资源包括不那么重要的图片和广告追踪脚本。因此,我们经常会看到网页刚显示时并没有图片(特别是在网速比较慢的情况下),而过了一会儿图片才慢慢下载并显示出来。
  9. 当页面完全被加载后,浏览器会停止显示加载图标(在多数浏览器上都位于地址栏旁边),然后触发 OnLoad JavaScript事件 。根据这个事件,JavaScript 就知道可以执行某些操作了。
  10. 此时,页面已经完全加载了,但浏览器并不会停止发送请求。 网页只包含静态内容的时代早就过去了。如今的很多网页其实已经是功能齐全的应用了,因此接下来浏览器还会发送或加载更多内容。
    • 这些内容有的来自用户输入,比如你在 Google主页 的搜索框中填写了一个关键字,但没有按 搜索 按钮就立即看到了搜索建议;
    • 有的来自应用驱动的操作,比如你的 QQ 或者 微博动态,不需要你点击 刷新 按钮就能自动刷新。
      这些操作通常在后面悄悄发生,你看不到它们,特别是广告分析脚本,它会跟踪你在网站上的操作,并将该信息发送给站长或者广告服务商。

URL

URL:统一资源定位符,用于在网络中定位某台主机上的某一个资源,

URL由以下几部分组成
协议 :// 用户名 : 密码 @ 服务器IP地址 : 服务器端口 / 文件路径 ? 查询字符串 # 片段标识符

  • 协议: 请求需要使用的协议,现在通常为 HTTP、HTTPS
  • 用户名密码: 认证用户的用户名密码,为了安全一般都不会显示。
  • 服务器地址: 这里通常都不会是IP地址,而是域名,通过域名解析服务器(DNS服务器)就能够得到服务器的IP地址。
  • 服务器端口: HTTP协议的端口默认是80,但也可以选择其他的,默认是不显示的。
  • 文件路径: 即请求的资源在服务器上的存储路径。
  • 查询字符串: 客户端请求中的额外参数,由 key=value 的键值对组成,以 & 作为分隔符。
  • 片段标识符: HTML的 标签id ,可以直接跳转到页面的某个位置。

详情可参考这篇博客

以B站为例:
在这里插入图片描述
对于 ? # / : 等特殊字符,会通过 urlencode 的方式进行转义。转义的规则如下:
将需要转码的字符转为 16进制 ,然后从右到左,取 4位(不足4位直接处理) ,每 2位1位,前面加上 % ,编码成 %XY 格式

举例:

  • 当我们在百度中搜索时:
    在这里插入图片描述

  • 但是如果我们将网址复制出来就会成这样:

在这里插入图片描述
这种将 特殊字符(包括汉字) 转变为 16进制的额过程被称为 urlencode ,反过来就是一个 urldecode 过程。


HTTP协议的特点

  1. HTTP是无连接:
    无连接的含义是限制每次连接只处理一个请求。服务端处理客户端的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间,亦不用花费资源维护连接。

  2. HTTP是灵活的:
    只要客户端和服务器知道如何处理的数据内容,任何类型的数据都可以通过HTTP发送。通过头部中的 Content-Type 来标记正在传输的类型

  3. HTTP是无状态的:
    无状态是指对于事务处理没有记忆能力,服务器不知道客户端是什么状态,即我们给服务器发送 HTTP 请求之后,服务器会根据请求给我们发送数据过来,但是发送完后不会记录任何信息。
    无状态是一把双刃剑,如果处理当前请求时需要之前的信息,则必须重传,这样可能导致每次连接传送的数据量增大。而如果服务器不需要先前信息时,它的应答就较快。


HTTP协议版本

HTTP协议有 5 个版本,分别是 0.9、1.0、1.1、2.0、3.0

0.9版本:

  • 这时的HTTP协议 没有标准格式 ,仅用于传输HTML(超文本标记语言)数据。
  • 请求方法只有 GET
  • 连接方式为 短连接: 建立连接,发送一个请求,得到相应后关闭连接。

在这里插入图片描述

1.0版本:

  • 正式规定了HTTP协议格式,支持不同文件格式的数据流.
  • 同时部分应用商已经开始使用 优化的短连接: 一次连接可以发送多条请求。
  • 定义了三种请求方法: GETPOSTHEAD 方法。

在这里插入图片描述

1.1版本:

  • 增加了更多的请求方法和头部描述信息,并支持长连接和管线化传输。
  • 新增了五种请求方法:OPTIONSPUTDELETETRACECONNECT 方法
  • 管线化传输:可以连续发送多个请求,只要 按顺序响应 就行,不需要响应后才发下一个请求。

但是还存在约束条件,响应的顺序必须与请求的顺序保持一致,通过队列实现,如果不一致则在 队首阻塞

在这里插入图片描述
队头阻塞: 当顺序发送的请求序列中的一个请求因为某种原因被阻塞时,在后面排队的所有请求也一同被阻塞了,导致客户端一直请求不到数据。
在这里插入图片描述

2.0版本:

  • 采用二进制流传输,并且进行多路复用,允许服务端主动推送数据。
  • 多路复用:响应顺序可以与请求的顺序不一致,因为头部中标识了对应的请求信息,提高了信道的利用率。

在这里插入图片描述

3.0版本:

3.0 版本中 HTTP 采取了革命性的变化,其将网络协议从 TCP 切换至 QUIC (Quick UDP Internet Connections), 快速 UDP 互联网连接。 QUIC 是基于 UDP协议 的。

QUIC 协议主要解决了两个问题:

  • 线头阻塞问题: 基于 TCPHTTP2.0 的多路复用机制,尽管从逻辑上来说,不同的流之间相互独立,不会相互影响,但在实际传输方面,数据还是要一帧一帧的发送和接收,一旦某一个流的数据有丢包,则同样会阻塞在它之后传输的流数据传输。而基于 UDPQUIC 协议则可以更为彻底地解决这样的问题,让不同的流之间真正的实现相互独立传输,互不干扰。
  • 切换网络时的连接保持: 当前移动端的应用环境,用户的网络可能会经常切换,比如从办公室或家里出门,WiFi断开,网络切换为移动网络。基于TCP的协议,由于切换网络之后,IP会改变,因而之前的连接不可能继续保持。而基于UDP的QUIC协议,则可以内建与TCP中不同的连接标识方法,从而在网络完成切换之后,恢复之前与服务器的连接。

格式

请求报文

HTTP报文由 从客户机到服务器的请求从服务器到客户机的响应 构成。请求报文格式如下:

在这里插入图片描述


首行

[请求方法] [URL] [协议版本]\r\n

在这里插入图片描述

请求方法功能
GET请求指定的页面信息,并返回实体主体。一般将数据放到 URL 中.
HEAD类似于 GET 请求,只不过返回的响应中没有具体的内容,用于获取报头。
POST向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在 请求正文 中。POST请求可能会导致新的资源的建立 和/或 已有资源的修改。
PUT从客户端向服务器传送的数据取代指定的文档的内容。
DELETE请求服务器删除指定的页面。
CONNECHTTP/1.1 协议中预留给能够将连接改为管道方式的代理服务器。
OPTIONS允许客户端查看服务器的性能。
TRACE回显服务器收到的请求,主要用于测试或诊断。
PATCH是对 PUT方法的补充,用来对已知资源进行局部更新 。

GET 和 POST有什么区别?

  1. 请求缓存:GET 会被缓存,而 POST 不会。
  2. POSTGET 更安全,POST 将数据存储在实体中,而 GET 将数据存储在 url 中,页面会被浏览器缓存,其他人查看历史记录会看到提交的数据。但事实上,数据的安全性通常由 HTTPS 协议来保障,POST 只是不能选择 HTTPS 协议下的无奈之举。
  3. GET 仅支持 urlencode 编码,POST 由于数据是放在 body 中的,因此支持多种编码。
  4. 请求参数长度限制:由于 url 是定长的(每个浏览器有不同的规定),因此 GET 请求长度有限制,POST 对请求数据没有限制。

“安全”的请求方法:

  • HEADGETOPTIONSTRACE 只从服务器获得资源或信息,而不对服务器做任何修改,因此被称为安全的方法。
  • POSTPUTDELETEPATCH 则影响服务器上的资源。

幂等性

幂等性(idempotent):即多次连续的、重复的请求和只发送一次该请求具有完全相同的效果。

  • HEADGETOPTIONSPUTDELETETRACE 是幂等的。
  • POST 不是幂等的。

误区

值得一提的是,虽然在上述介绍请求方法时,对他们的功能进行了解释,但据凌桓大佬所言,如果死板地记忆请求方法和对应功能反而落入窠臼之中,例如, PUTPOST 往往可以实现相同的功能,在 RESTful 软件架构风格下就是这样。

详情见大佬的博客。


头部

描述本次请求的关键字段信息,由 key:value 形式的键值对组成,并且每个键值对以 \r\n 作为结尾。
在这里插入图片描述
HTTP请求报文常用的Header:

在这里插入图片描述

短链接和长连接的表示

我们在协议版本部分中提到的 短链接长连接 ,其就是由 Connection 头部不同的值来标识的:

  • close :短链接,处理完请求后立即关闭连接。
  • keep-alive:长连接,处理完请求后保持一段时间以等待后续请求。

空行

空行即为 \r\n,用于间隔头部和正文。因为头部的每一个键值对以 \r\n 结束,所以一旦连续接受到两个 \r\n 的时候就代表着头部的接收结束。


正文

客户端提交的数据,允许为空字符串。
在这里插入图片描述


响应报文

响应报文格式如下:
在这里插入图片描述


首行

[协议版本] [响应状态码] [响应状态码描述]\r\n

在这里插入图片描述

响应状态码: 对于本次请求,服务端做出的响应结果。

状态码描述: 对状态码的描述信息,可自定义。

HTTP的响应状态码:
在这里插入图片描述

消息描述
1XX Informational信息状态码,表示接受的请求正在处理。
100 Continue服务器仅接收到部分请求,但是一旦服务器并没有拒绝该请求,客户端应该继续发送其余的请求。
101 Switching Protocols服务器转换协议:服务器将遵从客户的请求转换到另外一种协议。
2XX Success成功状态码,表示请求正常处理完毕。
200 OK请求成功(其后是对 GETPOST 请求的应答文档。)
201 Created请求被创建完成,同时新的资源被创建。
202 Accepted供处理的请求已被接受,但是处理未完成。
203 Non-authoritative Information文档已经正常地返回,但一些应答头可能不正确,因为使用的是文档的拷贝。
204 No Content没有新文档。浏览器应该继续显示原来的文档。如果用户定期地刷新页面,而 Servlet 可以确定用户文档足够新,这个状态代码是很有用的。
205 Reset Content没有新文档。但浏览器应该重置它所显示的内容。用来强制浏览器清除表单输入内容。
206 Partial Content客户发送了一个带有 Range 头的 GET请求 ,服务器完成了它。
3XX Redirection重定向状态码,需要进行附加操作以完成请求。
300 Multiple Choices多重选择。链接列表。用户可以选择某链接到达目的地。最多允许五个地址。
301 Moved Permanently所请求的页面已经转移至新的 URL
302 Found所请求的页面已经临时转移至新的 URL
303 See Other所请求的页面可在别的 URL 下被找到。
304 Not Modified未按预期修改文档。客户端有缓冲的文档并发出了一个条件性的请求(一般是提供 If-Modified-Since 头表示客户只想要比指定日期更新的文档)。服务器告诉客户,原来缓冲的文档还可以继续使用。
305 Use Proxy客户请求的文档应该通过Location头所指明的代理服务器提取。
306 Unused此代码被用于前一版本。目前已不再使用,但是代码依然被保留。
307 Temporary Redirect被请求的页面已经临时移至新的 URL
4XX Client Error客户端状态错误码:表示服务器无法处理请求。
400 Bad Request服务器未能理解请求。
401 Unauthorized被请求的页面需要用户名和密码。
401.1登录失败。
401.2服务器配置导致登录失败。
401.3由于 ACL(访问控制列表) 对资源的限制而未获得授权。
401.4筛选器授权失败。
401.5ISAPI/CGI 应用程序授权失败。
401.7访问被 Web服务器 上的 URL 授权策略拒绝。这个错误代码为 IIS 6.0 所专用。
402 Payment Required此代码尚无法使用。
403 Forbidden对被请求页面的访问被禁止。
403.1执行访问被禁止。
403.2读访问被禁止。
403.3写访问被禁止。
403.4要求 SSL(安全套接字协议)
403.5要求 SSL 128位证书
403.6IP地址被拒绝。
403.7要求客户端证书。
403.8站点访问被拒绝。
403.9用户数过多。
403.10配置无效。
403.11密码更改。
403.12拒绝访问映射表。
403.13客户端证书被吊销。
403.14拒绝目录列表。
403.15超出客户端访问许可。
403.16客户端证书不受信任或无效。
403.17客户端证书已过期或尚未生效。
403.18在当前的应用程序池中不能执行所请求的 URL 。这个错误代码为 IIS 6.0 所专用。
403.19不能为这个应用程序池中的客户端执行 CGI 。这个错误代码为 IIS 6.0 所专用。
403.20Passport 登录失败。这个错误代码为 IIS 6.0 所专用。
404 Not Found服务器无法找到被请求的页面。
404.0(无)–没有找到文件或目录。
404.1无法在所请求的端口上访问Web站点。
404.2Web服务扩展锁定策略阻止本请求。
404.3MIME 映射策略阻止本请求。
405 Method Not Allowed请求中指定的方法不被允许。
406 Not Acceptable服务器生成的响应无法被客户端所接受。
407 Proxy Authentication Required用户必须首先使用代理服务器进行验证,这样请求才会被处理。
408 Request Timeout请求超出了服务器的等待时间。
409 Conflict由于冲突,请求无法被完成。
410 Gone被请求的页面不可用。
411 Length RequiredContent-Length(POST请求报文的长度) 未被定义。如果无此内容,服务器不会接受请求。
412 Precondition Failed请求中的前提条件被服务器评估为失败。
413 Request Entity Too Large由于所请求的实体的太大,服务器不会接受请求。
414 Request-url Too Long由于 URL 太长,服务器不会接受请求。当post请求被转换为带有很长的查询信息的get请求时,就会发生这种情况。
415 Unsupported Media Type由于媒介类型不被支持,服务器不会接受请求。
416 Requested Range Not Satisfiable服务器不能满足客户在请求中指定的Range头。
417 Expectation Failed执行失败。
423锁定的错误。
5XX Server Error服务器状态错误码:表示服务器处理请求出错。
500 Internal Server Error请求未完成。服务器遇到不可预知的情况。
500.12应用程序正忙于在Web服务器上重新启动。
500.13Web服务器太忙。
500.15不允许直接请求 Global.asa
500.16UNC(通用命名规则) 授权凭据不正确。这个错误代码为 IIS 6.0 所专用。
500.18URL 授权存储不能打开。这个错误代码为 IIS 6.0 所专用。
500.100内部 ASP(动态服务器设备) 错误。
501 Not Implemented请求未完成。服务器不支持所请求的功能。
502 Bad Gateway请求未完成。服务器从上游服务器收到一个无效的响应。
502.1CGI 应用程序超时。
502.2CGI 应用程序出错。
503 Service Unavailable请求未完成。服务器临时过载或宕机。
504 Gateway Timeout网关超时。
505 HTTP Version Not Supported服务器不支持请求中指明的HTTP版本。

头部

描述本次响应的关键字段信息,由 key:value 形式的键值对组成,并且每个键值对以 \r\n 作为结尾。

在这里插入图片描述

HTTP响应报文常用的Header:

在这里插入图片描述

Set-Cookie

关于 Cookie 的具体内容下文会有讲解,这里简单提一下 Set-Cookie 头部一般由哪些值构成:

  • Cookie 的名字
  • ecpires: Cookie 的生存时间
  • domain:Cookie 生效的域名
  • path : Cookie 生效的路径

空行

同请求报文空行。


正文

服务端响应的实体资源

在这里插入图片描述
显示为乱码的原因是使用的是 HTTPS 协议,该协议会对响应的内容加密,中间者无法直接查看明文内容。


Cookie与Session

因为 HTTP 是无状态的,但在实际情况中,我们还是需要保持状态的。那么如何让 HTTP 来保持状态呢?答案就是借助 Header 中的 CookieSession

cookie 是什么?

Cookie 是服务器(通过应答报文的头部字段“Set-Cookie”)发送给客户端的保存了用户信息的字符串。客户端每次向服务器发送请求都需要带上 Cookie (通过请求报文的头部字段“Cookie”),以便于服务器区分不同的客户端。

举个例子,618作为一个大型的购物节,在一天的不同时间段,不同店铺中,会有着许多不同的活动,为了达到最大折扣,我们通常会在一天内多次进入如淘宝、京东等购物网站进行购物,但是因为 HTTP 是无状态的,所以它并不会记录我们的任何信息,所以我们在每次访问时都需要重新登陆来确认用户的身份,这是一种很麻烦的事情。所以为 HTTP 加入了 Cookie 来帮助其维持状态。

Cookie 分为两类:

  1. 以文件方式存在硬盘空间上的 长期性的 cookie
  2. 停留在浏览器所占内存中的 临时性的 cookie

有了 Cookie 之后,我们只需要一次登录就能够以 该登录状态 访问 同一域名的不同页面 ,没必要繁琐的每个页面都登录同样的用户以维持登陆状态。
在这里插入图片描述

cookie 的运作方式:

在每次通信后,会将 服务端的一些临时验证信息(比如常见的询问用户是否要保存登陆密码)保存在客户端的 cookie 文件中。这样下次通信时,就可以通过读取 cookie 中保存的验证信息,将其传递给服务端,来维持客户端的状态,这样就可以避免多次登录。

为什么需要 session ? 什么是 session ?

Cookie 的使用不够安全 ,因为 Cookie 保存在客户端(浏览器),很容易被脚本、爬虫等截取,所以 Cookie 需要搭配 Session 使用。

Session 其实就是服务端为客户端创建的一种信息管理机制,其中描述了客户端的身份认证信息和状态信息,并且将其保存在 服务端 服务端每次通信结束后都会将 Session id(本次会话的ID)保存在客户端的 Cookie 中,客户端在下次通信时通过 Cookie 将保存的 Session id 传递给服务端,这样服务端就可以通过对应的 Session id 来查找到客户端的身份认证信息和状态信息,来为客户端维持状态,避免重复登录。

如果客户端的浏览器禁用了 Cookie ,那么还能使用 Session 吗?

一般这种情况下,会使用一种叫做 URL重写 的技术来进行会话跟踪,即每次 HTTP 交互,URL 后面都会被附加上一个诸如 sid=xxxxx 这样的参数,服务端据此来识别用户。

Cookie 与 Session 的区别是什么?

  • Cookie : 保存在客户端上的一种存储机制,用于持续与服务端进行信息传递的一种手段。
  • Session: 保存在服务端上的一种数据结构,通过 Cookie 传递 Session id 来查找到对应的 身份状态信息 ,来实现状态维持。

为什么 Session 要比 Cookie 更安全?

Session ID 是放在 Cookie 里,想要攻破 Session ,首先要破解 Cookie 。而即使得到 Session ID

  • 第一,Session ID 是要有人登录,或者启动 session_start 才会有,你不知道什么时候会有人登录。
  • 第二,Session ID 是加密的,第二次 session_start 的时候,前一次的 Session ID 就失效了。换言之,Session 是针对某一次通信而言,会话结束 Session 也就随着消失了,Session 消失了 Session ID 也失效了,而想在短时间内破解加了密的 Session ID 是很难的。

HTTP代理服务器

HTTP通信链 上,客户端和目标服务器之间通常存在某些中转代理服务器。它们最基本的功能是连接,此外还包括安全性、缓存、内容过滤、访问控制管理等功能。一个 HTTP请求 可能被多个代理服务器转发,后面的服务器称为前面服务器的 上游服务器 。代理服务器分为:正向代理服务器、反向代理服务器、透明代理服务器。


正向代理服务器

概念

要求客户端自己设置代理服务器的地址。客户的每次请求都将直接发送到该代理服务器,并由代理服务器来请求目标资源。

处于防火墙内的局域网机器要访问 Internet,或者要访问一些被屏蔽掉的国外网站,就需要用到正向代理服务器。

优点

可以使用缓冲特性(由 mod_cache 提供)减少网络使用率


反向代理服务器

概念

被设置在服务器端,因而客户端无须进行任何设置。反向代理是指用代理服务器来接收 Internet 上的连接请求,然后将请求转发给内部网络上的服务器,并将从内部服务器上得到的结果返回给客户端。对于用户而言,反向代理服务器就相当于目标服务器。

各大网站通常分区域设置了多个代理服务器,所以在不同的地方 ping 同一个域名可能得到不同的 IP地址,因为这些 IP地址 实际上是 代服务器的IP地址

优点

  • 可用来作为 Web加速 即使用反向代理作为 Web服务器的前置机 来降低网络和服务器的负载,提高访问效率。
    例如:在内部服务器前放置两台反向代理服务器,分别连接到教育网和公网,这样公网用户就可以直接通过公网线路访问学校服务器,从而避开了公网和教育网之间拥挤的链路。
  • 提高内部服务器的安全性: 外部网络用户通过反向代理访向内部服务器,只能看到反向代理服务器的IP地址和端口号,内部服务器对于外部网络来说是完全不可见。而且反向代理服务器上没有保存任何的信息资源,所有的网页程序都保存在内部服务器上,对反向代理服务器的攻击并不能使真的网页信息系统受到破坏。
  • 节约了有限的 IP资源 校园网内部服务器除使用教育网地址外,也会采用公网的IP地址对外提供服务,公网分配的IP地址数目是有限的,如果每个服务器都分配一个公网地址,那是不可能的,通过反向代理技术很好的解决了IP地址不足的问题。

透明代理服务器

概念

透明代理只能设置在网关上,客户端根本不需要知道有代理服务器的存在,它改变你的 request fields(报文) ,并会传送 真实IP ,多用于路由器的 NAT转发 中。注意,加密的透明代理则是属于 匿名代理 ,意思是不用设置使用代理了,例如:Garden 2 程序。透明代理可以看作正向代理的一种特殊情况。

原理

假设 A 为内部网络客户机,B 为外部网络服务器,C 为防火墙。

  1. AB 有连接请求时,TCP连接请求防火墙C 截取并加以监控。
  2. 截取后当发现连接需要使用代理服务器时,AC 之间首先建立连接。
  3. 然后 防火墙C 建立相应的 代理服务通道目标B 建立连接。
  4. 由此通过 代理服务器C 建立 A目标地址B 的数据传输途径。

从用户的角度看,AB 的连接是直接的,而实际上 A 是通过 代理服务器CB 建立连接的。反之,当 BA 有连接请求时原理相同。由于这些连接过程是自动的,不需要客户端手工配置代理服务器,甚至用户根本不知道代理服务器的存在,因而对用户来说是透明的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/443763.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL命令(一)| 数据类型、常用命令一览、库的操作、表的操作

文章目录数据类型数值类型字符串类型日期/时间类型常用命令一览库的操作显示当前数据库创建数据库使用数据库删除数据库表的操作创建表显示当前库中所有表查看表结构删除表数据类型 mysql 的数据类型主要分为 数值类型、日期/时间类型、字符串类型 三种。 数值类型 数值类型可…

C++ 继承 | 对象切割、菱形继承、虚继承、对象组合

文章目录继承继承的概念继承方式及权限using改变成员的访问权限基类与派生类的赋值转换回避虚函数机制派生类的默认成员函数友元与静态成员多继承菱形继承虚继承组合继承 继承的概念 继承可以使得子类具有父类的属性和方法或者重新定义、追加属性和方法等。 当创建一个类时&…

博弈论 | 博弈论简谈、常见的博弈定律、巴什博弈

文章目录博弈论什么是博弈论?博弈的前提博弈的要素博弈的分类非合作博弈——有限两人博弈囚徒困境合作博弈——无限多人博弈囚徒困境常见的博弈定律零和博弈重复博弈智猪博弈斗鸡博弈猎鹿博弈蜈蚣博弈酒吧博弈枪手博弈警匪博弈海盗分金巴什博弈博弈论 什么是博弈论…

MySQL命令(二)| 表的增删查改、聚合函数(复合函数)、联合查询

文章目录新增 (Create)全列插入指定列插入查询 (Retrieve)全列查询指定列查询条件查询关系元素运算符模糊查询分页查询去重:DISTINCT别名:AS升序 or 降序更新 (Update)删除 (Delete)分组(GROUP BY)联合查询内连接(inne…

MySQL | 数据库的六种约束、表的关系、三大范式

文章目录数据库约束NOT NULL(非空约束)UNIQUE(唯一约束)DEFAULT(缺省约束)PRIMARY KEY(主键约束)AUTO_INCREMENT 自增FOREIGN KEY(外键约束)CHECK&#xff08…

哈希 :哈希冲突、负载因子、哈希函数、哈希表、哈希桶

文章目录哈希哈希(散列)函数常见的哈希函数字符串哈希函数哈希冲突闭散列(开放地址法)开散列(链地址法/拉链法)负载因子以及增容对于闭散列对于开散列结构具体实现哈希表(闭散列)创建…

C++ 泛型编程(一):模板基础:函数模板、类模板、模板推演成函数的机制、模板实例化、模板匹配规则

文章目录泛型编程函数模板函数模板实例化隐式实例化显式实例化函数模板的匹配规则类模板类模板的实例化泛型编程 泛型编程旨在削减重复工作,如: 将一个函数多次重载不如将他写成泛型。 void Swap(int& left, int& right) {int temp left;lef…

你真的了解静态变量、常量的存储位置吗?

文章目录引言C对内存的划分如何落实在Linux上自由存储区和堆之间的问题栈常量区静态存储区静态局部变量静态局部变量、静态全局变量、全局变量的异同macOS系统的测试结果总结引言 在动态内存的博客中,我提到: 在Linux 内存管理的博客中,我提…

C++ 泛型编程(二):非类型模板参数,模板特化,模板的分离编译

文章目录非类型模板参数函数模板的特化类模板的特化全特化偏特化部分参数特化参数修饰特化模板分离编译解决方法非类型模板参数 模板的参数分为两种: 类型参数: 则是我们通常使用的方式,就是在模板的参数列表中在 class 后面加上参数的类型…

数据结构 | B树、B+树、B*树

文章目录搜索结构B树B树的插入B树的遍历B树的性能B树B树的插入B树的遍历B*树B*树的插入总结搜索结构 如果我们有大量的数据需要永久存储,就需要存储到硬盘之中。但是硬盘的访问速度远远小于内存,并且由于数据量过大,无法一次性加载到内存中。…

MySQL 索引 :哈希索引、B+树索引、全文索引

文章目录索引引言常见的索引哈希索引自适应哈希索引B树索引聚集索引非聚集索引使用方法联合索引最左前缀匹配规则覆盖索引全文索引使用方法索引 引言 为什么需要索引? 倘若不使用索引,查找数据时,MySQL必须遍历整个表。而表越大,…

服装店怎么引流和吸引顾客 服装店铺收银系统来配合

实体店的同城引流和经营是实体经济的一个重要的一环,今天我们来分享服装行业的实体店铺怎么引流和吸引、留住顾客,并实现复购。大家点个收藏,不然划走就再也找不到了,另外可以点个关注,下次有新的更好的招,…

MySQL 锁的相关知识 | lock与latch、锁的类型、简谈MVCC、锁算法、死锁、锁升级

文章目录lock与latch锁的类型MVCC一致性非锁定读(快照读)一致性锁定读(当前读)锁算法死锁锁升级lock与latch 在了解数据库锁之前,首先就要区分开 lock 和 latch。在数据库中,lock 和 latch 虽然都是锁&…

MySQL 存储引擎 | MyISAM 与 InnoDB

文章目录概念innodb引擎的4大特性索引结构InnoDBMyISAM区别表级锁和行级锁概念 MyISAM 是 MySQL 的默认数据库引擎(5.5版之前),但因为不支持事务处理而被 InnoDB 替代。 然而事物都是有两面性的,InnoDB 支持事务处理也会带来一些…

MySQL 事务 | ACID、四种隔离级别、并发带来的隔离问题、事务的使用与实现

文章目录事务ACID并发带来的隔离问题幻读(虚读)不可重复读脏读丢失更新隔离级别Read Uncommitted (读未提交)Read Committed (读已提交)Repeatable Read (可重复读)Serializable (可串行化)事务的使用事务的实现Redoundo事务 事务指逻辑上的一组操作。 …

MySQL 备份与主从复制

文章目录备份主从复制主从复制的作用备份 根据备份方法的不同,备份可划分为以下几种类型: 热备(Hot Backup) : 热备指的是在数据库运行的时候直接备份,并且对正在运行的数据库毫无影响,这种方法在 MySQL 官方手册中又…

C++ 流的操作 | 初识IO类、文件流、string流的使用

文章目录前言IO头文件iostreamfstreamsstream流的使用不能拷贝或对 IO对象 赋值条件状态与 iostate 类型输出缓冲区文件流fstream类型文件模式文件光标函数tellg() / tellp()seekg() / seekp()向文件存储内容/读取文件内容string流istringstreamostringstream前言 我们在使用 …

C++ 右值引用 | 左值、右值、move、移动语义、引用限定符

文章目录C11为什么引入右值?区分左值引用、右值引用move移动语义移动构造函数移动赋值运算符合成的移动操作小结引用限定符规定this是左值or右值引用限定符与重载C11为什么引入右值? C11引入了一个扩展内存的方法——移动而非拷贝,移动较之拷…

且谈关于最近软件测试的面试

前段时间有新的产品需要招人,安排和参加了好几次面试,下面就谈谈具体的面试问题,在面试他人的同时也面试自己。 面试问题是参与面试同事各自设计的,我也不清楚其他同事的题目,就谈谈自己设计的其中2道题。 过去面试总是…

C++ 多态 | 虚函数、抽象类、虚函数表

文章目录多态虚函数重写重定义(参数不同)协变(返回值不同)析构函数重写(函数名不同)final和override重载、重写、重定义抽象类多态的原理虚函数常见问题解析虚函数表多态 一种事物,多种形态。换…