HTTP 数据包头解析

一、连接至Web服务器

一个客户端应用(如Web浏览器)打开到Web服务器的HTTP端口的一个套接字(缺省为80)。

例如:http://www.myweb.com:8080/index.html

在Java中,这将等同于代码:

[java] view plaincopy
在CODE上查看代码片派生到我的代码片
  1. Soceet socket=new Socket("www.myweb.com",8080);  
  2. InputStream in=socket.getInputStream();  
  3. OutputStream out=socket.getOutputStream();  


二、发送HTTP请求

通过连接,客户端写一个ASCII文本请求行,后跟0或多个HTTP头标,一个空行和实现请求的任意数据

一个请求由四个部分组成:请求行、请求头标、空行和请求数据


1.请求行:请求行由三个标记组成:请求方法、请求URI和HTTP版本,它们用空格分隔。

例如:GET /index.html HTTP/1.1

HTTP规范定义了8种可能的请求方法:

GET                  检索URI中标识资源的一个简单请求

HEAD               与GET方法相同,服务器只返回状态行和头标,并不返回请求文档

POST                服务器接受被写入客户端输出流中的数据的请求

PUT                   服务器保存请求数据作为指定URI新内容的请求

DELETE            服务器删除URI中命名的资源的请求

OPTIONS          关于服务器支持的请求方法信息的请求

TRACE              Web服务器反馈Http请求和其头标的请求

CONNECT        已文档化但当前未实现的一个方法,预留做隧道处理


2.请求头标:由关键字/值对组成,每行一对,关键字和值用冒号(:)分隔。

请求头标通知服务器有关于客户端的功能和标识,典型的请求头标有:

User-Agent        客户端厂家和版本

Accept            客户端可识别的内容类型列表

Content-Length    附加到请求的数据字节数


3.空行:最后一个请求头标之后是一个空行,发送回车符和退行,通知服务器以下不再有头标。


4.请求数据:使用POST传送数据,最常使用的是Content-TypeContent-Length头标。



三、服务端接受请求并返回HTTP响应

Web服务器解析请求,定位指定资源。服务器将资源副本写至套接字,在此处由客户端读取。

一个响应由四个部分组成:状态行、响应头标、空行、响应数据


1.状态行:状态行由三个标记组成:HTTP版本、响应代码和响应描述

HTTP版本:向客户端指明其可理解的最高版本。

响应代码:3位的数字代码,指出请求的成功或失败,如果失败则指出原因。

响应描述:为响应代码的可读性解释。

例如:HTTP/1.1 200 OK

HTTP响应码:

1xx:信息,请求收到,继续处理

2xx:成功,行为被成功地接受、理解和采纳

3xx:重定向,为了完成请求,必须进一步执行的动作

4xx:客户端错误:


2.响应头标:像请求头标一样,它们指出服务器的功能,标识出响应数据的细节。


3.空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标。


4.响应数据:HTML文档和图像等,也就是HTML本身。



四、服务器关闭连接,浏览器解析响应

1.浏览器首先解析状态行,查看表明请求是否成功的状态代码。

2.然后解析每一个响应头标,头标告知以下为若干字节的HTML。

3.读取响应数据HTML,根据HTML的语法和语义对其进行格式化,并在浏览器窗口中显示它。

4.一个HTML文档可能包含其它需要被载入的资源引用,浏览器识别这些引用,对其它的资源再进行额外的请求,此过程循环多次。


五、无状态连接

HTTP模型是无状态的,表明在处理一个请求时,Web服务器并不记住来自同一客户端的请求。



六、实例

1.浏览器发出请求

GET /index.html HTTP/1.1

服务器返回响应

HTTP /1.1 200 OK
Date: Apr 11 2006 15:32:08 GMT
Server: Apache/2.0.46(win32)
Content-Length: 119
Content-Type: text/html


<HTML>

<HEAD>
<LINK REL="stylesheet" HREF="index.css">
</HEAD>
<BODY>
<IMG SRC="image/logo.png">
</BODY>
</HTML>


2.浏览器发出请求

GET /index.css HTTP/1.1

服务器返回响应

HTTP /1.1 200 OK
Date: Apr 11 2006 15:32:08 GMT
Server: Apache/2.0.46(win32)
Connection: Keep-alive, close
Content-Length: 70
Content-Type: text/plane


h3{

    font-size:20px;
    font-weight:bold;
    color:#005A9C;
}


3.浏览器发出请求

GET image/logo.png HTTP/1.1

服务器返回响应

HTTP /1.1 200 OK
Date: Apr 11 2006 15:32:08 GMT
Server: Apache/2.0.46(win32)
Connection: Keep-alive, close
Content-Length: 1280
Content-Type: text/plane


{Binary image data follows}



(附录)

1.HTTP规范:Internet工程制定组织(IETF)发布的RFC指定Internet标准,这些RFC被Internet研究发展机构广泛接受。因为它们是标准文档,故一般用正规语言编写,如立法文标一样。

2.RFC:RFC一旦被提出,就被编号且不会再改变,当一个标准被修改时,则给出一个新的RFC。作为标准,RFC在Internet上被广泛采用。

3.HTTP的几个重要RFC:
    RFC1945    HTTP 1.0 描述
    RFC2068    HTTP 1.1 初步描述

    RFC2616    HTTP 1.1 标准

4.资源标识符URI(Uniform Resource Identifter,URI)



HTTP参考

一、HTTP码应码

响应码由三位十进制数字组成,它们出现在由HTTP服务器发送的响应的第一行。

响应码分五种类型,由它们的第一位数字表示:

1.1xx:信息,请求收到,继续处理
2.2xx:成功,行为被成功地接受、理解和采纳
3.3xx:重定向,为了完成请求,必须进一步执行的动作
4.4xx:客户端错误,请求包含语法错误或者请求无法实现

5.5xx:服务器错误,服务器不能实现一种明显无效的请求

下表显示每个响应码及其含义:

100            继续
101            分组交换协
200            OK
201            被创建
202            被采纳
203            非授权信息
204            无内容
205            重置内容
206            部分内容
300            多选项
301            永久地传送
302            找到
303            参见其他
304            未改动
305            使用代理
307            暂时重定向
400            错误请求
401            未授权
402            要求付费
403            禁止
404            未找到
405            不允许的方法
406            不被采纳
407            要求代理授权
408            请求超时
409            冲突
410            过期的
411            要求的长度
412            前提不成立
413            请求实例太大
414            请求URI太大
415            不支持的媒体类型
416            无法满足的请求范围
417            失败的预期
500            内部服务器错误
501            未被使用
502            网关错误
503            不可用的服务
504            网关超时
505            HTTP版本未被支持


二、HTTP头标

头标由主键/值对组成。它们描述客户端或者服务器的属性、被传输的资源以及应该实现连接。

四种不同类型的头标:

1.通用头标:即可用于请求,也可用于响应,是作为一个整体而不是特定资源与事务相关联。
2.请求头标:允许客户端传递关于自身的信息和希望的响应形式。
3.响应头标:服务器和于传递自身信息的响应。
4.实体头标:定义被传送资源的信息。即可用于请求,也可用于响应。

头标格式:<name>:<value><CRLF>


下表描述在HTTP/1.1中用到的头标

Accept                         定义客户端可以处理的媒体类型,按优先级排序;

                                      在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept: image/jpeg,image/png,*/*

Accept-Charset        定义客户端可以处理的字符集,按优先级排序;

                                      在一个以逗号为分隔的列表中,可以定义多种类型和使用通配符。例如:Accept-Charset: iso-8859-1,*,utf-8

Accept-Encoding     定义客户端可以理解的编码机制。例如:Accept-Encoding:gzip,compress

Accept-Language    定义客户端乐于接受的自然语言列表。例如:Accept-Language: en,de

Accept-Ranges        一个响应头标,它允许服务器指明:将在给定的偏移和长度处,为资源组成部分的接受请求。

                                     该头标的值被理解为请求范围的度量单位。例如Accept-Ranges: bytes或Accept-Ranges: none

Age                              允许服务器规定自服务器生成该响应以来所经过的时间长度,以秒为单位。

                                     该头标主要用于缓存响应。例如:Age: 30

Allow                           一个响应头标,它定义一个由位于请求URI中的次源所支持的HTTP方法列表。例如:Allow: GET,PUT

AUTHORIZATION    一个响应头标,用于定义访问一种资源所必需的授权(域和被编码的用户ID与口令)。

                                     例如:Authorization: Basic YXV0aG9yOnBoaWw=

Cache-Control         一个用于定义缓存指令的通用头标。例如:Cache-Control: max-age=30

Connection               一个用于表明是否保存socket连接为开放的通用头标。例如:Connection: close或Connection: keep-alive

Content-Base           一种定义基本URI的实体头标,为了在实体范围内解析相对URLs。

                                     如果没有定义Content-Base头标解析相对URLs,使用Content-Location URI(存在且绝对)或使用URI请求。

                                     例如:Content-Base: Http://www.myweb.com

Content-Encoding   一种介质类型修饰符,标明一个实体是如何编码的。例如:Content-Encoding: zip

Content-Language   用于指定在输入流中数据的自然语言类型。例如:Content-Language: en

Content-Length        指定包含于请求或响应中数据的字节长度。例如:Content-Length:382

Content-Location      指定包含于请求或响应中的资源定位(URI)。
                                      如果是一绝。对URL它也作为被解析实体的相对URL的出发点。

                                      例如:Content-Location: http://www.myweb.com/news

Content-MD5             实体的一种MD5摘要,用作校验和。

                                      发送方和接受方都计算MD5摘要,接受方将其计算的值与此头标中传递的值进行比较。

                                      例如:Content-MD5: <base64 of 128 MD5 digest>

Content-Range         随部分实体一同发送;标明被插入字节的低位与高位字节偏移,也标明此实体的总长度。

                                     例如:Content-Range: 1001-2000/5000

Contern-Type           标明发送或者接收的实体的MIME类型。例如:Content-Type: text/html

Date                            发送HTTP消息的日期。例如:Date: Mon,10PR 18:42:51 GMT

ETag                           一种实体头标,它向被发送的资源分派一个唯一的标识符。

                                     对于可以使用多种URL请求的资源,ETag可以用于确定实际被发送的资源是否为同一资源。

                                     例如:ETag: "208f-419e-30f8dc99"

Expires                      指定实体的有效期。例如:Expires: Mon,05 Dec 2008 12:00:00 GMT

Form                           一种请求头标,给定控制用户代理的人工用户的电子邮件地址。例如:From: webmaster@myweb.com

Host                            被请求资源的主机名。对于使用HTTP/1.1的请求而言,此域是强制性的。例如:Host: www.myweb.com

If-Modified-Since      如果包含了GET请求,导致该请求条件性地依赖于资源上次修改日期。

                                      如果出现了此头标,并且自指定日期以来,此资源已被修改,应该反回一个304响应代码。

                                      例如:If-Modified-Since: Mon,10PR 18:42:51 GMT

If-Match                      如果包含于一个请求,指定一个或者多个实体标记。只发送其ETag与列表中标记区配的资源。

                                     例如:If-Match: "208f-419e-308dc99"

If-None-Match           如果包含一个请求,指定一个或者多个实体标记。资源的ETag不与列表中的任何一个条件匹配,操作才执行。

                                     例如:If-None-Match: "208f-419e-308dc99"

If-Range                     指定资源的一个实体标记,客户端已经拥有此资源的一个拷贝。必须与Range头标一同使用。

                                     如果此实体自上次被客户端检索以来,还不曾修改过,那么服务器只发送指定的范围,否则它将发送整个资源。

                                     例如:Range: byte=0-499<CRLF>If-Range:"208f-419e-30f8dc99"

If-Unmodified-Since    只有自指定的日期以来,被请求的实体还不曾被修改过,才会返回此实体。

                                     例如:If-Unmodified-Since:Mon,10PR 18:42:51 GMT

Last-Modified           指定被请求资源上次被修改的日期和时间。例如:Last-Modified: Mon,10PR 18:42:51 GMT

Location                     对于一个已经移动的资源,用于重定向请求者至另一个位置。

                                     与状态编码302(暂时移动)或者301(永久性移动)配合使用。

                                     例如:Location: http://www2.myweb.com/index.jsp

Max-Forwards         一个用于TRACE方法的请求头标,以指定代理或网关的最大数目,该请求通过网关才得以路由。

                                    在通过请求传递之前,代理或网关应该减少此数目。例如:Max-Forwards: 3

Pragma                     一个通用头标,它发送实现相关的信息。例如:Pragma: no-cache

Proxy-Authenticate    类似于WWW-Authenticate,便是有意请求只来自请求链(代理)的下一个服务器的认证。

                                    例如:Proxy-Authenticate: Basic realm-admin

Proxy-Proxy-Authorization    类似于授权,但并非有意传递任何比在即时服务器链中更进一步的内容。

                                    例如:Proxy-Proxy-Authorization: Basic YXV0aG9yOnBoaWw=

Public                         列表显示服务器所支持的方法集。例如:Public: OPTIONS,MGET,MHEAD,GET,HEAD

Range                        指定一种度量单位和一个部分被请求资源的偏移范围。例如:Range: bytes=206-5513

Refener                      一种请求头标域,标明产生请求的初始资源。对于HTML表单,它包含此表单的Web页面的地址。

                                     例如:Refener: http://www.myweb.com/news/search.html

Retry-After               一种响应头标域,由服务器与状态编码503(无法提供服务)配合发送,以标明再次请求之前应该等待多长时间。

                                     此时间即可以是一种日期,也可以是一种秒单位。例如:Retry-After: 18

Server                        一种标明Web服务器软件及其版本号的头标。例如:Server: Apache/2.0.46(Win32)

Transfer-Encoding  一种通用头标,标明对应被接受方反向的消息体实施变换的类型。例如:Transfer-Encoding: chunked

Upgrade                      允许服务器指定一种新的协议或者新的协议版本,与响应编码101(切换协议)配合使用。

                                      例如:Upgrade: HTTP/2.0

User-Agent                定义用于产生请求的软件类型(典型的如Web浏览器)。

                                     例如:User-Agent: Mozilla/4.0(compatible; MSIE 5.5; Windows NT; DigExt)

Vary                            一个响应头标,用于表示使用服务器驱动的协商从可用的响应表示中选择响应实体。例如:Vary: *

Via                               一个包含所有中间主机和协议的通用头标,用于满足请求。例如:Via: 1.0 fred.com, 1.1 wilma.com

Warning                     用于提供关于响应状态补充信息的响应头标。例如:Warning: 99 www.myweb.com Piano needs tuning

www-Authenticate     一个提示用户代理提供用户名和口令的响应头标,与状态编码401(未授权)配合使用。响应一个授权头标。

                                   例如:www-Authenticate: Basic realm=zxm.mgmt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/402026.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Shell 脚本中如何使用make命令

最近开发的项目中需要编写Shell脚本对整个工程进行自动化编译&#xff0c;即在Shell脚本中使用make命令来进行编译&#xff0c;下面回顾一下Shell脚本中如何使用make命令&#xff09; 在开发一个系统时&#xff0c;一般是将一个系统分成几个模块&#xff0c;这样做提高了系统的…

Shell 脚本知识回顾 (六) —— Shell 函数

一、Shell函数&#xff1a;Shell函数返回值、删除函数、在终端调用函数 函数可以让我们将一个复杂功能划分成若干模块&#xff0c;让程序结构更加清晰&#xff0c;代码重复利用率更高。像其他编程语言一样&#xff0c;Shell 也支持函数。Shell 函数必须先定义后使用。 Shell 函…

Shell 脚本知识回顾 (五) —— Shell 循环

一、Shell for循环 与其他编程语言类似&#xff0c;Shell支持for循环。 for循环一般格式为&#xff1a;for 变量 in 列表 docommand1command2...commandN done 列表是一组值&#xff08;数字、字符串等&#xff09;组成的序列&#xff0c;每个值通过空格分隔。每循环一次&…

Shell 脚本知识回顾 (四) —— Shell 命令及Shell 相关语句

一、Shell echo命令 echo是Shell的一个内部指令&#xff0c;用于在屏幕上打印出指定的字符串。命令格式&#xff1a;echo arg您可以使用echo实现更复杂的输出格式控制。 显示转义字符 echo "\"It is a test\""结果将是&#xff1a;"It is a test"…

Shell 脚本知识回顾 (三) —— 替换、运算符、字符串、数组

一、Shell替换&#xff1a;Shell变量替换&#xff0c;命令替换&#xff0c;转义字符 如果表达式中包含特殊字符&#xff0c;Shell 将会进行替换。例如&#xff0c;在双引号中使用变量就是一种替换&#xff0c;转义字符也是一种替换。 举个例子&#xff1a; [cpp] view plaincop…

Shell 脚本知识回顾 (二) —— Shell变量

一、Shell变量&#xff1a;Shell变量的定义、删除变量、只读变量、变量类型 Shell支持自定义变量。定义变量 定义变量时&#xff0c;变量名不加美元符号&#xff08;$&#xff09;&#xff0c;如&#xff1a; [cpp] view plaincopy variableName"value" 注意&…

Shell 脚本知识回顾 (一) —— 基础篇

一、Shell简介&#xff1a;什么是Shell&#xff0c;Shell命令的两种执行方式 Shell本身是一个用C语言编写的程序&#xff0c;它是用户使用Unix/Linux的桥梁&#xff0c;用户的大部分工作都是通过Shell完成的。Shell既是一种命令语言&#xff0c;又是一种程序设计语言。作为命令…

红帽集群RHCS

1、简介&#xff1a;RHCS是RedHatClusterSuite的缩写&#xff0c;也就是红帽子集群套件&#xff0c;RHCS是一个能够提供高可用性、高可靠性、负载均衡、存储共享且经济廉价的集群工具集合&#xff0c;它将集群系统中三大集群架构融合一体&#xff0c;可以给web应用、数据库应用…

Java 基础——数组解析

数组对于每一门编辑应语言来说都是重要的数据结构之一&#xff0c;当然不同语言对数组的实现及处理也不尽相同。 Java语言中提供的数组是用来存储固定大小的同类型元素。 可以声明一个数组变量&#xff0c;如numbers[100]来代替直接声明100个独立变量number0&#xff0c;number…

《在你身边,为你设计》-哪位知道下载、在线阅读地址啊?

《在你身边&#xff0c;为你设计》-前端UI必读出自腾讯CDChttp://cdc.tencent.com/?p6761今天听同事说这本书写的非常好&#xff0c;改变了他关于前端UI的许多看法&#xff0c;可谓&#xff1a;醍醐灌顶。可惜我网上找了下都需要Money买&#xff0c;哪位有在线阅读、PDF下载地…

一、OpenStack架构

DashBoardHorizon提供WEB界面ComputerNova计算也就是虚拟机NetworkingNeutron提供给nova网络支持Object StorageSwift提供对象存储Block StorageCinder提供云硬盘给nova&#xff0c;同时备份到SwiftIdentity SserviceKeystone提供所有组件的认证Image ServiceGlance提供给nova镜…

Java 三大特性 —— 多态

Java中多态性的实现 一、什么是多态 1.面向对象的三大特性&#xff1a;封装、继承、多态。从一定角度来看&#xff0c;封装和继承几乎都是为多态而准备的。这是我们最后一个概念&#xff0c;也是最重要的知识点。 2.多态的定义&#xff1a;指允许不同类的对象对同一消息做出响应…

linux /proc/cpuinfo文件分析

为什么80%的码农都做不了架构师&#xff1f;>>> 基于不同指令集&#xff08;ISA&#xff09;的CPU产生的/proc/cpuinfo文件不一样&#xff0c;基于X86指令集CPU的/proc/cpuinfo文件包含如下内容&#xff1a; processor  &#xff1a; 0vendor_id  &#xff1a;…

Java 高级类(下) —— 内部类和匿名类

Java内部类&#xff08;Inner Class&#xff09;&#xff0c;类似的概念在C里也有&#xff0c;那就是嵌套类&#xff08;Nested Class&#xff09;&#xff0c;乍看上去内部类似乎有些多余&#xff0c;它的用处对于初学者来说可能并不是那么显著&#xff0c;但是随着对它的深入…

Java 高级类(上) —— 抽象类和接口

在面向对象的概念中&#xff0c;我们知道所有的对象都是通过类来描绘的&#xff0c;但是并不是所有的类都是用来描绘对象的&#xff0c;如果一个类中没有包含足够的信息来描绘一个具体的对象&#xff0c;这样的类就是抽象类。 抽象类往往用来表征我们在对问题领域进行分析、 设…

【Git入门之五】版本管理

2019独角兽企业重金招聘Python工程师标准>>> 1.版本回退 我们先看一下从项目开始到现在做了什么操作。 [cpp] view plaincopy #总共是4个操作 $ git log --prettyoneline c5c83cfcdb25c67a5c66b4fe3844d0ea912830ec remove JackyData03 a25c58804cb3f4045564fc0e…

Java 进阶——单例模式

一、单例模式概念及特点 Java中单例模式是一种常见的设计模式&#xff0c;单例模式分三种&#xff1a;懒汉式单例、饿汉式单例、登记式单例三种。 单例模式有一下特点&#xff1a; 1、单例类只能有一个实例。 2、单例类必须自己自己创建自己的唯一实例。 3、单例类必须给所有其…

Java 关键字—— static 与 final

static表示“全局”或者“静态”的意思&#xff0c;用来修饰成员变量和成员方法&#xff0c;也可以形成静态static代码块&#xff0c;但是Java语言中没有全局变量的概念。 被static修饰的成员变量和成员方法独立于该类的任何对象。也就是说&#xff0c;它不依赖类特定的实例&am…

Java 三大特性之——继承

继承(inheritance)是面向对象的重要概念。继承是除组合(composition)之外&#xff0c;提高代码重复可用性(reusibility)的另一种重要方式。我们在组合(composition)中看到&#xff0c;组合是重复调用对象的功能接口。我们将看到&#xff0c;继承可以重复利用已有的类的定义。 类…

基于Linux的 Open×××网络之网络架构应用实例

基于Linux的 Open网络之网络架构应用实例Open 概述Open 是一个开源的加密隧道构建工具&#xff0c;基于 OpenSSL 的 SSL/TLS 协议&#xff0c;可以在 Internet中实现点对点的 SSL 安全连接。使用 Open 的好处是安全、易用和稳定&#xff0c;且认证方式灵活&#xff0c;具备实现…