1.HTTP协议简介
(1)客户端连上web服务器后,若想获得web服务器中的某个web资源,需遵守一定的通讯格式,HTTP协议用于定义客户端与web服务器通迅的格式。
(2)HTTP是hypertext transfer protocol(超文本传输协议)的简写,它是TCP/IP协议的一个应用层协议,用于定义WEB浏览器与WEB服务器之间交换数据的过程。
(3)HTTP使用请求-响应的方式进行传输,一个请求对应一个响应,并且请求只能是由客户端发起的。
(4)HTTP协议的版本:HTTP/1.0、HTTP/1.1
两个版本的区别:
在HTTP1.0协议中,客户端与web服务器建立连接后,只能获得一个web资源。
HTTP1.1协议,允许客户端与web服务器建立连接后,在一个连接上获取多个web资源。
2.HTTP请求
客户端连上服务器后,向服务器请求某个web资源,称之为客户端向服务器发送了一个HTTP请求。一个完整的HTTP请求包括:一个请求行、若干请求头、以及实体内容。
例:
2.1 HTTP请求行
请求行:GET /books/java.html HTTP/1.1
GET:请求方式。
/books/java.html :请求的资源
HTTP/1.1 :请求协议
请求行中的请求方式有7种,下表为各请求方式的简要介绍。
方法 | 意义 |
---|---|
OPTION | 请求一些选项的信息 |
GET | 向服务器请求某种WEB资源 |
HEAD | 请求读取由URL所标志的信息的首部 |
POST | 向服务器请求某种WEB资源 |
PUT | 在指明的URL下存储一个文档 |
DELETE | 删除指明的URL下所标志的资源 |
TRACE | 用来进行环回测试的请求报文 |
CONNECT | 用于代理服务器 |
请求方式总共有7种,但是最常用的有两种,即 GET 和 POST。
不管POST或GET,都用于向服务器请求某个WEB资源,这两种方式的区别主要表现在数据传递上:
GET
如请求方式为GET方式,则可以在请求的URL地址后以?的形式带上交给服务器的数据,多个数据之间以&进行分隔。
例如:
GET /mail/1.html?name=abc&password=xyz HTTP/1.1
GET方式的特点:在URL地址后附带的参数是有限制的,其数据容量通常不能超过1K。POST
如请求方式为POST方式,则可以在请求的实体内容中向服务器发送数据。
Post方式的特点:传送的数据量无限制。
注:若用户如没有设置,默认情况下浏览器向服务器发送的都是get请求
2.2 HTTP消息头
用于HTTP请求中的常用头
Accept: text/html,image/* //浏览器可以接受哪种格式的数据
Accept-Charset: ISO-8859-1 //浏览器接受数据可以采用的编码集
Accept-Encoding: gzip,compress* //浏览器可以接受的数据压缩格式*
Accept-Language: en-us,zh-cn //浏览器所在的语言环境
Host: www.baidu.com:80 //浏览器所要访问的区域
If-Modified-Since: Tue, 11 Jul 2000 18:23:51 GMT //与缓存相关的头
Referer: http://www.baidu.com/index.html //表示当前访问的web资源的连接来自何处,与防盗链有关
User-Agent: Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0) 浏览器所在的环境信息
Cookie //会话相关的头
Connection: close/Keep-Alive //这次请求结束后是否要接着保持连接
Date: Tue, 11 Jul 2000 18:23:51 GMT //当前时间
3.HTTP响应
一个HTTP响应代表服务器向客户端回送的数据,它包括:
一个状态行、若干响应头(消息头)、以及实体内容
例:
3.1 HTTP状态行
格式:格式: HTTP版本号 状态码 原因叙述
举例: HTTP/1.1 200 OK
其中状态码用于表示服务器对请求的处理结果,它是一个三位的十进制数。响应状态码分为5类,如下所示:
状态码 | 含义 |
---|---|
100~199 | 表示成功接收请求,要求客户端继续提交下一次请求才能完成整个处理过程 |
200~299 | 表示成功接收请求并已完成整个处理过程,常用200 |
300~399 | 为完成请求,客户需进一步细化请求。例如,请求的资源已经移动一个新地址,常用302、307和304 |
400~499 | 客户端的请求有错误,常用404 |
500~599 | 服务器端出现错误,常用 500 |
常用的状态码有:
200:表示请求处理成功。
302:表示请求重定向。
304/307:表示通知浏览器再次请求的资源没有更改,请使用浏览器缓存中的资源。
404:表示请求的资源没有找到。
500:表示服务器端出错。
3.2 HTTP常用响应头
Location: http://www.baidu.com.index.html //配合302响应码实现请求重定向
Server:apache tomcat //服务器的基本信息
Content-Encoding: gzip //服务器发送数据时使用的压缩格式
Content-Length: 80 //发送数据的大小
Content-Language: zh-cn //发送数据时使用的语言环境
Content-Type: text/html; charset=GB2312 //当前所发送的数据的基本信息(数据类型,所使用的编码)
Last-Modified: Tue, 11 Jul 2000 18:23:51 GMT //与缓存相关
Refresh: 1;url=http://www.baidu.com
//通过浏览器进行定时刷新,此值可以是一个数字指定多长时间以后刷新当前页面,这个数字之后也可以接一个分号跟一个URL地址指定多长时间后跳转到该URL地址
Content-Disposition: attachment;filename=aaa.zip //与下载相关
Transfer-Encoding: chunked
传输数据类型,如果此值为chunked,说明当前的数据是一块一块传输的。
Set-Cookie:SS=Q0=5Lb_nQ; path=/search //与Cookie会话相关
ETag: W/”83794-1208174400000” //和缓存机制相关
Expires: -1 //指定资源缓存的时间,如果取值为0或-1浏览器就不缓存资源。
Cache-Control: no-cache //与缓存相关,如果为no-cache则通知浏览器不缓存
Pragma: no-cache //与缓存相关,如果为no-cache则通知浏览器不缓存
Connection: close/Keep-Alive //是否保持连接
Date: Tue, 11 Jul 2000 18:23:51 GMT //当前时间