解读HTTP包

解读HTTP包:[摘要]详细介绍HTTP包的格式、协议内容及相关的处理方法,内容分3节:1、超文本传输协议及HTTP包;2、Socket类与ServerSocket类;3、读取HTTP包。

一、超文本传输协议及HTTP包
HTTP协议用于在Internet上发送和接收消息。HTTP协议是一种请求-应答式的协议——客户端发送一个请求,服务器返回该请求的应答,所有的请求与应答都是HTTP包。HTTP协议使用可靠的TCP连接,默认端口是80。HTTP的第一个版本是HTTP/0.9,后来发展到了HTTP/1.0,现在最新的版本是HTTP/1.1。HTTP/1.1由RFC 2616 定义。

在HTTP中,Client/Server之间的会话总是由客户端通过建立连接和发送HTTP请求包初始化,服务器不会主动联系客户端或要求与客户端建立连接。浏览器和服务器都可以随时中断连接,例如,在浏览网页时你可以随时点击"停止"按钮中断当前的文件下载过程,关闭与Web服务器的HTTP连接。

1 HTTP请求包
HTTP请求包(GET、POST等请求方法)由三个部分构成,分别是:方法-URI-协议/版本,请求头,请求正文。下面是一个HTTP请求包(GET)的例子:

GET /index.jsp HTTP/1.1
Accept-Language: zh-cn
Connection: Keep-Alive
Host: 192.168.0.106
Content-Length: 37

userName=new_andy&password=new_andy


请求包的第一行是方法-URI-协议/版本:
GET就是请求方法,根据HTTP标准,HTTP请求可以使用多种请求方法。HTTP 1.1支持七种请求方法:GET、POST、HEAD、OPTIONS、PUT、delete和TRACE等,常用的为请求方法是GET和POST。

/index.jsp 表示URI。URI指定了要访问的网络资源。
HTTP/1.1是协议和协议的版本。
最后一行userName=new_andy& amp;password=new_andy为正文,正文与HTTP头部有一个空行(\r\n)分隔。这里需要说明的一点,其中Content- Length说明正文的长度,有的正文长度没有在头部说明,只是标明Transfer-Encoding: chunked。关于chunked类型的长度计算方法,见RFC 1626。
请求包的头部还会包含许多有关客户端环境和请求正文的有用信息,这里不再描述。

2 HTTP应答包
和HTTP请求包相似,由三个部分构成,分别是:协议-状态代码-描述,应答头,应答正文。下面是一个HTTP应答的例子:

HTTP/1.1 200 OK
Server: Microsoft-IIS/4.0
Date: Mon, 3 Jan 2005 13:13:33 GMT
Content-Type: text/html
Last-Modified: Mon, 11 Jan 2004 13:23:42 GMT
Content-Length: 90

<html>
<head>
<title> 解读HTTP包示例</title></head><body>
Hello WORLD!
</body>
</html>


HTTP应答包的第一行类似于HTTP请求的第一行,表示所用的协议是HTTP 1.1,服务器处理请求的状态码200。
应答头也和请求头一样包含许多有用的信息,例如服务器类型、日期时间、内容类型和长度等。应答的正文就是服务器返回的HTML页面。应答头和正文之间也用 CRLF分隔。

二、Socket类与ServerSocket类
在Java中,通信端点由java.net.Socket类(客户端)或java.net.ServerSocket类(服务器端)表示。应用程序通过端点向网络发送或从网络读取数据。位于两台不同机器上的应用软件通过网络连接发送和接收字节流,从而实现通信。要把HTTP包发送给另一个应用,首先要知道对方的IP地址以及其通信端点的端口号。

Socket类代表的是客户端,它是一个连接远程服务器应用时临时创建的端点。
ServerSocker类代表的是服务器端,它启动后等待来自客户端的连接请求;一旦接收到请求,ServerSocket创建一个Socket实例来处理与该客户端的通信。对于服务器应用,我们不知道客户端应用什么时候会试图连接服务器,服务器必须一直处于等待连接的状态。

下面是ServerSocket提供了四个构造函数,常用的构造函数的的一种形式为:

public ServerSocket(int port, int backLog, InetAddress bindingAddress);


参数:port指定服务器端监听客户端的端口;
backlog为连接请求的最大队列长度,一旦超越这个长度,服务器端点开始拒绝客户端的连接请求。
bindingAddress是一个java.net.InetAddress的实例,指定绑定IP地址。
创建好 ServerSocket实例之后,调用它的accept方法,要求它等待传入的连接请求。只有出现了连接请求时,accept方法才会返回,它的返回值是一个Socket类的实例。随后,这个Socket对象就可以用来与客户端应用通信。

Socket类有许多构造函数,常用的为:

public Socket(String host, int port)。


参数是主机名称(IP地址或域名)和端口号。
参数host是远程机器的名字或IP地址,port是远程应用的端口号。
成功创建了Socket类的实例之后,我们就可以用它来发送和接收字节流形式的数据,数据一般为HTTP包。

要发送字节流,首先要调用 Socket类的getOutputStream方法获得一个java.io.OutputStream对象;要从连接的另一端接收字节流,首先要调用 Socket类的getInputStream方法获得一个java.io.InputStream对象。

下面的代码片断创建一个与本地HTTP服务器(127.0.0.1代表本地主机的IP地址)通信的Socket,发送一个HTTP请求包,准备接收服务器的应答。

Socket socket = new Socket("127.0.0.1", "80");
OutputStream os = socket.getOutputStream();
InputStream ins = socket.getInputStream();
StringBuffer sb=new StringBuffer();
sb.append("GET /index.jsp HTTP/1.1\r\n");//注意\r\n为回车换行
sb.append("Accept-Language: zh-cn\r\n");
sb.append("Connection: Keep-Alive\r\n");
sb.append("Host: 192.168.0.106\r\n");
sb.append("Content-Length: 37\r\n");
sb.append("\r\n");
sb.append("userName=new_andy&password=new_andy\r\n");
sb.append("\r\n");

// 向Web服务器发送一个HTTP请求包
os.write(sb.toString().getBytes());

服务器端的代码在大致结构为:
while (!shutdown) {
Socket socket = null;
try {
socket = serverSocket.accept(); //等待客户以送HTTP请求包
// 创建HTTP请求包处理线程
RequestThread request = new RequestThread(socket);
request.start();
if(shutdown) System.exit(0);
}
catch (Exception e) {
e.printStackTrace();
}
}



RequestThread线程分析HTTP请求包,跟根据请求包内容在服务端生成一个HTTP应答包。下一节说明怎样分析 HTTP包。
InputStream input = socket.getInputStream(); //从此字节数据流获得HTTP请求包内容
OutputStream output= socket.getOutputStream(); //向此字节流写入HTTP应答包内容

三、读取HTTP包
以下是一个读取HTTP包的类 SocketRequest。

public class SocketRequest { //从指定的Socket的InputStream中读取数据

private InputStream input;
private String uri;
private StringBuffer request = new StringBuffer(); //用于保存所有内容
private int CONTENT_LENGTH = 0; //实际包内容数据长
private boolean bePost = false;
private boolean beHttpResponse = false;
private boolean beChucked = false;
private boolean beGet = false;
private byte crlf13 = (byte) 13; //'\r'
private byte crlf10 = (byte) 10; //'\n'

public SocketRequest(InputStream input) {
this.input = input;
}

public SocketRequest(Socket socket) {
this.input = socket.getInputStream();
}

public void ReadData() { //解析 获得InputStream的数据

ReadHeader(); //头部

if (beChucked) { //为Chucked
int ChuckSize = 0;
while ((ChuckSize = getChuckSize()) > 0) { //多个Chucked
readLenData(ChuckSize + 2); //读取定长数据
}
readLenData(2); //最后的2位
}

if (CONTENT_LENGTH > 0) {
readLenData(CONTENT_LENGTH); //读取定长数据
}

uri = ""; //parseUri(new String(request));
}

private void readLenData(int size) { //读取定长数据
int readed = 0; //已经读取数
try {
int available = 0; //input.available(); //可读数
if (available > (size - readed)) {
available = size - readed;
} while (readed < size) {
while (available == 0) { //等到有数据可读
available = input.available(); //可读数
}
if (available > (size - readed)) {
available = size - readed; //size-readed--剩余数
}
if (available > 2048) {
available = 2048; //size-readed--剩余数
}
byte[] buffer = new byte[available];
int reading = input.read(buffer);
request = request.append(new String(buffer, 0, reading)); //byte数组相加
readed += reading; //已读字符
}
} catch (IOException e) {
System.out.println("Read readLenData Error!");
}
}

private void ReadHeader() { //读取头部 并获得大小
byte[] crlf = new byte[1];
int crlfNum = 0; //已经连接的回车换行数 crlfNum=4为头部结束
try {
while (input.read(crlf) != -1) { //读取头部
if (crlf[0] == crlf13 || crlf[0] == crlf10) {
crlfNum++;
} else {
crlfNum = 0;
} //不是则清
request = request.append(new String(crlf, 0, 1)); //byte数组相加
if (crlfNum == 4) {
break;
}
}
} catch (IOException e) {
System.out.println("Read Http Header Error!");
return;
}

String tempStr = (new String(request)).toUpperCase();

//这里我只处理了GET与POST方法
String strMethod = tempStr.substring(0, 4);
if (strMethod.equals("GET ")) { //前
beGet = true;
} else if (strMethod.equals("POST")) {
bePost = true;
getContentlen_Chucked(tempStr);
} else {
System.out.println(" 不支持的HTTP包类型");

} //其它的其它类型 暂不支持
}

private void getContentlen_Chucked(String tempStr) { //获得长度 CONTENT-LENGTH 或 是否为CHUNKED型
String ss1 = "CONTENT-LENGTH:";
String ss2 = new String("TRANSFER-ENCODING: CHUNKED");

int clIndex = tempStr.indexOf(ss1);
int chuckIndex = tempStr.indexOf(ss2); //为CHUNKED型
byte requst[] = tempStr.getBytes();
if (clIndex != -1) { //从clIndex+1起至\r\n
StringBuffer sb = new StringBuffer();

for (int i = (clIndex + 16); ; i++) {
if (requst[i] != (byte) 13 && requst[i] != (byte) 10) {
sb.append((char) requst[i]);
} else {
break;
}
}

CONTENT_LENGTH = Integer.parseInt(sb.toString()); //正式的HTML文件的大小
//System.out.println("CONTENT_LENGTH== "+CONTENT_LENGTH);
}
if (chuckIndex != -1) {
beChucked = true;
}
}

private int getChuckSize() { //Chuck大小
byte[] crlf = new byte[1];
StringBuffer sb1 = new StringBuffer();

int crlfNum = 0; //已经连接的回车换行数 crlfNum=4为头部结束

try {
while (input.read(crlf) != -1) { //读取头部
if (crlf[0] == crlf13 || crlf[0] == crlf10) {
crlfNum++;
} else {
crlfNum = 0;
} //不是则清
sb1.append((char) crlf[0]);
request = request.append(new String(crlf, 0, 1)); //byte数组相加
if (crlfNum == 2) {
break;
}
}
} catch (IOException e) {
System.out.println("Read Http Package Error!");
return 0;
}

return Integer.parseInt((sb1.toString()).trim(), 16); //16进控制
}

//通过此来进行过滤,是否为发至目标服务器的HTTP包
private String parseUri(String requestString) {
int index1, index2;
index1 = requestString.indexOf(' ');
if (index1 != -1) {
index2 = requestString.indexOf(' ', index1 + 1);
if (index2 > index1) {
return requestString.substring(index1 + 1, index2);
}
}
return null;
}

public String getData() {
return request.toString();
}
}



使用此类:
SocketRequest request = new SocketRequest(socket); //socket为ServerSocket.accept()返回的Socket实例
request.ReadData(); //读取数据
request.getData();

为什么我要用这么大的力量去读取呢,尤其是在因为Socket连接在发送数据时,由于网络的原因经常会发生延迟现象,可能在服务器端开始接收数据时可能只有部分数据可以从InputStream中获得,在一些地方处理不当时,可能只能获得不完整的数据或是错误的数据。

从 InputStream读取字节时有多种办法:
常用int read()与int read(byte[] b)。在用read(byte[])时,程序员经常会犯错误,因为在网络环境中,读取的数据量不一定等于参数的大小。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/436463.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

几个颇有创意的网站推广方法(推荐)

几个颇有创意的网站推广方法(推荐)元旦佳节&#xff0c;相信有不少朋友从QQ、MSN、E-mail里收到了亲友发来的贺卡&#xff0c;其中流传得比较多的是几张比较有创意的图片&#xff0c;他们都只需要在链接里输入你想祝福的人的名字&#xff0c;然后该文字会出现在图片中去&#x…

明光市机器人_“柠檬皮”软体机器人!26岁小伙联合发明光磁场机器人|专访...

会行走、能搬货&#xff0c;还会 “跳街舞”。近日&#xff0c;美国西北大学发明出一款软体机器人&#xff0c;该机器人看起来像一只剥开的柠檬皮&#xff0c;它能在水箱中运动&#xff0c;并拥有多种本领&#xff0c;比如搬运物品、催化化学反应、输送治疗剂等&#xff0c;而它…

【转】SD-WAN,到底是什么*****

作为一个热门概念&#xff0c;SD-WAN近年以来频繁地出现在我们的视野当中。 很多人说&#xff0c;它是未来最具发展潜力的通信技术之一&#xff0c;极具商业价值。 行业里的老牌通信设备商和运营商对它一致看好&#xff0c;新兴创业企业也把它视为千载难逢的风口机遇&#xff0…

超文本传输协议及HTTP包

HTTP协议用于在Internet上发送和接收消息。HTTP协议是一种请求-应答式的协议 ——客户端发送一个请求&#xff0c;服务器返回该请求的应答&#xff0c;所有的请求与应答都是HTTP包。HTTP协议使用可靠的TCP连接&#xff0c;默认端口是80。HTTP的第一 个版本是HTTP/0.9&#xff0…

ffmpeg 截图太模糊了_PPT图片模糊?导师说放大!

今日分享图片智能放大●●●●重庆大学PPT图片太模糊了&#xff0c;要用原图&#xff01;放大&#xff0c;放大导师如是说&#xff0c;小硕表示&#xff0c;图片本就这样这咋办&#xff1f;不愁&#xff0c;稳住接着看在做PPT时还是做论文时想用某张图片&#xff0c;但是直接拉…

【转】全了!临港四镇最新对口地段小学,中学都在这里,看看你的孩子能读哪个学校

临港的家长们关于自己的孩子就读哪个学校&#xff0c;家长们一直都很关心和关注&#xff0c;每个家长对孩子的教育很是重视&#xff0c;有部分家长买临港的房子就冲着学区去的&#xff0c;临港的优质教育资源一直是被居民所称赞的&#xff0c;学校也没家长失望&#xff0c;个别…

状态栏显示时间代码

状态栏显示时间代码 <html><head><title>网页特效|Linkweb.cn/Js|---状态栏滚动时间</title></head><body>请看状态栏<BR><!--将以下代码加入HTML的<Body></Body>之间--> <SCRIPT languageJavaScript>var o…

WINCE驱动程序快速入门

有人也许和我一样比较心急&#xff0c;想尽快知道如何去写一个具体的驱动程序&#xff0c;这里&#xff0c;假设您对驱动程序已经有比较好的了解&#xff0c;告诉大家一个快速上路的方法。当然&#xff0c;如果您有足够的时间我建议在动手之前还是深入了解一下CE整个系统架构。…

【转】Azure Az-900认证 04——-考取AZ900所有知识点总结--获取证书!

结合最近所做的模拟题&#xff0c;把一些容易考的知识和概念重新回顾记录一下。标红的字要注意一下&#xff0c;有可能这几个简单的字&#xff0c;就是最能概括这个概念的关键点&#xff0c;个人在回顾的时候把这些点红色标出来了&#xff0c;会在题干中以不同的案例形式来考察…

怎么用vc采集ni卡数据_8bit,200MS/s 低成本模拟输入高速采集卡FCFR-PCI9850

FCFR-PCI98508bit,200MS/s 低成本模拟输入高速采集卡FCFR-PCI9850&#xff08;简称PCI9850&#xff09;是低成本高速数字化化仪&#xff0c;AD分辨率8bit&#xff0c;AD采样率200MS/s&#xff0c;硬件FIFO缓存32M字节&#xff0c;采集卡支持50MS/s的高速连续采集&#xff0c;触…

网站程序安全分析器 VB源码

本程序通杀:ASP ASPX PHP CGI JSP VBS 等脚本WebShell并能查出99%加密过的脚本WebShell后来发现..精度越高误杀越高...基本做到宁误扫三千不放过1马~其实是利用串判断.原理很简单.有很多人向偶要代码.想到人家ScanWebshell都贡献出来了~偶要是不贡献出来就不厚道咯.以下是全部代…

S3C6410启动模式介绍

目前的ARM处理器都支持多种启动模式&#xff0c;S3C6410和以前的Samsung的ARM处理器一样&#xff0c;通过外部管脚OM[4:0]的拉高拉低来决定是从哪个存储设备上启动。我认为S3C6410的User Manual并没有说的很清楚&#xff0c;所以我在最开始使用的时候&#xff0c;也对其启动模式…

如何用木板做桥_如何辨别使用的公园椅是否需要保养

如何辨别使用的公园椅存在哪些问题新城市公园椅小编与您分享&#xff0c;每一项事物都会有它的使用寿命&#xff0c;公园椅也不例外。公园椅使用有几年后后&#xff0c;我们通过公园椅的哪些表现来发现公园椅存在哪些隐患呢&#xff1f;通过观察、触摸、按压这三种方式来发现公…

密码学概述

时间点&#xff1a; 公元前400年&#xff0c;希腊人发明了置换密码&#xff1b; 1881年&#xff0c;世界上第一个电话保密专利出现&#xff1b; 二战期间&#xff0c;德国军方启用“恩尼格玛”密码机&#xff1b; 1976年&#xff0c;由于对称加密算法已经不能满足需要&#…

【转】关于医疗术语 CT,MR,DR,CR,DSA 等

医疗术语解释&#xff1a; Digital Radiography (CR, DX) &#xff1a;数字X线摄影 Mammography (MG)&#xff1a;乳房X射线照相术 Computed Tomography (CT)&#xff1a;计算机断层扫描 Magnetic Resonance (MR)&#xff1a;磁共振 Positron Emission Tomography PET-CT …

c语言删除文件remove_Python中的文件和目录操作

对于文件和目录的处理&#xff0c;虽然可以通过操作系统命令来完成&#xff0c;但是Python语言为了便于开发人员以编程的方式处理相关工作&#xff0c;提供了许多处理文件和目录的内置函数。重要的是&#xff0c;这些函数无论是在Unix、Windows还是Macintosh平台上&#xff0c;…

漏洞:Client ReDos From Regex Injection

漏洞描述&#xff1a; 扫描漏洞如下&#xff1a;代码&#xff1a; // In IE6, the hash fragment and search params are incorrect if the // fragment contains ?. getSearch: function() { var match this.location.href.replace(/#.*/, ).match(/\?./); …

【转】mysql 、oracle中char和varchar以及varchar2的区别

mysql char是固定长度&#xff0c;varchar是可变长度的&#xff0c;varchar2是oracle特有的。 char定长存储&#xff0c;速度快&#xff0c;但是存在一定空间的资源浪费,适用于存储字段不是很大、对速度要求高的场合。速度快是因为在物理上是按照定长存储的&#xff0c;这样就…

WinCE Boot方式及 Bootloader架构概述

Bootloader的概念就是一个用于引导的loader&#xff0c;在系统上电的时候最先被运行&#xff0c;然后对硬件平台做最基本的初始化&#xff0c;最后把操作系统加载起来。不同的嵌入式操作系统都有自己的Bootloader&#xff0c;但是本质功能都是一样的。 在WinCE中用的最多的就是…

静物摄影用光技巧_摄影技巧:摄影如何用光?摄影大师总结的10点,非常受用!...

点击上方蓝字关注「摄影技巧入门教程」ID&#xff1a;sheying116找到右上角点击?... 设为星标/置顶 丨摄影技巧丨丨摄影入门丨丨摄影教程丨丨摄影图片丨摄影技巧&#xff1a;光线的运用在摄影中至关重要&#xff0c;但很多摄影新手却不知道该如何用光&#xff0c;今天我们就来…