Linux网络编程——HTTP协议的理解与运用

目录

前言

一、认识URL

二、认识HTTP样例

三、HTTP的报头内容

1.url

2. Content-Type

3.Method 方法

1.GET方法 

2.POST方法 

4、状态码

5.cookie和session


前言

我们知道,协议就是一种约定,客户端与服务端统一的用这种约定进行传输数据。我们也进行了自定义协议的序列化与反序列化,了解到了协议是如何进行约定的。今天我们来学习一下被广泛运用的应用层协议——HTTP(超文本传输协议)

一、认识URL

在我们访问别人的网站时,通常会输入网址或者点击别人的链接(跳转到该网址)进行访问,我们平时说的网址也就是url

比如说百度的链接如下,https为他的协议方案名,比http多了加密,www.baidu.com为他的服务器地址(也是域名),会通过DNS域名解析将该域名转化为一个IP地址,"/"为访问他的web根目录。

https://www.baidu.com/

再比如说我们百度搜索caixukun,就会访问到"/s目录","?"后面就可以带参数了,"wd=caixunkun"为我们的搜索内容,"&"后面又跟着很多参数

https://www.baidu.com/s?wd=caixukun&rsv_spt=1&rsv_iqid=0xa125eeac0124f4d8&issp=1&f=8&rsv_bp=1&rsv_idx=2&ie=utf-8&rqlang=cn&tn=baiduhome_pg&rsv_enter=1&rsv_dl=tb&oq=%25E8%2594%25A1%25E5%25BE%2590%25E5%259D%25A4&rsv_btype=t&inputT=1356&rsv_t=30ce7B8KPAgBA5MzP%2Fj0%2Bouk7Tznt866T6e0B%2Fv5EUHIzUkxc34g%2BwyPnOzHtYLvNupJ&rsv_pq=b89a996d00b45a5c&rsv_sug3=38&rsv_sug1=22&rsv_sug7=100&rsv_sug2=0&rsv_sug4=1356&rsv_sug=1

因此,我们平时访问网站,本质上就是在进行进程间通信,只不是是跨网络的,通过域名转化为IP地址,端口号是协议默认的。

二、认识HTTP样例

如下是一个http请求样例,有  请求行、请求报头、空行、请求参数(请求参数可以为空)

GET 为http请求方法  / 为请求资源的目录(这是web更目录)  HTTP/1.1是http协议版本。

请求报头中的内容我们暂时不管,等第三章来看,这里只是了解一下http的样子。

对于http协议,请求报头是按 "\r\n" 做结尾的,因此可以通过读取到空行的"\r\n"表示读完了请求报头。而正文(请求参数)的读取完毕,是在请求报头中有一个参数Content_Length来表示正文的长度,知道了长度之后,再拿着这个长度去读正文,读到了这个长度表示正文读取完毕。

反序列化也是按照"\r\n"来进行截取,至此服务器就能清楚我们的请求,同时给我们的请求做出响应。

其中http的响应字段也是类似的,其中浏览器会将响应正文做解释,就变成我们看到的网页了

如下是http的响应字段 

三、HTTP的报头内容

1.url

前面我们的请求行,中间的内容为目录,默认访问的是web根目录,代表默认访问该网站的首页

如果我们指定访问某个文件夹下某个资源,那么请求行中url内容也会随之改变,参数也可以这样传递

实际上我们可以通过http协议,截取出你的url是什么,如果是根目录,那么就拼接首页并给你首页网站。

如果是其他目录,只要我有该目录下的该文件,我就给你,如果没有,我就404 not fount。代码逻辑如下。

2. Content-Type

Content-Type 用于指示响应中包含的数据的类型,如果你的html里面有图片、视频等链接,http进行解析正文的时候发现有链接,那么他会再次发送请求该链接。如下

浏览器虽然足够智能,但是仍需要我们指定类型让浏览器进行渲染,因此我们需要给响应字段添加Content-Type,让浏览器知道如何渲染。

Content-Type 扩展名对照表

因此我们需要截取出请求报头中的url,分析url的后缀是什么,根据后缀进行返回内容

3.Method 方法

请求行的第一个参数就Method方法,最重要、也是最常见的是 GET 和 POST

我们通常使用GET 请求去获取资源,比如网页、图片等。

POST请求通常用于提交表单数据、上传文件等操作。

1.GET方法 

GET方法请求参数通常以 URL 的查询字符串的形式附加在 URL 后面,html中如果不写method,默认方法也是“GET”

这样就可以通过截取的方式把用户输入的数据给到后台。后台根据数据再给你提供服务。

2.POST方法 

post方法会将表单的请求参数放在正文部分,私密性会更强一些。

GET与POST的区别 

  1. GET是在url传递参数,POST是在请求正文传参
  2. GET在url传参字节个数有限,POST参数字节没有限制
  3. GET请求通常用于请求服务器发送某个资源,POST请求通常用于向服务器提交数据
  4. GET私密性比POST差(私密性不等于安全性,GET和POST都不安全,都是明文传输,https才更安全)

4、状态码

在http的响应行中,有状态码这个东西,访问成功状态码是通常200。

如果你请求的文件不存在,状态码通常是404 ,描述为not fount

状态码并不是固定的,而是大多是大家默认遵守的规矩,你可以逾矩,但是会让其他程序员看不懂。 重定向是例外,不能乱写

那我们就可以去进行各种判断,看是什么问题,然后给你返回对应的状态码与状态码描述。其他的我们都能理解,这个重定向状态码是什么情况呢?

HTTP报头中还有一个Location字段,客户端会根据该字段中指定的 URL 自动进行重定向,如下代码,当你的报头中状态码为307,并且有Location字段(缺一不可),其他内容也就不重要了,访问到这个网站即会重定向到你所设置的网站内。

其中307代表临时重定向,请求的资源暂时移动到了新位置,但所有后续的请求应该继续使用原始的 URL。

如果状态码是301,表示请求的资源已永久移动到新位置,且所有后续的请求应该使用新的 URL。这意味着浏览器在收到 301 响应后,应该自动更新其缓存的链接,并使用新的 URL 进行所有后续的请求。

5.cookie和session

  • http的请求是无连接和无状态的。
  • 无连接代表像服务器发送请求,服务器对你的请求做出响应,然后就结束了,后续你要再次跳转或者做其他操作又会发送新的请求。
  • 无状态是说服务器根本就不知道你请求了多少次,你是一直在做刷新操作,还是只访问了一次,我不知道耶不关心,我只知道根据你的请求做出响应。
  • 但是我们实际使用的时候,比如抖音登录成功后关闭抖音,再次访问,发现他还是记得我,我仍处于登录状态,这是cookie在起作用。

当我们将账号和密码输入给服务器时,服务器会将你的账号和密码与数据库做对比,如果发现有该用户,就会response响应用户登录成功了,同时该响应里面有Set-Cookie字段,该字段的内容就是你的账号和密码。

浏览器发现response响应里面有该字段,就会利用自动保存cookie字段,当用户再次访问该服务器时,浏览器会自动将cookie里面的内容取出,并帮我们在请求报头添加Cookie字段,该字段的内容就是你之前输入的账号和密码,这样我们第一次登录后,后面都不需要再次登录。

同时后续访问时,request请求报头就自动添加上了Cookie 

但是如果仅仅只有cookie,有坏人想截取我的http请求可太简单了,直接获取到我的用户名和密码,拿着我的账号去干坏事,这样肯定不好。

因此服务器在我登录之后,会把我输入的数据保存到session中,同时通过键值对的唯一性,响应回来的Set-cookie为这个session的id值,这样客户端就收到一个Set-cookie:sessionid。以后就不用在明文传输,而是依靠这个sessionid进行验证用户了。

当然这样我们能保证自己的账号不会被盗,但是别人依然可以利用sessionid去干坏事,比如把账号里面的记录删一删等等,因此还是得需要服务器通过判断客户端的ip地址是否一致、或者sessionid持续时长等来更好的保护客户端(使用者)。

重要报头字段

  • Content-Type: 数据类型(text/html等)
  • Content-Length: Body的长度
  • Host: 客户端告知服务器, 所请求的资源是在哪个主机的哪个端口上;
  • User-Agent: 声明用户的操作系统和浏览器版本信息;
  • referer: 当前页面是从哪个页面跳转过来的;
  • location: 搭配3xx状态码使用, 告诉客户端接下来要去哪里访问;
  • Cookie: 用于在客户端存储少量信息. 通常用于实现会话(session)的功能

目前已经能通过http进行数据传输了,但是黑客仍然有各种办法截取用户的信息,因此需要对http进行加密,提出了https。https我们下一章见!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/838384.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

K210开发板MicroPython开发环境搭建

一、安装CanMV IDE开发软件 1、进入如下连接 https://developer.canaan-creative.com/resource 2、点击下载 3、下一步 4、修改安装路径,下一步 5、接受许可下一步 6、下一步 7、安装 8、完成 9、区域①菜单栏:操作文件,使用工具等。…

Hadoop3:HDFS副本节点选择逻辑讲解

一、副本节点选择(机架感知) 说明 第一个副本,因为我们的client可能是web页,也可能是shell终端。 如果是web页,则随机选取一个节点,如果是shell终端,则选择当前shell终端所在的节点。 节点距离最…

Spring编程使用DDD的小把戏

场景 现在流行充血领域层,在原本只存储对象的java类中,增加一些方法去替代原本写在service层的crud, 但是例如service这种一般都是托管给spring的,我们使用的ORM也都托管给spring,这样方便在service层调用mybatis的m…

计网面试干货---带你梳理常考的面试题

顾得泉:个人主页 个人专栏:《Linux操作系统》 《C从入门到精通》 《LeedCode刷题》 键盘敲烂,年薪百万! 一、HTTP和HTTPS的区别 1.安全性:HTTPS通过SSL/TLS协议对数据进行加密处理,有效防止数据在传输过…

函数栈帧的创建和销毁(详细理解)

🎁个人主页:我们的五年 🔍系列专栏:c语言课程学习 🎉欢迎大家点赞👍评论📝收藏⭐文章 目录 问题: 1.ebp,esp两个寄存器用来维护函数栈帧 2.main函数也一个函数&#…

Darknet+ros+realsenseD435i+yolo(ubuntu20.04)

一、下载Darknet_ros mkidr -p yolo_ws/src cd yolo_ws/src git clone --recursive https://github.com/leggedrobotics/darknet_ros.git #因为这样克隆的darknet文件夹是空的,将darknet_ros中的darknet的文件替换成如下 cd darknet_ros git clone https://github.…

2024年湖北省安全员-B证证模拟考试题库及湖北省安全员-B证理论考试试题

题库来源:安全生产模拟考试一点通公众号小程序 2024年湖北省安全员-B证证模拟考试题库及湖北省安全员-B证理论考试试题是由安全生产模拟考试一点通提供,湖北省安全员-B证证模拟考试题库是根据湖北省安全员-B证最新版教材,湖北省安全员-B证大…

错误: 找不到或无法加载主类问题(已解决)

今天在虚拟机中安装了idea2023.2的版本,运行代码时发现错误找不到主类! 直接说结论: 我先clean了一下target,然后重新build,发现maven报错了,idea2023.2默认使用了内置的maven,然后我切换了一下…

Linux基础之僵尸进程与孤儿进程

目录 一、僵尸进程 1.1 什么是僵尸进程 1.2 为什么要有僵尸状态 1.3 观察我们的僵尸状态 1.4 关于僵尸进程的小Tip 二、孤儿进程 2.1 什么是孤儿进程 一、僵尸进程 1.1 什么是僵尸进程 在上一篇文章中,我们有提到过进程的死亡状态的概念,而我们的…

Transformer 模型

文章目录 前言一、模型结构 前言 Transformer 模型是由谷歌在 2017 年提出并首先应用于机器翻译的神经网络模型结构。机器翻译的目标是从源语言(Source Language)转换到目标语言(Target Language)。Transformer 结构完全通过注意力…

IDC:2023年中国IT安全软件市场同比增长4.7%

IDC最新发布的《中国IT安全软件市场跟踪报告,2023H2》显示,2023年下半年中国IT安全软件市场厂商整体收入约为169.8亿人民币(约合23.5亿元美元),同比上升2.7%。结合全年数据,2023全年中国IT安全软件市场规模…

Linux命令使用

一、ls tree clear 1.1 ls ls:查看当前目录下的文件名ls 目录名:查看指定目录下的文件名ls /:查看根目录下的文件名ls -a:查看当前目录下的所有文件名,包括隐藏文件ls -l:查看当前目录下文件的详细信息…

Java中的数组、Set、List、Map类型的互相转换总结

序言 数组、Set、List、Map是Java语言非常常用的几种数据类型,他们之间存在着千丝万缕的联系。关于底层的数据结构我这里就不再多说啦,直接从应用出发,总结他们之间的转换方法,并给出推荐方法。 大家可以点赞收藏等到需要的时候…

【JAVA】嵌入式软件工程师-2025校招必备-详细整理

一、Java 基础 1.JDK 和 JRE 有什么区别? jdk:java development kit jre:java runtime Environment jdk是面向开发人员的,是开发工具包,包括开发人员需要用到的一些类。 jre是java运行时环境,包括java虚拟机…

SVDD(Singing Voice Deepfake Detection,歌声深度伪造检测)挑战2024

随着AI生成的歌声快速进步,现在能够逼真地模仿自然人类的歌声并与乐谱无缝对接,这引起了艺术家和音乐产业的高度关注。歌声与说话声不同,由于其音乐性质和强烈的背景音乐存在,检测伪造的歌声成为了一个特殊的领域。 SVDD挑战是首个…

电脑常用的PDF阅读器-嗨动PDF编辑器!带你详细了解它

电脑常用的PDF阅读器-嗨动PDF编辑器!在数字化信息爆炸的时代,PDF格式的文件因其易于打印和保留原始格式等优点,成为了人们日常工作和学习的常用格式。而对于PDF文件的处理,一款功能强大、操作简便的PDF阅读器是必不可少的。今天&a…

SprintBoot案例-增删改查

黑马程序员JavaWeb开发教程 文章目录 一、准备工作1. 准备数据库表1.1 新建数据库mytlias1.2 新建部门表dept1.3 新建员工表emp 2. 准备一个Springboot工程2.1 新建一个项目 3. 配置文件application.properties中引入mybatis的配置信息,准备对应的实体类3.1 引入myb…

weblogic 任意文件上传 CVE-2018-2894

一、漏洞简介 在 Weblogic Web Service Test Page 中存在一处任意文件上传漏洞, Web Service Test Page 在"生产模式"下默认不开启,所以该漏洞有一定限制。利用该 漏洞,可以上传任意 jsp 文件,进而获取服务器权限。 二…

[链表专题]力扣141, 142

1. 力扣141 : 环形链表 题 : 给你一个链表的头节点 head ,判断链表中是否有环。 如果链表中有某个节点,可以通过连续跟踪 next 指针再次到达,则链表中存在环。 为了表示给定链表中的环,评测系统内部使用整数 pos 来表示链表尾…

数据结构------二叉树经典习题1

博主主页: 码农派大星. 关注博主带你了解更多数据结构知识 1判断相同的树 OJ链接 这道题相对简单,运用我们常规的递归写法就能轻松写出 所以我们解题思路应该这样想: 1.如果p为空,q为空,那么就是两颗空树肯定相等 2.如果一个树为空另一棵树不为空那么…