爬虫基础-计算机网络协议

一个数据的传输
image.png
这些设备的数据转发是通过协议来完成的,整个互联网可以说是完全由网络协议来维持的
不同的协议分工不同,比如ip协议确保了ip寻址,tcp协议确保了数据完整性

IP地址和URL

ip地址
整个网络传输可以比作快递,数据就是快递包裹
ip地址就是门牌号
URL
url(uniform resource locator)- 统一资源定位符,每一个url指向一个独特的资源,可以是一个html页面、一个css文档、一个图片、文件、js文件等
URL协议
image.png
常用协议:http、https、file、ftp
域名:可以看做说ip地址的别名,此次也可以直接填写ip地址

七层网络协议

image.png
image.png
image.png

TCP/IP协议

TCP协议
Tcp(传输控制协议)是一种面向连接、可可靠的基于字节流的传输层协议
理解:
tcp协议负责把需要传输的数据分解成一定长度的“片段”。
IP协议
Ip协议用于将多个数据包交换网络连接起来,它在源地址和目的地址之间传输数据包
理解
ip协议负责将数据“片段”贴上标签,成为数据包,标签包括“源ip地址”和“目标ip地址”。这些标签将决定数据传输的路径。Ip协议负责传送的道路被称为“路由功能”
路由器
路由器,是连接互联网各局域网、广域网的设备,他会根据信道的情况自动选择和设置路由,以最佳路径,按前后顺序发送数据
理解:
每个节点上的路由器都记录着与自己相邻的路由器地址,并形成一个表格-路由表,路由表是一个动态数据库,并在网络活动中不断更新。
数据包达到一个路由器后,该路由器会根据数据包的地址信息,查询路由表,然后选择一个最佳的路径发送数据包。

TCP是一种面向连接的单播协议,在发送数据前,通信双方必须在彼此间建立一条连接。所谓的“连接”,其实是客户端和服务器的内存里保存的一份关于对方的信息,如ip地址、端口号等。
TCP可以看成是一种字节流,它会处理IP层或以下的层的丢包、重复以及错误问题。在连接的建立过程中,双方需要交换一些连接的参数。这些参数可以放在TCP头部。
TCP提供了一种可靠、面向连接、字节流、传输层的服务,采用三次握手建立一个连接。采用4次挥手来关闭一个连接。

Socket

Socket可以用英文概念理解:插座
电力公司给你家送电是通过电线,但是电送到你家还不够,家里还得有个插座(socket),这样你才能用上电,插座上有火线、地线和中线。 可以理解为ip地址/端口等。
Socket本身并不是一个协议,是一个套接字,操作系统为了方便大家直接使用tcp协议而存在的一个抽象层,它把复杂的tcp/ip协议隐藏在接口后面。
image.png
image.png
socket_server

#socket服务端
import socket
import threading
server = socket.socket()
#绑定到0.0.0.0:8000端口上
server.bind(('0.0.0.0', 8000))
server.listen()def handle_sock(sock, addr):while True:# recv方法是阻塞的tmp_data = sock.recv(1024)print(tmp_data.decode("utf8"))input_data = input()sock.send(input_data.encode("utf8"))#获取客户端连接并启动线程去处理
while True:# 阻塞等待连接sock, addr = server.accept()#启动一个线程去处理新的用户连接client_thread = threading.Thread(target=handle_sock, args=(sock, addr))client_thread.start()#体验到直接获取原始数据,裸数据# if tmp_data:#     data += tmp_data.decode("utf8")#     if tmp_data.decode("utf8").endswith("#"):#         break# else:#     break;# print(data)
# sock.close()

socket_client

#socket客户端
import socket
client = socket.socket()
client.connect(('127.0.0.1', 8000))# client.send(b"bobby")
#当输出完成以后 以#结尾就代码提交完成
# server_data = client.recv(1024)
# print("server response: {}".format(server_data.decode("utf8")))
while True:input_data = input()client.send(input_data.encode("utf8"))server_data = client.recv(1024)print("server response: {}".format(server_data.decode("utf8")))# client.close()

模拟qq服务器和客户端
server

#qq服务器
#1. 转发消息
#2. 处理登录
#3. 处理退出
#4. 维护历史消息, 维护在线用户和维护用户的连接
import socket
import json
from collections import defaultdict
import threading#1. 维护用户连接
online_users = defaultdict(dict)#2. 维护用户的历史消息
user_msgs = defaultdict(list)server = socket.socket()#绑定ip
server.bind(("0.0.0.0", 8000))
server.listen()def handle_sock(sock, addr):while True:data = sock.recv(1024)json_data = json.loads(data.decode("utf8"))action = json_data.get("action", "")if action == "login":online_users[json_data["user"]] = socksock.send("登录成功!".encode("utf8"))elif action == "list_user":#获取当前在线用户all_users = [user for user, sock in online_users.items()]sock.send(json.dumps(all_users).encode("utf8"))elif action == "history_msg":sock.send(json.dumps(user_msgs.get(json_data["user"], [])).encode("utf8"))elif action == "send_msg":if json_data["to"] in online_users:online_users[json_data["to"]].send(json.dumps(json_data).encode("utf8"))user_msgs[json_data["to"]].append(json_data)elif action == "exit":del online_users[json_data["user"]]sock.send("退出成功!".encode("utf8"))while True:#阻塞等待连接sock, addr = server.accept()#启动一个线程去处理新的用户连接client_thread = threading.Thread(target=handle_sock, args=(sock, addr))client_thread.start()#1. 多线程去处理每个用户连接,防止主线程阻塞住
#2. 自定义了消息协议并且自己完成了消息协议的解析

client

#qq客户端
import socket
import json
import threadingclient = socket.socket()
client.connect(("127.0.0.1", 8000))user = "bobby1"#1. 登录
login_template = {"action":"login","user":user
}
client.send(json.dumps(login_template).encode("utf8"))
res = client.recv(1024)
print(res.decode("utf8"))#2. 获取在线用户
get_user_template = {"action":"list_user"
}
client.send(json.dumps(get_user_template).encode("utf8"))
res = client.recv(1024)
print("当前在线用户:{}".format(res.decode("utf8")))#2. 获取历史消息
offline_msg_template = {"action":"history_msg","user":user
}
client.send(json.dumps(offline_msg_template).encode("utf8"))
res = client.recv(1024)
print("历史消息:{}".format(res.decode("utf8")))exit = False
def hanle_receive():#处理接收请求while True:if not exit:try:res = client.recv(1024)except:breakres = res.decode("utf8")try:res_json = json.loads(res)msg = res_json["data"]from_user = res_json["from"]print("")print("收到来自({})的消息: {}".format(from_user, msg))except:print("")print(res)else:breakdef handle_send():while True:#1. 随时可以发送消息#2. 有新消息随时能接收到op_type = input("请输入你要进行的操作: 1. 发送消息, 2. 退出, 3. 获取在线用户")if op_type not in ["1","2","3"]:print("不支持该操作!!!")op_type = input("请输入你要进行的操作: 1. 发送消息, 2. 退出, 3. 获取在线用户")elif op_type == "1":to_user = input("请输入你要发送的用户:")msg = input("请输入你要发送的消息")send_data_template = {"action": "send_msg","to": to_user,"from": user,"data": msg}client.send(json.dumps(send_data_template).encode("utf8"))elif op_type == "2":exit_template = {"action": "exit","user": user}client.send(json.dumps(exit_template).encode("utf8"))exit = Trueclient.close()breakelif op_type == "3":get_user_template = {"action": "list_user"}client.send(json.dumps(get_user_template).encode("utf8"))if __name__ == "__main__":send_thread = threading.Thread(target=handle_send)receive_thread = threading.Thread(target=hanle_receive)send_thread.start()receive_thread.start()
#qq客户端
import socket
import json
import threadingclient = socket.socket()
client.connect(("127.0.0.1", 8000))user = "bobby2"#1. 登录
login_template = {"action":"login","user":user
}
client.send(json.dumps(login_template).encode("utf8"))
res = client.recv(1024)
print(res.decode("utf8"))#2. 获取在线用户
get_user_template = {"action":"list_user"
}
client.send(json.dumps(get_user_template).encode("utf8"))
res = client.recv(1024)
print("当前在线用户:{}".format(res.decode("utf8")))#2. 获取历史消息
offline_msg_template = {"action":"history_msg","user":user
}
client.send(json.dumps(offline_msg_template).encode("utf8"))
res = client.recv(1024)
print("历史消息:{}".format(res.decode("utf8")))exit = False
def hanle_receive():#处理接收请求while True:if not exit:try:res = client.recv(1024)except:breakres = res.decode("utf8")try:res_json = json.loads(res)msg = res_json["data"]from_user = res_json["from"]print("")print("收到来自({})的消息: {}".format(from_user, msg))except:print("")print(res)else:breakdef handle_send():while True:#1. 随时可以发送消息#2. 有新消息随时能接收到op_type = input("请输入你要进行的操作: 1. 发送消息, 2. 退出, 3. 获取在线用户")if op_type not in ["1","2","3"]:print("不支持该操作!!!")op_type = input("请输入你要进行的操作: 1. 发送消息, 2. 退出, 3. 获取在线用户")elif op_type == "1":to_user = input("请输入你要发送的用户:")msg = input("请输入你要发送的消息")send_data_template = {"action": "send_msg","to": to_user,"from": user,"data": msg}client.send(json.dumps(send_data_template).encode("utf8"))elif op_type == "2":exit_template = {"action": "exit","user": user}client.send(json.dumps(exit_template).encode("utf8"))exit = Trueclient.close()breakelif op_type == "3":get_user_template = {"action": "list_user"}client.send(json.dumps(get_user_template).encode("utf8"))if __name__ == "__main__":send_thread = threading.Thread(target=handle_send)receive_thread = threading.Thread(target=hanle_receive)send_thread.start()receive_thread.start()

http协议

HTTP是Hyper Text Transfer Protocol(超文本传输协议)的缩写。它的发展是万维网协会(World Wide Web Consortium)和Internet工作小组IETF(Internet Engineering Task Force)合作的结果,(他们)最终发布了一系列的RFC。http是应用层协议。
HTTP协议永远都是客户端发起请求,服务器回送响应,这样就限制了使用HTTP协议,无法实现在客户端没有发起请求的时候,服务器将消息推送给客户端。HTTP协议是一个无状态的协议,同一个客户端的这次请求和上次请求是没有对应关系。http协议是单向的。
HTTP 协议是个纯文本的协议,:这意味着我们直接传递纯文本就可以了换句话说,一个 Web 服务器其实就是根据约定好的方法生成对应的 HTTP 消息内容然后传输给对方。

http协议格式

简单快速:只需要传递请求方法和路径。
灵活:http可以传递任意类型的数据对象。通过content-type指定
无连接:无连接意味着每次连接处理一个请求,服务器返回之后断开连接,节省传输时间和服务器压力。
无状态:无状态是指协议对于事物处理没有记忆能力,需要通过cookie和session来加以区别。
支持B/S和C/S模式
image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/653689.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用毫米波雷达传感器的功能安全兼容系统设计指南1(TI文档)

摘要 功能安全标准规定了在系统中实施安全的要求,并有助于概括该系统要达到的安全目标。包括功能安全的系统设计不仅要降低操作不当的风险,还要检测故障并将其影响降到最低。随着汽车和工业系统的自主性越来越强,严格的功能安全要求被强制执行…

单板计算机(SBC)-片上系统(SOC)嵌入式C++和FPGA(VHDL)

要点: 片上系统/单板计算机嵌入式C及VHDL编程单板计算机(Raspberry Pi)C实现MQTT监控房间门锁,灯光,并使用RESTful提示状态单板计算机(ESP8266)C 无线网络 MQTT土壤湿度监测仪,实现HTTP服务器,创建网页版监控界面&…

手把手带你死磕ORBSLAM3源代码(六十二) Atlas.cc GetAtlasKeyframes

目录 一.前言 二.代码 2.1完整代码 一.前言 以下是对每个函数的详细解释: SetKeyFrameDababase(KeyFrameDatabase pKFDB)* 功能:设置Atlas对象的关键帧数据库。参数:pKFDB是一个指向KeyFrameDatabase的指针。实现:将成员变量mpKeyFrameDB设置为传入的pKFDB。GetKeyFram…

(28)Linux 信号保存 信号处理 不可重入函数

首先介绍几个新的概念: 信号递达(Delivery):实际执行信号的处理动作。信号未决(Pending):信号从产生到递达之间的状态。信号阻塞(Block):被阻塞的信号产生时将保持在未决状态,直达解除对该信号的阻塞,才执…

【大厂AI课学习笔记】1.2 人工智能的应用(1)

目录 1.2 人工智能的应用 1.2.1 产业中人工智能的应用 金融 教育 医疗 交通 制造 ——智慧金融 智能风控 智能理赔 智能投研 (声明:本学习笔记学习原始资料来自于腾讯,截图等资料,如有不合适摘录的,请与我联…

性能篇,Hashmap的设计与优化?

嗨,小米的技术小窝又迎来了大家!今天我们要聊的话题是大家在日常开发中经常接触到的数据结构之一——HashMap。这个看似简单的键值对存储结构,背后却蕴含了许多设计和优化的奥秘。废话不多说,让我们一起来揭开HashMap的神秘面纱! HashMap的实现结构 在HashMap的实现中,…

基于SpringBoot+Redis的前后端分离外卖项目-苍穹外卖微信小程序端(十五)

用户端历史订单模块 1. 查询历史订单1.1 需求分析和设计1.2 代码实现1.2.1 user/OrderController1.2.2 OrderService1.2.3 OrderServiceImpl1.2.4 OrderMapper1.2.5 OrderMapper.xml1.2.6 OrderDetailMapper 2. 查询订单详情2.1 需求分析和设计2.2 代码实现2.2.1 user/OrderCon…

第二百九十三回

文章目录 1. 概念介绍2. 方法与细节2.1 实现方法2.2 具体细节 3. 示例代码4. 内容总结 我们在上一章回中介绍了"如何混合选择多个图片和视频文件"相关的内容,本章回中将介绍如何通过相机获取图片文件.闲话休提,让我们一起Talk Flutter吧。 1. …

机器学习之遗传算法(Genetic Algorithm)

机器学习(Machine Learning)是一种通过使用算法和统计模型,使计算机系统能够从数据中学习并改善性能的领域。而遗传算法(Genetic Algorithm)是一种受到自然选择和遗传学原理启发的优化算法,用于寻找问题的最优解或近似最优解。 遗传算法的基本思想是通过模拟自然选择和遗…

C++ 指针,数组与指针之间的关系以及指针运算

文章目录 C 指针C 中使用指针 C Null 指针数组与指针sizeof在数组和指针的上的区别&intArr 和 &intArr[0]的类型 C 指针的算术运算递增一个指针递减一个指针指针的比较 引用 VS 指针C 把引用作为参数C 把引用作为返回值 指针的释放 C 指针 学习 C 的指针既简单又有趣。…

C++ easyX小程序(介绍几个函数的使用)

本小程序通过代码和注释,介绍了easyX窗口及控制台窗口的设置方法;还介绍了easyX中关于颜色、线型、画圆、画方、显示文字以及鼠标消息处理等函数的使用方法。为便于理解,本程序同时使用控制台和easyX窗口,由控制台控制程序运行、由…

SpringBoot常见错误

SpringBoot常见错误 1、SpringBoot启动时报错 错误: 找不到或无法加载主类 com.xxx.xxx.Application springboot启动时报错错误:找不到或无法加载主类 com.xxx.xxx.Application。 解决方法就是打开idea的控制台,输入以下三行命令: mvn cl…

nginx安装ssl模块http_ssl_module

查看nginx安装的模块 /usr/local/nginx/sbin/nginx -V若出现“–with-http_ssl_module”说明已经安装过,否则继续执行下列步骤 进入nginx源文件目录 cd /usr/local/nginx/nginx-1.20.2重新编译nginx ./configure --with-http_ssl_module如果组件linux缺少&…

综合案例 - 商品列表

文章目录 需求说明1.my-tag组件封装(完成初始化)2.may-tag封装(控制显示隐藏)3.my-tag组件封装(v-model处理:信息修改)4.my-table组件封装(整个表格)①数据不能写死&…

《HTML 简易速速上手小册》第3章:HTML 的列表与表格(2024 最新版)

文章目录 3.1 创建无序和有序列表(📝🌟👍 信息的时尚搭配师)3.1.1 基础示例:创建一个简单的购物清单3.1.2 案例扩展一:创建一个旅行计划清单3.1.3 案例扩展二:创建一个混合列表 3.2 …

uniapp报错:export { render, staticRenderFns, recyclableRender, components }

uniapp vue2项目启动报错 export { render, staticRenderFns, recyclableRender, components }解决办法: 降低prettier的版本 "prettier": "^3.2.4","prettier": "2.8.8",参考 SyntaxError: /xxxx.vue: Unexpected token, expected…

【数据分享】1929-2023年全球站点的逐年平均气温数据(Shp\Excel\免费获取)

气象数据是在各项研究中都经常使用的数据,气象指标包括气温、风速、降水、湿度等指标,其中又以气温指标最为常用!说到气温数据,最详细的气温数据是具体到气象监测站点的气温数据!本次我们为大家带来的就是具体到气象监…

win11 系统 WSL2 备份与还原

win11 系统想要使用 linu 开发环境,除了虚拟机,就是 wsl 好使了。 但是 wsl 如过用了一段时间里面环境工程配置迁移麻烦如果重装系统后能直接备份还原就方便了。 确定你的版本 使用 WinR 打开输入框 输入 cmd 命令 打开命令提示符界面 wsl -l -v查看…

com.sun.jna.platform.mac.SystemB$Timeval

错误信息 Exception in thread "main" java.lang.NoClassDefFoundError: com/sun/jna/platform/mac/SystemB$Timevalat java.lang.ClassLoader.defineClass1(Native Method)at java.lang.ClassLoader.defineClass(ClassLoader.java:757)at java.security.SecureClas…

C++笔记(六)

加号运算符重载: 成员函数重载 person operator(person& p) { person temp; temp.m_a this->m_a p.m_a; temp.m_b this->m_b p.m_b; return temp; } 全局函数重载 Person operator(Person& p1, Person& p2) { Person temp; temp.m_A p1.m_A…