Flask框架小程序后端分离开发学习笔记《3》客户端向服务器端发送请求
Flask是使用python的后端,由于小程序需要后端开发,遂学习一下后端开发。
一、为什么请求数据需要先编码
#构造一个HTTP请求
http_request = 'GET / HTTP/1.1\r\nhost:{}\r\n\r\n'.format(host)#发送HTTP请求给服务器
#send函数只接受bytes 作为参数
# str.encode把str转换为bytes,编码是utf-8
request = http_request.encode('utf-8')
可以看到上述代码构建了一个HTTP请求,在发送之前需要将发送之前,使用http_request.encode(‘utf-8’)。
这是因为我们在这构建的请求是字符串文本,而电脑只认识二进制0和1,所以需要将其数据类型转换为二进制类型。
这里的utf-8是一种编码规则,utf-8就像小学学习的字典一样,给每个字符都定义了一个对应的二进制的值代表它。
例如:在UTF-8编码中,字符"G"(大写字母G)用二进制表示是 01000111。
当然编码规则有非常多,除此之外常见的还有ASCII编码、UNICODE编码、GBK等。
二、如何recv所有数据
# recv 可以接收客户端发送过来的数据
# 参数是要接收的字节数
# 返回值是一个bytes类型(随便写的,1024是长度,只接收客户端发送的1024字节,我们之后可以用while持续接收)
request = connection.recv(1024)
上述代码中的1024是接收请求的字节长度,即,一个请求发送过来,我只接收1024字节长度的数据。如果只有这样的话,我们只能接收到前1024字节的长度,如果数据长度大于此,后面的数据就没接收到。
有些朋友就说,那我把这个长度设置的很大很大就得了。理论上,recv 函数的这个参数确实可以设置为任何正整数值。
但是,实际上接收的数据量取决于几个因素,包括网络条件、套接字类型和对方发送数据的方式。在实际应用中,常见的做法是设置这个值为 4096 或 8192,这通常足以处理大多数情况下的数据传输需求。但如果需要,这个值可以被设置得更大,比如 65536(64KB)或更高。
重要的是要了解,recv 函数读取的是缓冲区中的数据,因此设置的值应该与您预期的数据量和缓冲区大小相匹配。设置过大的值不会导致错误,但可能会导致不必要的内存占用。同时,接收的数据可能会少于请求的字节数,这并不是异常,而是正常现象,因为TCP套接字可能会分多次接收完整的数据。
在代码中,我们可以通过循环的方式,分多次接收完整的数据,如下:
# recv 可以接收客户端发送过来的数据buffer_size = 1000r = b''while True:request = connection.recv(buffer_size)r += request# 取到的数据长度不够recv的参数的时候,说明数据己经取完了if len(request) < buffer_size:break
有些朋友就会产生疑惑,request = connection.recv(buffer_size)会从上一次没接收完的断点继续接收数据吗?还是一直都重复接收数据的前buffer_size 字节数据呢?
答:
在网络编程中,当你使用像 recv(buffer_size) 这样的方法从一个网络连接接收数据时,它会按照你指定的缓冲区大小(在这个例子中是 buffer_size)接收数据。如果数据流中还有更多数据,但不足以填满整个缓冲区,recv 将会返回当前可用的数据,并且下一次调用 recv 时会继续从上次停止的地方接收数据。
三、http头
当构建好http服务器时,使用浏览器输入域名和端口访问时,服务器端会发现有两次请求过来。如下在代码旁注释功能。
D:\python3.10.7\python.exe E:\flask_learn\http1.py
ip and request,('127.0.0.1', 52625)
GET / HTTP/1.1 请求方式与协议 /路径是默认路径
Host: localhost:2000 主机号,一定要有,不然找不到谁发送的,给不了回复
Connection: keep-alive TCP保持连接,不用一直重复连接-断开。(还有个属性是close,即关闭)
sec-ch-ua: "Not_A Brand";v="8", "Chromium";v="120", "Microsoft Edge";v="120"
sec-ch-ua-mobile: ?0
sec-ch-ua-platform: "Windows"
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36 Edg/120.0.0.0
User-Agent重要字段,伪装浏览器信息,避免不兼容
Accept: 浏览器接收什么类型的数据text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7
Sec-Fetch-Site: none
Sec-Fetch-Mode: navigate
Sec-Fetch-User: ?1
Sec-Fetch-Dest: document
Accept-Encoding: gzip, deflate, br 可以接受的编码方式
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6
希望可以接收的语言,中英之类ip and request,('127.0.0.1', 52626)
GET /favicon.ico HTTP/1.1 第二次的这个路径不一样了,
Host: localhost:2000
Connection: keep-alive
sec-ch-ua: "Not_A Brand";v="8", "Chromium";v="120", "Microsoft Edge";v="120"
sec-ch-ua-mobile: ?0
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36 Edg/120.0.0.0
sec-ch-ua-platform: "Windows"
Accept: image/webp,image/apng,image/svg+xml,image/*,*/*;q=0.8
Sec-Fetch-Site: same-origin
Sec-Fetch-Mode: no-cors
Sec-Fetch-Dest: image
Referer: http://localhost:2000/
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6
第二次请求,是请求的图标,如下
代码示例:客户端向服务器端发送请求
# 构建一个简单本地http服务器
import socket
# 这个程序就是一个套路程序,套路程序
# 没必要思考为什么会龙区年#记住套路,能用,就够了
# 运行这个程序后,浏览器打开localhost:2000就能访问了;localhost是本机域名,本机ip:127.0.0.1# 服务器的host为空字符串,表示接受任意ip地址的连接
# post是端口,这里设置为2000,随便选的一个数字(尽量1024以上,以下是操作系统保留的端口)
host = ''
port = 2000#s是—个socket实例
s = socket.socket()
#s.bind用于绑定(因为服务器有一个固定的端口,所以需要绑定host和port)
#注意bind 函数的参数是一个tuple
s.bind((host, port))#用一个无限循环采处理请求
while True:# 套路,先要s.listen开始监听# 注意参数5的含义不必关心s.listen(5)# 当有客户端过来连接的时候,s.accept函数就会返回2个值# 分别是 连接 和 客户端ip 地址# 其实程序是在这等着接收连接呢connection, address = s.accept()# recv 可以接收客户端发送过来的数据# 参数是要接收的字节数# 返回值是一个bytes类型(随便写的,1024是长度,只接收客户端发送的1024字节,我们之后可以用while持续接收)buffer_size = 1000r = b''while True:request = connection.recv(buffer_size)r += request# 取到的数据长度不够recv的参数的时候,说明数据己经取完了if len(request) < buffer_size:break# bytes类型调用decode ( ' utf-8 ')来转成一个字符串( str)print('ip and request,{}\n{}'.format(address, request.decode('utf-8')))# b''表示这是一个bytes 对象response = b'HTTP/1.1 200 hao\r\n\r\n<h1>Hello world!</h1>'# 用sendall发送给客户端connection.sendall(response)# 发送完毕后,关闭本次连接connection.close()
#codinq: utf-8
# 构造一个请求,发送给自己本机上一个代码构建的服务器import socket
# socket 是操作系统用来进行网络通信的底层方案#简而言之,就是发送/接收数据
#创建一个socket对象
#参数socket.AF_INET表示是ipv4协议]#参数socket. sOCK_STREAM表示是tcp协议
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
#这两个其实是默认值,所以你可以不写,如下
#s = socket.socket() socket只能用于http协议的,不能用于https
#s = ssl. wrap_socket ( socket.socket ( ) ) 这个用于https#主机(域名或者ip)和端口
host = 'localhost'
port = 2000
#用connect函数连接上主机,参数是一个tuple
s.connect( (host,port) )#连接上后,可以通过这个函数得到本机的ip和端口(本地ip路由器分配得到,本地端口操作系统分配的)
ip, port = s.getsockname()
print('本机ip 和port {}\{}'.format(ip, port))#构造一个HTTP请求
http_request = 'GET / HTTP/1.1\r\nhost:{}\r\n\r\n'.format(host)#发送HTTP请求给服务器
#send函数只接受bytes 作为参数
# str.encode把str转换为bytes,编码是utf-8
request = http_request.encode('utf-8')
print('请求',request)
s.send(request)# 接受服务器的响应数据
#参数是长度,这里为1023字节
#所以这里如果服务器返回的数据中超过1023的部分你就得不到了,正经一次性最长大概1500字节,
response = s.recv (1023)
#输出响应的数据,bytes类型
print('响应',response)
#转成str再输出
print('响应的str 格式',response.decode ('utf-8'))
运行结果:
发送请求的客户端运行结果:
服务器端:
可以看到我运行了两次发送请求的程序,操作系统分配给其程序的两次端口不一样。