文章目录
- 1. HTTP协议
- 2. Web服务器
- 3. 静态服务器
- 创建 web_server.py
- 4. WSGI 接口
- 4.1 CGI 通用网关接口
- 4.2 WSGI
- 4.3 定义 WSGI 接口
- 4.4 运行 WSGI 服务
learning from 《python web开发从入门到精通》
1. HTTP协议
- 应用层最主要的协议:
HTTP
协议(HyperText Transfer Protocol
超文本传输协议) - 用户访问网站时,用户浏览器是客户端(向服务器发请求),网站被称为服务器(收到请求,处理后的响应传给客户端),此过程通过
HTTP
协议实现 - 利用
TCP
在两台计算机(如Web服务器,客户端)之间传输信息,客户端使用 web浏览器发送HTTP
请求给 web 服务器,服务器发送响应给客户端
2. Web服务器
当在浏览器中输入 url 后:
- 浏览器请求 DNS 服务器,进行域名解释,获得 站点 IP 地址
- 发送一个
HTTP Request
请求 给拥有该 IP 的主机 - 收到服务器返回的
HTTP Response
响应,浏览器渲染效果后呈现给用户
Web 服务器工作原理:
- 建立连接:客户端通过
TCP/IP
协议建立到服务器的TCP
连接 - 请求过程:客户端向服务器发送
HTTP
协议请求包,请求资源 - 应答过程:服务器向客户端发送
HTTP
协议应答包,如果资源包含动态语言内容,会先进行处理,得到的数据返回客户端,客户端解释HTML
渲染在屏幕上 - 关闭连接:断开客户端和服务器
常用请求方法:
- GET:请求指定页面
- POST:提交数据(表单或者文件等)
- HEAD:类似GET,但仅仅获取报头
- PUT:取代服务器上的指定文档内容
- DELETE:服务器删除指定页面
- OPTIONS:允许客户端查看服务器性能
返回状态码:
1**
:请求收到,继续处理2**
:成功返回响应3**
:重定向,为了完成请求,必须进一步执行的动作4**
:客户端错误,如语法错误,或者请求无法实现5**
:服务器错误,服务器不能实现一种明显无效的请求
浏览器 按 F12 可以查看相关信息
3. 静态服务器
- 纯粹的
HTML
页面被称为静态页面
例子:创建一个静态服务器,通过该服务器可以访问包含两个静态页面的网站
- 导航栏的网页
simple_navbar.html
<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><title>使用bootstrap框架制作导航栏</title><link href="https://cdn.bootcdn.net/ajax/libs/twitter-bootstrap/5.0.2/css/bootstrap.css" rel="stylesheet"><script src="https://cdn.bootcdn.net/ajax/libs/jquery/3.6.0/jquery.js"></script><script src="https://cdn.bootcdn.net/ajax/libs/popper.js/2.9.2/cjs/popper-base.js"></script><script src="https://cdn.bootcdn.net/ajax/libs/twitter-bootstrap/5.0.2/js/bootstrap.js"></script></head>
<body><nav class="navbar navbar-expand-sm navbar-light bg-light"><div class="container-fluid"><a class="navbar-brand" href="https://michael.blog.csdn.net/">我的导航</a><button class="navbar-toggler" type="button" data-bs-toggle="collapse" data-bs-target="#navbarSupportedContent"aria-controls="navbarSupportedContent" aria-expanded="false" aria-label="Toggle navigation"><span class="navbar-toggler-icon"></span></button><div class="collapse navbar-collapse" id="navbarSupportedContent"><ul class="navbar-nav me-auto mb-2 mb-lg-0"><li class="nav-item"><a class="nav-link active" aria-current="page" href="https://michael.blog.csdn.net/">主页</a></li><li class="nav-item"><a class="nav-link" href="#">链接</a></li><li class="nav-item dropdown"><a class="nav-link dropdown-toggle" href="#" id="navbarDropdown" role="button"data-bs-toggle="dropdown" aria-expanded="false">关于作者</a><ul class="dropdown-menu" aria-labelledby="navbarDropdown"><li><a class="dropdown-item" href="#">简历</a></li><li><a class="dropdown-item" href="#">项目</a></li><li><hr class="dropdown-divider"></li><li><a class="dropdown-item" href="contact.html">联系方式</a></li></ul></li><li class="nav-item"><a class="nav-link disabled">商城</a></li></ul><form class="d-flex"><input class="form-control me-2" type="search" placeholder="输入你的关键词" aria-label="Search"><button class="btn btn-outline-success" type="submit">站内搜索</button></form></div></div>
</nav></body>
</html>
contact.html
,在上面的基础上,添加一些额外的联系信息
<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><title>联系michael</title><link href="https://cdn.bootcdn.net/ajax/libs/twitter-bootstrap/5.0.2/css/bootstrap.css" rel="stylesheet"><script src="https://cdn.bootcdn.net/ajax/libs/jquery/3.6.0/jquery.js"></script><script src="https://cdn.bootcdn.net/ajax/libs/popper.js/2.9.2/cjs/popper-base.js"></script><script src="https://cdn.bootcdn.net/ajax/libs/twitter-bootstrap/5.0.2/js/bootstrap.js"></script></head>
<body><nav class="navbar navbar-expand-sm navbar-light bg-light"><div class="container-fluid"><a class="navbar-brand" href="https://michael.blog.csdn.net/">我的导航</a><button class="navbar-toggler" type="button" data-bs-toggle="collapse" data-bs-target="#navbarSupportedContent"aria-controls="navbarSupportedContent" aria-expanded="false" aria-label="Toggle navigation"><span class="navbar-toggler-icon"></span></button><div class="collapse navbar-collapse" id="navbarSupportedContent"><ul class="navbar-nav me-auto mb-2 mb-lg-0"><li class="nav-item"><a class="nav-link active" aria-current="page" href="https://michael.blog.csdn.net/">主页</a></li><li class="nav-item"><a class="nav-link" href="#">链接</a></li><li class="nav-item dropdown"><a class="nav-link dropdown-toggle" href="#" id="navbarDropdown" role="button"data-bs-toggle="dropdown" aria-expanded="false">关于作者</a><ul class="dropdown-menu" aria-labelledby="navbarDropdown"><li><a class="dropdown-item" href="#">简历</a></li><li><a class="dropdown-item" href="#">项目</a></li><li><hr class="dropdown-divider"></li><li><a class="dropdown-item" href="contact.html">联系方式</a></li></ul></li><li class="nav-item"><a class="nav-link disabled">商城</a></li></ul><form class="d-flex"><input class="form-control me-2" type="search" placeholder="输入你的关键词" aria-label="Search"><button class="btn btn-outline-success" type="submit">站内搜索</button></form></div></div>
</nav><div class="bs-docs-header" id="content" tabindex="-1"><div class="container"><h1> 联系michael </h1><div class="lead"><address>电子邮件:<strong>michael@xxx.com</strong><br>地址:地球村86号<br>邮政编码:<strong>xxxxxx</strong><br><abbr title="Phone">联系电话:</abbr> 1234567890</address></div></div>
</div></body>
</html>
创建 web_server.py
实现客户端和服务器的 HTTP
通信
注:由于 HTML 里面写了很多下载的 css 文件地址,路径总是报错,最后还是 建议引用 CDN 写法,相关库地址查询https://www.bootcdn.cn/
<link href="https://cdn.bootcdn.net/ajax/libs/twitter-bootstrap/5.0.2/css/bootstrap.css" rel="stylesheet">
<script src="https://cdn.bootcdn.net/ajax/libs/jquery/3.6.0/jquery.js"></script>
<script src="https://cdn.bootcdn.net/ajax/libs/popper.js/2.9.2/cjs/popper-base.js"></script>
<script src="https://cdn.bootcdn.net/ajax/libs/twitter-bootstrap/5.0.2/js/bootstrap.js"></script>
import socket
import re
from multiprocessing import Process # 多线程HTML_ROOT_DIR = './' # 设置静态页面的根目录class HTTPServer:def __init__(self):self.server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)def start(self):self.server_socket.listen(128) # 最大连接数128print("服务器等待客户端连接...")while True:client_socket, client_addr = self.server_socket.accept() # 建立客户端连接print("[%s, %s]用户连接上了" % client_addr)handle_client_process = Process(target=self.handle_client, args=(client_socket,))# 实例化线程,第一个参数调用函数 ,第二个参数 传递给前者的参数,元组形式handle_client_process.start() # 开启线程client_socket.close() # 关闭客户端socketdef handle_client(self, client_socket):# 处理客户端请求request_data = client_socket.recv(1024) # 接收客户端请求print("request data:", request_data)request_lines = request_data.splitlines() # 按行分割for line in request_lines:print(line) # 输出信息request_start_line = request_lines[0] # 获取请求报文print("*" * 10)print(request_start_line.decode("utf-8"))file_name = re.match(r"\w+ +(/[^ ]*) ", request_start_line.decode("utf-8")).group(1)# 使用正则表达式,提取请求的文件名,group(1) 列出第一个括号匹配部分if file_name == "/":file_name = "/simple_navbar.html"try:# 尝试打开文件file = open(HTML_ROOT_DIR + file_name, "rb")except IOError:# 读取文件失败,返回404response_start_line = "HTTP/1.1 404 Not Found\r\n"response_headers = "Server: Michael server\r\n"response_body = "The file %s is not found! please check again!" % (HTML_ROOT_DIR + file_name)else:file_data = file.read()file.close()# 构造响应数据response_start_line = "HTTP/1.1 200 OK\r\n"response_headers = "Server: Michael server\r\n"response_body = file_data.decode("utf-8")# 拼接返回数据response = response_start_line + response_headers + "\r\n" + response_bodyprint("response data:", response)client_socket.send(bytes(response, "utf-8")) # 向客户端发送响应数据client_socket.close() # 关闭客户端连接def bind(self, port):self.server_socket.bind(("127.0.0.1", port))def main():http_server = HTTPServer()http_server.bind(8000)http_server.start()if __name__ == "__main__":main()
4. WSGI 接口
上面实现了一个静态服务器,但是现在很少使用,更多的是使用 动态页面,实现交互性
- 例如,注册登录网站,用户输入数据,web服务器不处理用户数据(不是它的职责),CGI 诞生
4.1 CGI 通用网关接口
Common Gateway Interface
是一段程序,运行在服务器上- web 服务器将请求发送给 CGI 应用程序,再将 CGI 动态生成的 HTML 页面发送回客户端
CGI
局限性:创建完解释器进程,用完就抛弃,大量的请求导致服务器停机
CGI
加强版FastCGI
出现,其使用进程/线程池
来处理一连串的请求
减少了网页服务器
与CGI 程序
之间 交互的开销
4.2 WSGI
- 在
FastCGI
标准下写异步的 Web 服务不太方便,WSGI (Web Server Gateway Interface 服务器网关接口)
出现
下图 from https://www.cnblogs.com/wilber2013/p/4763067.html
4.3 定义 WSGI 接口
最简单的web版本 hello world
def applications(environ, start_response):start_response('200 OK', [('Content-Type', 'text/html')])return [b'<h1>Hello, Michael!</h1>']
上面函数就是符合 WSGI 标准的一个 HTTP 处理函数
environ
:一个所有 HTTP 请求信息的字典对象start_response
:一个发送 HTTP 响应的函数
好处:web 解析 和 应用程序逻辑 分离,可以各自做自己擅长的事
python 内置了 WSGI:wsgiref
模块(它没有考虑运行效率,仅供开发测试)
4.4 运行 WSGI 服务
wsgi_app.py
# wsgi 应用程序
def app(environ, start_response):# 响应信息start_response('200 OK', [('Content-Type', 'text/html')])file_name = environ['PATH_INFO'][1:] or 'simple_navbar.html'HTML_ROOT_DIR = './'try:# 打开文件file = open(HTML_ROOT_DIR + file_name, 'rb')except IOError:# 响应异常response_body = "{} not found".format(HTML_ROOT_DIR + file_name)else:# 读取文件file_data = file.read()file.close()# 构造响应数据response_body = file_data.decode('utf-8')return [response_body.encode('utf-8')] # 返回数据
wsgi_server.py
# WSGI 服务器
from wsgiref.simple_server import make_server
from wsgi_app import app# 创建一个服务器,IP地址为空,端口号为8000,处理函数是app
httpd = make_server('', 8000, app)
print('Serving HTTP on port 8000...')
httpd.serve_forever() # 开始监听HTTP请求
运行 wsgi_server.py ,在浏览器输入 http://127.0.0.1:8000/
就可以访问网页了