学习和使用
引入
import requests
基本语法
Request常用方法总结
response=requests.get(url,params,**kwargs)
response=requests.post(url,params,**kwargs)
参数 | 含义 |
---|---|
url | 目标URL 地址 |
params | 请求发起携带的数据 |
kwargs | 控制请求访问的参数,使用后可以加入到requests 请求的头部,常见的有User-Agent 、Cookie 等。不常见的方法有head 、put 、patch 、delete 、options |
GET
requests.get()
用于请求目标网站,类型是一个 HTTPresponse
类型。
举例如下:
import requestsresponse = requests.get('http://www.baidu.com')
# 打印状态码
print(response.status_code) # 输出 200 代表获取成功# 打印请求url
print(response.url) # 输出 http://www.baidu.com# 打印头信息
print(response.headers)# 返回响应状态信息
print(response.reason)# 打印cookie信息
print(response.cookies)# 如果响应结果是一个json格式的数据,则可以使用这种方式提取数据
print(response.json())#以文本形式打印网页源码
print(response.text)#以字节流形式打印
print(response.content)
在爬虫应用中,常用 text
/ content
获取数据
属性 | 用法 |
---|---|
text | 以字符串的形式返回数据 |
content | 以二进制的方式返回数据 |
POST
POST请求常用的就是 提交表单
# data就是需要发送的表单信息
r = requests.post( " url ", data = { " key " : " value" })
官方文档
[1] W3cschool教程