1、代码
import xlrd
import requestsread_path = 'C:\\Users\\asus\\Desktop\\大法\\公务员\\国考\\行测\\1-推理判断\\URLs.xlsx'
bk = xlrd.open_workbook(read_path)
shxrange = range(bk.nsheets)
sh = bk.sheet_by_name("Sheet2")
nrows = sh.nrows
ncols = sh.ncols
print("nrows=", nrows)
print("ncols=", ncols)
kv = {'user-agent': 'Mozilla/5.0'} # 添加请求头
for i in range(nrows):print("下载第%d个图片", i)url = sh.cell_value(i, 1) # 依次读取每行第2列(序号从0开始)的数据,也就是 URLprint(url)name = str(sh.cell_value(i, 0)) # 读取图片名称f = requests.get(url, headers=kv) # 下载图片print("下载图片", f)pic_name = "C:\\Users\\asus\\Desktop\\Photo\\" + name + "." + "jpg" # 构造完整文件路径+名称print(pic_name)with open(pic_name, "wb") as code:code.write(f.content) # 保存文件
2、URLs.xlsx
3、Python爬取网页提示状态码404,浏览器可访问网址
Python爬取网页提示状态码404,浏览器可访问网址