python爬虫 单线程的多任务异步协程

在input()、sleep(2)、request.get()等时,都会导致线程阻塞,协程可以解决IO等操作时的阻塞现象,提高CPU利用效率。

1.单线程的多任务异步协程
main.py

"""=== coding: UTF8 ==="""
import asyncio
import timeasync def func1():print("hello python1")await asyncio.sleep(2)print("hello python1")async def func2():print("hello python2")await asyncio.sleep(3)print("hello python2")async def func3():print("hello python3")await asyncio.sleep(4)print("hello python3")async def main():# 准备异步协程对象列表tasks = [asyncio.create_task(func1()),asyncio.create_task(func2()),asyncio.create_task(func3())]await asyncio.wait(tasks)"""
========================================
主函数功能测试
========================================
"""
if __name__ == '__main__':t1 = time.time()# 一次性运行多个任务asyncio.run(main())t2 = time.time()print(t2 - t1)  # 打印耗时的时间

运行效果:

"C:\Program Files\Python38\python.exe" E:/PythonSourceCode/test/main.py
hello python1
hello python2
hello python3
hello python1
hello python2
hello python3
4.022439956665039Process finished with exit code 0

2.单线程的多任务异步协程在爬虫领域的模拟应用
只是模拟,可以作为模板,在实际爬虫时,需要重点解决

await asyncio.sleep(3)  # 模拟网络请求(网络耗时)

main.py

"""=== coding: UTF8 ==="""
import asyncio
import time# 在爬虫领域的应用
async def download(url):print("准备开始下载")await asyncio.sleep(3)  # 模拟网络请求(网络耗时)print("下载完成")async def main():urls = ["https://www.hao123.com/", "https://www.baidu.com/", "https://www.bilibili.com/"]# 准备异步协程对象列表tasks = []for url in urls:d = asyncio.create_task(download(url))tasks.append(d)await asyncio.wait(tasks)"""
========================================
主函数功能测试
========================================
"""
if __name__ == '__main__':t1 = time.time()# 一次性运行多个任务asyncio.run(main())t2 = time.time()print(t2 - t1)  # 打印耗时的时间

关注公众号,获取更多资料
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/546566.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

阿里2020届校招笔试劝退题——你大爷还是你大爷

阿里巴巴 2020 届的校招笔试结束了,群里哀声一片,来看这些经历了阿里秋招“洗礼”的小伙伴的真实状态。下面这些人嘛......就有些偏激了,哈哈哈先来说一下阿里笔试题构成:10 道单选题 2 道附加题。什么?单选题简单&am…

面试题:图解深克隆和浅克隆

获得好工作的秘密:有效的准备面试。在开始之前,我们先来看以下代码存在什么问题?class CloneTest {public static void main(String[] args) throws CloneNotSupportedException {// 等号赋值( 基本类型)int number 6…

python爬虫 threading 多线程 ThreadPoolExecutor线程池

1.创建多线程,无参数 main.py """ coding: UTF8 """ # 线程类 from threading import Threadclass myThread(Thread):def run(self): # 当线程被执行的时候,被执行的就是run()for i in range(1000):print("子线程&…

python爬虫 asyncio aiohttp aiofiles 单线程多任务异步协程爬取图片

python爬虫 asyncio aiohttp aiofiles 多任务异步协程爬取图片 main.py """ coding: UTF8 """ # requests.get()同步代码 -> 异步操作aiohttp import asyncio import aiohttp import aiofilesurls ["https://img.lianzhixiu.com/uploa…

面试题:如何设计一个高并发的系统?

这道面试题涉及的知识点比较多,主要考察的是面试者的综合技术能力。高并发系统的设计手段有很多,主要体现在以下五个方面。1、前端层优化① 静态资源缓存:将活动页面上的所有可以静态的元素全部静态化,尽量减少动态元素&#xff1…

python爬虫lxml xpath测试

xpath测试1&#xff1a; main.py """ coding: UTF8 """ from lxml import etreexml """ <book><id>1</id><name>春风</name><price>1.56</price><nick>万里</nick><…

命令行下Apache日志统计举例

Apache日志统计举例加些来了解一下如何统计Apache的访问日志&#xff0c;一般可以用tail命令来实时查看日志文件变化&#xff0c;但是各种的应用系统中的日志会非常复杂&#xff0c;一堆长度超过你浏览极限的日志出现在你眼前时&#xff0c;你会觉得非常无奈&#xff0c;怎么办…

漫画:什么是中台?

没有中台的时代在传统IT企业&#xff0c;项目的物理结构是什么样的呢&#xff1f;无论项目内部的如何复杂&#xff0c;都可分为“前台”和“后台”这两部分。什么是前台&#xff1f;首先&#xff0c;这里所说的“前台”和“前端”并不是一回事。所谓前台即包括各种和用户直接交…

MySQL 面试,必须掌握的 8 大核心点

上周末和在北京的哥们国仔涮火锅&#xff0c;席间聊起了最近面试的经历。他说想换工作的原因很简单&#xff0c;就是要涨工资&#xff0c;原来的公司呆了两年多&#xff0c;薪资浮动不超过 500 元。而身边跳槽的那些同事&#xff0c;薪资都已经是自己的 2 倍了。在准备面试的过…

基于小波变换的数字图像处理(MATLAB源代码)

基于小波变换的数字图像处理&#xff08;MATLAB源代码&#xff09; clear all; close all; clc;M256;%原图像长度N64; %水印长度[filename1,pathname]uigetfile(*.*,select the image); image1imread(num2str(filename1));subplot(2,2,1);imshow(image1); title(original image…

python Chrome + selenium自动化测试与python爬虫获取网页数据

一、使用PythonseleniumChrome 报错&#xff1a; selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only supports Chrome version 78 说明&#xff0c;这个chrom驱动支持78版本 谷歌浏览器版本 进入驱动…

[Python]网络爬虫(七):Python中的正则表达式教程(转)

接下来准备用糗百做一个爬虫的小例子。 但是在这之前&#xff0c;先详细的整理一下Python中的正则表达式的相关内容。 正则表达式在Python爬虫中的作用就像是老师点名时用的花名册一样&#xff0c;是必不可少的神兵利器。 以下内容转自CNBLOG&#xff1a;http://www.cnblogs.co…

八种常见的 SQL 错误用法

来源&#xff1a;https://dwz.cn/cgAPOWPx1、LIMIT 语句分页查询是最常用的场景之一&#xff0c;但也通常也是最容易出问题的地方。比如对于下面简单的语句&#xff0c;一般 DBA 想到的办法是在 type, name, create_time 字段上加组合索引。这样条件排序都能有效的利用到索引&a…

最快速度找到内存泄漏

2019独角兽企业重金招聘Python工程师标准>>> 确认是否存在内存泄漏 我们知道&#xff0c;MFC程序如果检测到存在内存泄漏&#xff0c;退出程序的时候会在调试窗口提醒内存泄漏。例如&#xff1a; class CMyApp : public CWinApp { public:BOOL InitApplication(){in…

如何手撸一个队列?队列详解和面试题汇总(含答案)

队列&#xff08;Queue&#xff09;&#xff1a;与栈相对的一种数据结构&#xff0c; 集合&#xff08;Collection&#xff09;的一个子类。队列允许在一端进行插入操作&#xff0c;而在另一端进行删除操作的线性表&#xff0c;栈的特点是后进先出&#xff0c;而队列的特点是先…

Python根据IP地址获取MAC地址

Python3根据IP地址获取MAC地址&#xff08;不能获取本机IP&#xff0c;可以获取与本机同局域网设备IP的MAC&#xff09; main.py #!/usr/bin/env python3 # -*- coding: utf-8 -*- import os import platform import reclass IP2MAC:"""Python3根据IP地址获取…

eclipse启动tomcat 404

eclipse启动tomcat 404 引用自&#xff1a;http://blog.sina.com.cn/s/blog_8020e41101014lvu.html 感谢博主 状态描述&#xff1a; 在eclipse中启动Tomcat后&#xff0c;在浏览器中访问localhost:8080&#xff0c;显示404错误。 在%tomcat_home%/bin中启动startup.sh却可以正常…

漂亮又好用的Redis可视化客户端汇总

因为 Redis 官方只提供了命令行版的 Redis 客户端 redis-cli&#xff0c;以至于我们在使用的时候会比较麻烦&#xff0c;通常要输入一堆命令&#xff0c;而且命令行版的客户端看起来也不够直观&#xff0c;基于以上两个原因我们需要找一个可视化的 Redis 客户端&#xff0c;下面…

python基本的信号与槽函数的使用 信号发射 槽函数接收

# 熟悉信号与槽的使用 # -*- coding: utf-8 -*- from PyQt5.QtWidgets import * from PyQt5.QtCore import * import sys# 创建信号类 class QTypeSigner(QObject):# 定义一个信号sendmsg pyqtSignal(object)def __init__(self):super(QTypeSigner, self).__init__()def run(s…

Linux 高性能服务器编程——多线程编程

问题聚焦&#xff1a;在简单地介绍线程的基本知识之后&#xff0c;主要讨论三个方面的内容&#xff1a; 1 创建线程和结束线程&#xff1b; 2 读取和设置线程属性&#xff1b; 3 线程同步方式&#xff1a;POSIX信号量&#xff0c;互斥锁和条件变量。Linux线程概述线程…