简明 Python 教程(第14章 Python的多线程)

Python多线程是指在Python程序中可以同时运行多个线程,每个线程可以执行不同的任务。Python提供了两个标准库来支持多线程:threading_thread。通常,推荐使用threading模块,因为它提供了更高级别的API,更易于使用。

Python多线程的基本概念:

  1. 线程(Thread):线程是程序执行的最小单元,是操作系统能够进行运算调度的最小单位。Python的线程是直接映射到操作系统的原生线程上的。

  2. 全局解释器锁(Global Interpreter Lock GIL):Python的线程受到全局解释器锁(GIL)的限制,这意味着在任何时刻,只有一个线程可以执行Python字节码。但是,I/O操作和某些其他任务可以释放GIL,从而允许其他线程运行。

  3. 线程安全:当多个线程访问共享资源时,如果不当操作可能会导致数据的不一致性。因此,需要采取同步措施来保证线程安全。

使用threading模块的基本步骤:

  1. 定义线程任务:创建一个函数,该函数将作为线程的执行体。

  2. 创建线程对象:使用threading.Thread构造函数创建线程对象,将目标函数传递给构造函数。

  3. 启动线程:调用线程对象的start()方法启动线程。

  4. 等待线程结束:可以使用join()方法等待线程结束。

示例:

以下是一个简单的Python多线程示例,其中创建了两个线程,每个线程简单地打印一个字符串多次:

import threading
import time# 定义线程要执行的代码
def print_numbers():for i in range(1, 6):time.sleep(1)print(f"Thread {threading.current_thread().name} prints {i}")# 创建线程
thread1 = threading.Thread(target=print_numbers, name='Thread-1')
thread2 = threading.Thread(target=print_numbers, name='Thread-2')# 启动线程
thread1.start()
thread2.start()# 等待线程执行结束
thread1.join()
thread2.join()print("主程序结束")

输出示例:

Thread Thread-1 prints 1
Thread Thread-2 prints 1
Thread Thread-1 prints 2
Thread Thread-2 prints 2
Thread Thread-1 prints 3
Thread Thread-2 prints 3
Thread Thread-1 prints 4
Thread Thread-2 prints 4
Thread Thread-1 prints 5
Thread Thread-2 prints 5
主程序结束

注意事项:

  • 线程同步:当多个线程需要访问共享资源时,需要使用锁(Lock)或其他同步机制来避免竞态条件。

  • 线程池:在实际应用中,通常会使用线程池来管理线程,以避免创建过多的线程资源。

  • I/O密集型任务:由于GIL的存在,Python多线程更适合I/O密集型任务,而对于CPU密集型任务,可能需要考虑使用多进程。

  • 多进程:对于CPU密集型任务,可以使用multiprocessing模块来实现进程并行,每个进程有自己的Python解释器和内存空间,因此不受GIL的限制。

  • 线程优先级:Python线程的优先级是相同的,它们由操作系统的调度器公平调度。

通过合理地使用多线程,可以提高程序的响应性和执行效率,尤其是在I/O操作等待时可以执行其他任务。然而,线程的使用需要仔细考虑同步和资源管理问题,以避免潜在的并发问题。

线程池的应用:

Python线程池是一种执行器(Executor)模式,用于在一个后台线程中执行任务,这有助于程序的并发执行。线程池的主要目的是减少在创建和销毁线程时所产生的性能开销。通过重用已经创建的线程来执行新的任务,线程池提高了程序的效率。

线程池的核心概念包括:

  1. 工作线程(Worker Threads):线程池中的线程,用于执行任务。
  2. 任务队列:一个阻塞队列,用于存放待执行的任务。
  3. 线程池管理器:负责管理线程的创建、销毁和任务的分发。

Python标准库中的concurrent.futures模块提供了ThreadPoolExecutor类,它是实现线程池的一个非常方便的工具。

ThreadPoolExecutor的主要参数:

  • max_workers:线程池中线程的数量,默认为CPU核心数。
  • thread_name_prefix:可选参数,用于设置线程的名称前缀。

使用ThreadPoolExecutor的基本步骤:

  1. 创建线程池:实例化ThreadPoolExecutor
  2. 提交任务:使用executor.submit()提交需要执行的函数和参数。
  3. 关闭线程池:任务执行完毕后,调用executor.shutdown()来关闭线程池。

示例1:

以下是一个使用ThreadPoolExecutor的简单示例,其中创建了一个线程池并在其中执行多个任务:

import concurrent.futures
import time# 定义一个任务函数
def task(num):print(f"Start task {num}")time.sleep(1)  # 模拟耗时操作print(f"End task {num}")return num * num# 使用线程池执行任务
def main():with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:# 提交任务到线程池futures = [executor.submit(task, num) for num in range(10)]# 等待所有任务完成concurrent.futures.wait(futures)# 获取任务结果for future in futures:result = future.result()print(f"Task result: {result}")if __name__ == "__main__":main()

在这个示例中,我们创建了一个最大容纳5个工作线程的线程池,并提交了10个任务。任务是简单的函数,它们只是休眠1秒并返回一个计算结果。我们使用concurrent.futures.wait()来等待所有任务完成,然后获取每个任务的结果。

示例2:

import requests
from concurrent.futures import ThreadPoolExecutor
import time# 定义一个下载网页的函数
def download_page(url):try:response = requests.get(url, timeout=10)  # 10秒超时return len(response.content), urlexcept requests.RequestException as e:print(f"请求失败: {url}, 错误: {e}")return None# 定义一个处理下载结果的函数
def process_results(future):result = future.result()if result:file_size, url = resultprint(f"{url} - 下载了 {file_size} 字节")# 要下载的网页列表
urls = ['http://www.example.com','http://www.google.com','http://www.python.org',# 添加更多URL...
]# 记录开始时间
start_time = time.time()# 使用线程池下载网页
with ThreadPoolExecutor(max_workers=5) as executor:# 提交所有下载任务futures = [executor.submit(download_page, url) for url in urls]# 为每个任务指定一个处理结果的函数for future in futures:executor.submit(process_results, future)# 记录结束时间,并计算总耗时
end_time = time.time()
print(f"所有任务完成,总耗时: {end_time - start_time} 秒")

在这个示例中:

  1. 我们定义了download_page函数,它负责下载单个网页并返回网页的大小和URL。

  2. process_results函数用于处理下载结果,打印出每个网页的下载情况。

  3. 我们创建了一个包含多个URL的列表,并使用ThreadPoolExecutor来创建一个最大容纳5个工作线程的线程池。

  4. 使用executor.submit()提交所有下载任务,并使用concurrent.futures.wait()等待所有任务完成。

  5. 我们使用executor.submit()再次提交每个future对象到process_results函数,以便异步地处理结果。

  6. 在所有任务完成后,我们计算并打印出总耗时。

请注意,多线程环境下进行网络请求时,可能会受到全局解释器锁(GIL)的影响,这意味着如果有大量的CPU密集型操作,可能不会看到显著的性能提升。对于I/O密集型任务,如网络请求,多线程可以提高效率,因为线程可以在等待I/O操作时被操作系统调度去执行其他任务。

 

线程池优势

  1. 控制并发数:Python的线程池可以控制系统中运行的线程数量,避免了因为创建过多线程而导致系统资源耗尽。
  2. 提高性能:通过复用已经创建的线程,可以避免频繁地创建和销毁线程所带来的性能开销。
  3. 简化代码:使用线程池,我们只需要将任务提交给线程池,无需手动管理每个线程的生命周期。
  4. 异步处理:Python的线程池提供了异步处理任务的能力。当我们提交任务给线程池后,线程池会在后台进行处理,不会阻塞主程序的执行。
  5. 调度方便:线程池还提供了一些调度功能,如定时执行、周期执行等。
  6. 任务队列:线程池内部维护了一个任务队列,如果线程池中的所有线程都在忙,新来的任务会被放入队列中等待执行,这样可以保证所有提交给线程池的任务都会被执行,不会丢失。

线程同步 

线程同步是多线程编程中的一个重要概念,用于控制对共享资源的访问,以防止多个线程同时修改数据,从而引发竞态条件和数据不一致的问题。Python提供了多种同步原语,如锁(Lock)、事件(Event)、条件(Condition)和信号量(Semaphore)等,来帮助程序员实现线程间的同步。

以下是一个使用threading.Lock实现线程同步的示例。在这个例子中,多个线程尝试同时更新一个共享的计数器,但为了保证计数的准确性,我们使用锁来确保每次只有一个线程能更新计数器

import threading# 创建一个锁对象
lock = threading.Lock()# 共享资源:计数器
counter = 0# 定义线程要执行的任务
def increment_counter(thread_id):global counterfor _ in range(1000):# 使用锁来确保线程安全lock.acquire()try:# 线程安全地更新计数器counter += 1print(f"Thread {thread_id}: Counter is now {counter}")finally:# 确保释放锁,即使发生异常lock.release()# 创建线程列表
threads = []# 创建并启动10个线程
for i in range(10):thread = threading.Thread(target=increment_counter, args=(i,))threads.append(thread)thread.start()# 等待所有线程完成
for thread in threads:thread.join()print(f"Final counter value: {counter}")

 

在这个示例中:

  1. 我们定义了一个全局变量counter作为共享资源,并初始化了一个threading.Lock对象用于同步。

  2. increment_counter函数中,每个线程将执行1000次对计数器的增加操作。我们使用lock.acquire()来获取锁,确保在更新计数器时不会有其他线程干扰。使用try...finally结构确保即使在更新计数器的过程中发生异常,锁也能被正确释放。

  3. 我们创建了10个线程,并将它们存储在threads列表中。每个线程启动后,将并发地执行increment_counter函数。

  4. 使用thread.join()等待所有线程完成。这确保了主线程在所有子线程完成之前不会退出。

  5. 最后,我们打印出最终的计数器值。

请注意,虽然在这个例子中我们使用了锁来保证计数器更新的线程安全,但在实际应用中,过度使用锁可能会导致性能瓶颈,因为锁会限制线程的并行度。因此,设计多线程程序时需要仔细权衡同步和并行性之间的关系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/825869.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

嵌入式4-18

做一个简单数据库终端操作系统 #include <myhead.h> int main(int argc, const char *argv[]) {int id;char name[16];float score;sqlite3 *pNULL;if(sqlite3_open("./my.db",&p)!SQLITE_OK){printf("sqlite3_open error\n");return -1;} …

python中中英文打印对齐解决方案

在python中&#xff0c;有时候会出现中英文混合输出的情形&#xff0c;但是由于中文默认是全角格式&#xff08;一个中文字符占用两个字符宽度&#xff09;&#xff0c;这会对python原生的print函数带来一些障碍。尤其是用户用print对齐输出的时候&#xff0c;这种差异会导致文…

顺序表链表经典算法题

1.链表反转 typedef struct ListNode listnode; struct ListNode* reverseList(struct ListNode* head) {if(head NULL){return head;}listnode* p1 NULL;listnode* p2 head;listnode* p3 head->next;while(p2){p2->next p1;p1 p2;p2 p3;if(p3)p3 p3->next;}…

ASP.NET MVC企业级程序设计 (商品管理:小计,总计,删除,排序)

目录 效果图 实现过程 1创建数据库 2创建项目文件 3创建控制器&#xff0c;右键添加&#xff0c;控制器 ​编辑 注意这里要写Home​编辑 创建成功 数据模型创建过程之前作品有具体过程​编辑 4创建DAL 5创建BLL 6创建视图&#xff0c;右键添加视图 ​编辑 7HomeCont…

ST-GCN模型详解(+openpose)

ST-GCN模型详解&#xff08;openpose&#xff09; 一、什么是ST-GCN呢 基于骨架的动作识别&#xff08;Skeleton-Based Action Recognition&#xff09;主要任务是从一系列时间连续的骨骼关键点&#xff08;2D/3D&#xff09;中识别出正在执行的动作。因为牵涉到骨骼框架这种…

draw.io使用心得

draw.io&#xff08;现在称为 “diagrams.net”&#xff09;是一个非常受欢迎的免费在线图表和流程图工具。以下是一些关于使用draw.io的心得体会&#xff1a; 易用性 直观的界面&#xff1a;draw.io提供了一个直观且用户友好的界面&#xff0c;使得即使是初学者也能快速上手…

无线电频段划分

业余无线电&#xff0c;被无线电爱好者们亲切地称为“空中的交响乐”&#xff0c;它不仅需要你的热情和技巧&#xff0c;更需要你对不同频段的特性有深入的了解。就像一位音乐家需要熟悉每一种乐器的声音&#xff0c;每一位无线电爱好者也需要掌握每一个频段的特点。注意&#…

智慧公厕解决方案易集成好使用的智能硬件

在现代城市建设中&#xff0c;智慧公厕的需求日益增长。为了提供更好的用户体验和更高效的管理&#xff0c;易集成、好使用的智能硬件成为智慧公厕解决方案的关键组成部分。 1. 蹲位有人无人感应器&#xff1a;是用于检测厕位有人无人的设备&#xff0c;根据现场不同的安装条件…

Flask前端页面文本框展示后端变量,路由函数内外两类

一、外&#xff01;路由函数外的前后端数据传输 Flask后端 ↓ 首先导入包&#xff0c;需要使用 后端&#xff1a;flask_socketio来进行路由外的数据传输&#xff0c; from flask_socketio import SocketIO, emit 前端&#xff1a;还有HTML头文件的设置。 <!DOCTYPE …

DevOps是什么?

DevOps是一系列实践、工具和文化理念的组合&#xff0c;旨在自动化并整合软件开发和信息技术运维团队之间的流程。以下是DevOps的几个关键点&#xff1a; 沟通与协作&#xff1a;DevOps强调开发和运维团队之间的沟通与合作&#xff0c;通过改善这两个部门间的协作关系&#xff…

使用clickhouse-backup备份和恢复数据

作者&#xff1a;俊达 介绍 clickhouse-backup是altinity提供的一个clickhouse数据库备份和恢复的工具&#xff0c;开源项目地址&#xff1a;https://github.com/Altinity/clickhouse-backup 功能上能满足日常数据库备份恢复的需求&#xff1a; 支持单表/全库备份支持备份上…

电脑桌面便签软件哪个好?好用的电脑桌面便签

电脑作为我们日常工作的重要工具&#xff0c;承载着大量的任务和项目。当工作任务繁重时&#xff0c;如何在电脑桌面上高效管理这些任务就显得尤为重要。这时&#xff0c;选择一款优秀的桌面便签软件&#xff0c;无疑会给我们带来极大的便利。 一款好的桌面便签软件&#xff0…

JDK11安装教程

文章目录 1、安装2、配置环境变量 1、安装 双击安装包&#xff0c;点击下一步 更改安装目录&#xff0c;点击下一步 等待安装完成 安装完成 2、配置环境变量 此电脑右键属性 -> 高级系统设置 -> 环境变量 -> 系统变量 -> 新建 变量名&#xff1a;JAVA_HOME变量…

kubernetes学习

1、应用部署方式演变 2、kubernetes介绍 3、kubernetes组件 4、kubernetes概念 5、环境搭建-环境规划 6、环境搭建-主机安装 7、环境搭建-环境初始化 8、环境搭建-集群所需组件安装 9、环境搭建-集群安装 10、环境搭建-网络插件安装 11、环境搭建-环境测试 12、资源管理…

阿里巴巴java 开发手册1.7

《Java 开发手册》是 Java 社区爱好者的集体智慧结晶和经验总结&#xff0c;经历了多次大规模一线实战的检验及不断完善&#xff0c;整理成册后&#xff0c;众多社区开发者踊跃参与打磨完善&#xff0c;系统化地整理成册&#xff0c;当前的最新版本是黄山版。现代软件行业的高速…

Databend 开源周报第 140 期

Databend 是一款现代云数仓。专为弹性和高效设计&#xff0c;为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务&#xff1a;https://app.databend.cn 。 Whats On In Databend 探索 Databend 本周新进展&#xff0c;遇到更贴近你心意的 Databend 。 支持 EXECUTE I…

RabbitMQ项目实战(二)

文章目录 项目改造实现步骤 项目改造 以前把任务提交到线程池&#xff0c;然后在线程池提交中编写处理程序的代码&#xff0c;线程池内排队。 如果程序中断了&#xff0c;任务就没了&#xff0c;就丢了。 改造后的流程&#xff1a; 把任务提交改为向队列发送消息写一个专门接…

Android开发——ListView

activity_main.xml <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_height"match_parent"android:layout_width"match_parent"…

SpringBoot使用maven指定依赖包的版本

目录 1. 解决示例2. 完整pom示例 前言&#xff1a;我们在使用A依赖的时候&#xff0c;这个依赖有引入了第三方B依赖&#xff0c;这时候我想指定B依赖的版本号 1. 解决示例 我想将 mysql、logback、tomcat 的版本升级到指定版本 只需在 pom.xml 文件的 properties 里面添加如下…

3D模型格式转换工具HOOPS Exchange:3D CAD数据的快速导入与导出

在当今的工程设计领域中&#xff0c;快速且可靠地处理3D CAD数据是至关重要的。HOOPS Exchange SDK通过提供一组C软件库&#xff0c;为开发团队提供了实现这一目标的有效工具。 什么是HOOPS Exchange&#xff1f; HOOPS Exchange是一组C软件库&#xff0c;旨在为开发团队提供…