Python学习之多线程、多进程

前言:

在了解本章之前,我们先来了解下什么是线程和进程:
在计算机科学中,进程和线程是执行程序的基本单元,它们在操作系统的管理下运作,但它们之间有着本质的区别。理解进程和线程的概念对于进行有效的程序设计和系统管理非常重要。
进程(Process)
进程可以被理解为一个运行中的程序的实例。它是系统资源分配和执行的基本单位。每个进程都有自己独立的内存空间(包括代码段、数据段和堆栈等),进程间的通信(IPC,Inter-process communication)需要特定的机制(如管道、消息队列、共享内存等)来实现。
操作系统管理的任务,比如执行一个应用程序,通常都是在一个独立的进程中完成的。进程具有以下特性:
独立性:每个进程都有自己独立的地址空间和系统资源。
并发性:多个进程可以同时运行在多核或单核CPU系统上。
隔离性:一个进程崩溃通常不会影响到其他进程。
线程(Thread)
线程,有时被称为轻量级进程,是进程的执行单元。一个进程中可以包含一个或多个线程,所有线程共享该进程的地址空间和资源,但每个线程有自己的执行路径和状态(比如程序计数器、寄存器和栈)。线程之间的通信和数据共享更为容易,因为它们共享相同的进程空间,但这也意味着需要额外的注意来避免资源竞争和同步问题。
线程具有以下特性:
轻量级:创建和销毁线程比进程更快,线程间的切换开销也更小。
共享数据:线程之间可以直接访问相同的数据和资源,这使得数据共享和通信更方便。
多线程:一个单独的进程可以并发执行多个线程,实现程序的并行处理。
进程与线程的对比
资源分配:进程是资源分配的基本单位,有独立的地址空间;线程是CPU调度的基本单位,是进程中的一个实体,是比进程更小的能独立运行的基本单位,线程自身基本上不拥有系统资源(除了必要的少量资源外),它与进程内的其他线程共享进程所拥有的全部资源。
通信方面:由于线程共享相同的地址空间,线程之间的通信相对简单,但需要处理同步和互斥;进程间通信则需要通过IPC机制。
独立性:进程之间相互独立,一个进程的崩溃不会影响到其他进程;而线程之间共享进程资源,一个线程的错误可能影响到整个进程的其他线程。
效率:线程的创建、销毁和切换的开销小于进程。
概括来说,进程和线程都是操作系统中的并发执行的单位,但线程是进程的一部分,二者在资源管理、通信机制、开销和设计上都有差异。理解这些差异对于设计高效、稳定的并发程序至关重要。

1. 多线程 (Threading)

多线程是操作系统能够在同一进程中并行处理多个任务的能力。在纯Python代码中,由于全局解释器锁(Global Interpreter Lock, GIL)的存在,同一时刻只允许一个线程执行Python字节码。因此,在CPU密集型任务中,Python的多线程并不会带来太大的性能提升,但在I/O密集型任务中,多线程可以在一个线程等待外部响应时允许其他线程执行,这样可以提高程序的整体效率。

1.1 多线程例子:

import threading
import timedef print_numbers():for i in range(1, 6):time.sleep(1)print(i)def print_letters():for letter in 'abcde':time.sleep(1.5)print(letter)# 创建线程
t1 = threading.Thread(target=print_numbers)
t2 = threading.Thread(target=print_letters)# 启动线程
t1.start()
t2.start()# 等待线程完成
t1.join()
t2.join()

start() 方法:
用于启动一个Thread(线程)实例。在创建Thread实例后,线程并不会立即执行,直到调用了它的start()方法,该线程才真正被操作系统调度,开始运行对应的target函数。

join() 方法:
用来等待线程结束的。当在某个线程A中调用另外一个线程B的join()方法时,线程A将被阻塞,直到线程B完成执行后才继续执行线程A之后的操作。join()方法对于控制程序流程和确保线程按期望执行完成非常有用。

1.2 多线程中的Queue:

在多线程编程中,queue模块中的Queue类是一个线程安全的队列实现,它提供了一种安全的方式来交换信息或数据,使得在不同线程间通信变得简单而且不易出错。Queue的作用主要有以下几点:
线程间的数据交换:
Queue允许多个线程放入元素和取出元素,这些操作内部是自动加锁的,因此线程在这些操作中不会彼此干扰,也不会造成数据结构的损坏。
任务调度:
Queue常被用来分发任务,其中一个线程(通常称作生产者)负责将任务放到队列中,然后多个处理线程(通常称作消费者)可以同时从队列中取出任务并执行。
同步与顺序控制:
Queue可以用来协调线程的执行,例如可以用它来确保任务按照放入队列的顺序来处理;或在pipeline中,Queue可以用作各阶段中的缓存,同步不同阶段的处理速度。
缓解生产者和消费者速度不匹配问题:
如果生产者线程的生产速度快于消费者线程的处理速度,那么Queue可以作为缓冲区,暂存任务避免生产者直接阻塞等待。
资源池管理:
Queue同时也可以用来管理资源池,比如数据库连接池,线程可以从队列中获取资源进行操作,操作完成后再放回队列供其他线程使用。
Queue提供了多种方法(如put(), get(), qsize(), empty(), full()以及join()和task_done())来支持其上述作用:
put(item): 将item放入队列中。
get(): 从队列中移除并返回一个元素。若队列为空,调用该方法的线程会被阻塞,直到有元素可以返回。
qsize(): 返回队列中大致的元素数量(由于多线程的原因,这个数量可能不准确)。
empty(): 检查队列是否为空。
full(): 检查队列是否已满。
join(): 阻塞调用线程,直到队列中所有元素都被处理(task_done() 被每个元素调用一次)。
task_done(): 告诉队列,之前排队的一个元素的处理已完成,当队列中的所有元素都被处理完成后,调用join()的线程才会被解锁继续执行。

1.2.1 多线程中带参数的使用和Queue的应用
import threading
import queue
import time# 线程要执行的函数,计算平方并将结果放入队列
def calc_square(numbers, results_queue):for number in numbers:time.sleep(0.5)  # 模拟耗时操作square = number * numberresults_queue.put(square)print(f"Square of {number} is {square}")# 创建一个queue来存放结果
results_queue = queue.Queue()# 定义一组数字
numbers = [2, 4, 6, 8]# 创建线程,带参数
thread = threading.Thread(target=calc_square, args=(numbers, results_queue))# 启动线程
thread.start()# 等待线程完成
thread.join()# 从队列中获取计算结果
while not results_queue.empty():square = results_queue.get()  # 通过queue.get获取计算结果print(f"Square result from queue: {square}")输出:
# Square of 2 is 4
# Square of 4 is 16
# Square of 6 is 36
# Square of 8 is 64
# Square result from queue: 4
# Square result from queue: 16
# Square result from queue: 36
# Square result from queue: 64

在这个例子中,我们定义了一个calc_square函数,它接收一组数字和一个队列。对每个数字计算平方,并将结果放入队列。我们通过args参数给线程传递了需要处理的数字列表和用于存储结果的队列。线程启动后会执行calc_square函数,主线程通过join()等待线程完成。最后,主线程从队列中取出并打印了平方计算的结果。

2. 多进程(multiprocessing)

多进程是指操作系统能够运行多个进程,为每个进程分配独立的内存空间,每个进程中可能有一个或多个线程。多进程可以绕过GIL的限制,在Python中实现真正的并行计算,尤其适合CPU密集型任务。

2.1 多进程例子:

import multiprocessing
import timedef calculate_square(numbers):for n in numbers:time.sleep(0.5)print('Square:', n * n)def calculate_cube(numbers):for n in numbers:time.sleep(0.5)print('Cube:', n * n * n)#  多进程需要在if __name__ == '__main__' 中调用, 这是因为Windows没有fork()调用,因此Python解释器在Windows上需要通过“引导(bootstrapping)”的方式来启动新的Python进程,这意味着它会重新导入主模块
if __name__ == '__main__':numbers = [2, 3, 4, 5]# 创建进程p1 = multiprocessing.Process(target=calculate_square, args=(numbers,))p2 = multiprocessing.Process(target=calculate_cube, args=(numbers,))# 启动进程p1.start()p2.start()# 等待进程完成p1.join()p2.join()# 输出:
# Square: 4
# Cube: 8
# Square: 9
# Cube: 27
# Square: 16
# Cube: 64
# Square: 25
# Cube: 125

2.2 多进程中Queue的使用

from multiprocessing import Process, Queue
import timedef worker(task_queue, result_queue):"""工作进程,用于处理任务并将结果放入结果队列"""while not task_queue.empty():task = task_queue.get()print(f'Process {task}...')processed_result = task * task  # 假设任务为计算数值的平方time.sleep(1)  # 模拟工作负载result_queue.put(processed_result)if __name__ == '__main__':# 创建任务队列和结果队列task_queue = Queue()result_queue = Queue()# 填充任务队列tasks = [2, 3, 5, 7, 11]for t in tasks:task_queue.put(t)# 创建并启动多个工作进程num_processes = 3processes = [Process(target=worker, args=(task_queue, result_queue)) for _ in range(num_processes)]for p in processes:p.start()for p in processes:p.join()  # 等待所有进程完成# 收集结果results = []while not result_queue.empty():results.append(result_queue.get())print(f"Results: {results}")# 输出:
# Process 2...
# Process 3...
# Process 5...
# Process 7...
# Process 11...
# Results: [9, 4, 25, 121, 49]

在这个示例中,我们定义了一个工作进程函数worker,它从task_queue中获取任务,处理这些任务(在这里是计算数值的平方),然后将结果放入result_queue。task_queue和result_queue都是通过multiprocessing.Queue创建的队列,它们可以在不同的进程间安全地传输Python对象。
我们首先将任务放入task_queue,然后创建了几个工作进程并启动,每个工作进程都接收task_queue和result_queue作为参数(使用args参数传递)。工作进程都完成后,主进程将从result_queue中收集所有结果,并打印出来。

3. 全局解释器锁GIL

全局解释器锁(Global Interpreter Lock,简称GIL)是Python解释器中一个用来保护Python对象防止多个线程同时访问的机制。GIL确保同一时刻只有一个线程可以执行Python字节码(即CPython的一部分),因此即使在多核处理器上,CPython的多线程程序也不能实现真正的并行执行(至少不是在执行Python字节码时)。

这个锁是Python的内部细节,特别是在CPython解释器中,因为这是目前最流行的Python实现。GIL并不是Python语言的固有特性,而是CPython解释器的设计选择。一些其他的Python解释器,比如Jython或IronPython,因为它们依赖于Java Virtual Machine(JVM)或.NET的CLR(Common Language Runtime),它们并没有像CPython那样的GIL。
GIL是为了简化CPython中多线程操作的复杂性而引入的,因为内存管理并不是线程安全的。因为GIL的存在,使得CPython的垃圾收集器,尤其是引用计数这一部分,不需要额外的同步机制,从而在单线程情况下有更好的性能。
然而,GIL也有不少缺点:
多核处理器的利用率低:在多核处理器上运行的多线程程序,由于GIL的原因,不能完全利用多核的优势来并行执行任务。
性能问题:在多线程程序中频繁地获取和释放GIL会引起性能瓶颈,这个过程中会产生额外的开销,尤其是在线程数量较多时。
编程复杂性:开发者要想在CPython中编写真正并行的多线程程序时需要格外考虑GIL,并可能采用其他方法(例如多进程)来规避。
在这里插入图片描述

为了绕过GIL的限制,Python的开发者通常会使用以下方法:
使用多进程(而非多线程),因为每个进程有自己的Python解释器和内存空间,因此GIL不会成为限制。
使用基于C语言的扩展来执行计算密集的任务,在C语言的扩展中可以释放GIL。
使用其他实现的Python解释器,例如PyPy,它也有GIL,但是用了一些技术来减少GIL的影响;或使用完全没有GIL的Jython或IronPython(这些解释器有其他限制)。
虽然GIL在是Python社区中常被诟病的话题,但Python仍然非常流行,这表明GIL并不是对大多数Python程序来说绝对的障碍。对于一些高并发处理的需求,通常会有其他语言或架构层面的解决方案。

4. 多进程和多线程的比较

在这里插入图片描述
线程在进程下行进(单纯的车厢无法运行)
一个进程可以包含多个线程(一辆火车可以有多个车厢)
不同进程间数据很难共享(一辆火车上的乘客很难换到另外一辆火车,比如站点换乘)
同一进程下不同线程间数据很易共享(A车厢换到B车厢很容易)
进程要比线程消耗更多的计算机资源(采用多列火车相比多个车厢更耗资源)
进程间不会相互影响,一个线程挂掉将导致整个进程挂掉(一列火车不会影响到另外一列火车,但是如果一列火车上中间的一节车厢着火了,将影响到该趟火车的所有车厢)
进程可以拓展到多机,进程最多适合多核(不同火车可以开在多个轨道上,同一火车的车厢不能在行进的不同的轨道上)
进程使用的内存地址可以上锁,即一个线程使用某些共享内存时,其他线程必须等它结束,才能使用这一块内存。(比如火车上的洗手间)-”互斥锁(mutex)”
进程使用的内存地址可以限定使用量(比如火车上的餐厅,最多只允许多少人进入,如果满了需要在门口等,等有人出来了才能进去)-“信号量(semaphore)” (看的某篇博客的总结,就抄录在此了)

总结

如果任务是I/O密集型的,比如网络操作或磁盘读写,多线程能够提高效率。
如果任务是CPU密集型的,比如复杂计算,可以考虑多进程,以并行地利用CPU资源。
在实际应用中,适当选择多线程或多进程,甚至两者结合使用,可以优化程序的性能。然而,在使用多线程和多进程时,需要考虑线程或进程间的通信、数据共享、同步和死锁等问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/783425.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

(C语言)fread与fwrite详解

1. fwrite函数详解 头文件&#xff1a;stdio.h 函数有4个参数&#xff0c;只适用于文件输出流 作用&#xff1b;将从ptr中拿count个大小为size字节的数据以二进制的方式写到文件流中。返回写入成功的数目。 演示 #include <stdio.h> int main() {FILE* pf fopen(&qu…

Ruoyi-Cloud-Plus_使用Docker部署分布式微服务系统_环境准备_001---SpringCloud工作笔记200

1.首先安装docker: 如果以前安装过首先执行: yum remove docker docker-client docker-client-latest docker-common docker-latest docker-latest-logrotate docker-logrotate docker-selinux docker-engine-selinux docker-engine 去卸载docker 2.安装dokcer需要的工具包…

如何使用固定公网地址远程访问内网Axure RP生成的网站原型web页面

文章目录 前言1.在AxureRP中生成HTML文件2.配置IIS服务3.添加防火墙安全策略4.使用cpolar内网穿透实现公网访问4.1 登录cpolar web ui管理界面4.2 启动website隧道4.3 获取公网URL地址4.4. 公网远程访问内网web站点4.5 配置固定二级子域名公网访问内网web站点4.5.1创建一条固定…

GPT提示词分享 —— 智能域名生成器

提示词&#x1f447; 我希望你能充当一个聪明的域名生成器。我将告诉你我的公司或想法是什么&#xff0c;你将根据我的提示回复我一份域名备选清单。你只需回复域名列表&#xff0c;而不是其他。域名应该是最多 7-8 个字母&#xff0c;应该简短但独特&#xff0c;可以是朗朗上口…

WiFiSpoof for Mac wifi地址修改工具

WiFiSpoof for Mac&#xff0c;一款专为Mac用户打造的网络隐私守护神器&#xff0c;让您在畅游互联网的同时&#xff0c;轻松保护个人信息安全。 软件下载&#xff1a;WiFiSpoof for Mac下载 在这个信息爆炸的时代&#xff0c;网络安全问题日益凸显。WiFiSpoof通过伪装MAC地址&…

12.windows Ubuntu 子系统:构建非冗余基因集

上次我们用prodigal对contig进行了ORF&#xff08;开放阅读框&#xff09;预测&#xff0c;可见11.windows ubuntu 子系统 contig ORF&#xff08;开放阅读框&#xff09;预测。-CSDN博客&#xff0c;接下来我们便开始构建非冗余基因集。 构建非冗余基因集有几个重要的原因&…

Redis持久化 RDB AOF

前言 redis的十大类型终于告一段落了,下面我们开始redis持久化新篇章 为啥需要持久化呢? 我们知道redis是挡在mysql前面的带刀侍卫 是在内存中的,假如我们的redis宕机了,难道数据直接冲入mysql??? 这显然是不可能的,mysql肯定扛不住这样的场景,所以我们有了redis持久化策略…

【洛谷】P9241 [蓝桥杯 2023 省 B] 飞机降落

挺有意思的一道题&#xff0c;分享给大家 题目链接 P9241 [蓝桥杯 2023 省 B] 飞机降落 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 题目描述 输入格式 输出格式 输入输出样例 说明/提示 思路 一开始尝试贪心能不能做&#xff0c;但是不好确定飞机的顺序 因为这题的数…

时序预测 | Matlab实现OOA-BP鱼鹰算法优化BP神经网络时间序列预测

时序预测 | Matlab实现OOA-BP鱼鹰算法优化BP神经网络时间序列预测 目录 时序预测 | Matlab实现OOA-BP鱼鹰算法优化BP神经网络时间序列预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.Matlab实现OOA-BP鱼鹰算法优化BP神经网络时间序列预测&#xff08;完整源码和数据…

Available platform plugins are: linuxfb, minimal, offscreen, vnc.

说明&#xff1a; buildroots根文件中已经移植好了QT的库&#xff0c;但是运行QT交叉编译之后的可执行文件报错&#xff1a; qt.qpa.plugin: Could not find the Qt platform plugin "eglfs" in "" This application failed to start because no Qt platf…

认识V模型、W模型、H模型

软件测试与软件工程息息相关&#xff0c;软件测试是软件工程组成中不可或缺的一部分。 在软件工程、项目管理、质量管理得到规范化应用的企业&#xff0c;软件测试也会进行得比较顺利&#xff0c;软件测试发挥的价值也会更大。 要关注软件工程、质量管理以及配置管理与软件测试…

记录实现水平垂直居中的5种方法

记录块级元素实现水平垂直居中的方法&#xff0c;效果如图。 <div class"parent"><div class"child">居中元素</div> </div><style> .parent {position: relative;width: 600px;height: 300px;background-color: #679389; …

Spring IoC详解

1.什么是IoC Spring IoC&#xff08;Inversion of Control&#xff0c;控制反转&#xff09;是Spring框架的核心之一&#xff0c;它是一种设计模式&#xff0c;也称为依赖注入&#xff08;Dependency Injection&#xff0c;DI&#xff09;。在传统的程序设计中&#xff0c;对象…

算法学习——LeetCode力扣动态规划篇10(583. 两个字符串的删除操作、72. 编辑距离、647. 回文子串、516. 最长回文子序列)

算法学习——LeetCode力扣动态规划篇10 583. 两个字符串的删除操作 583. 两个字符串的删除操作 - 力扣&#xff08;LeetCode&#xff09; 描述 给定两个单词 word1 和 word2 &#xff0c;返回使得 word1 和 word2 相同所需的最小步数。 每步 可以删除任意一个字符串中的一个…

HarmonyOS 应用开发之Stage模型绑定FA模型ServiceAbility

本小节介绍Stage模型的两种应用组件如何绑定FA模型ServiceAbility组件。 UIAbility关联访问ServiceAbility UIAbility关联访问ServiceAbility和UIAbility关联访问ServiceExtensionAbility的方式完全相同。 import common from ohos.app.ability.common; import hilog from o…

Qt源码调试步骤记录

1.源码&#xff1a; 两种方式&#xff0c;要么安装qt时选择source&#xff0c;要么从官网下载源码&#xff0c;然后在qt creator中设置路径。二选一即可。我选的第二种。 1.1.第一种&#xff0c;安装时选择source&#xff1a; 1.2.第二种&#xff0c;下载源码设置路径&#x…

安装部署MariaDB数据库管理系统

目录 一、初始化MariaDB服务 1、安装、启动数据库服务程序、将服务加入开机启动项中。 2、为保证数据库安全性和正常运转&#xff0c;需要对数据库程序进行初始化操作。 3、配置防火墙&#xff0c;放行对数据库服务程序的访问请求&#xff0c;允许管理员root能远程访问数据…

灵动翻译音频文件字幕提取及翻译;剪映视频添加字幕

参考&#xff1a;视频音频下载工具 https://tuberipper.com/21/save/mp3 1、灵动翻译音频文件字幕提取及翻译 灵动翻译可以直接chorme浏览器插件安装&#xff1a; 点击使用&#xff0c;可以上传音频文件 上传后自动翻译&#xff0c;然后点击译文即可翻译成中文&#xff0c;…

跨越界限:AI大模型在关键技术领域的综合应用

AI大模型学习 在当前技术环境下&#xff0c;AI大模型学习不仅要求研究者具备深厚的数学基础和编程能力&#xff0c;还需要对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法&#xff0c;AI大模型学习能够不断提升模型的准确性和效率&#xff0c;为人类生活和工作带…

深入理解MySQL:拼接字符串、查询、删除表和创建索引的关键命令

MySQL是一种功能强大的关系型数据库管理系统&#xff0c;广泛应用于各种类型的应用程序中。本文将介绍MySQL中一些常用的关键命令&#xff0c;包括拼接字符串、查询、删除表和创建索引&#xff0c;帮助读者更好地理解和利用MySQL数据库。 mysql拼接字符串 在MySQL中&#xf…