这里是Themberfue
今天,我们将正式进入多线程章节的讲解,希望我的讲解能够让你理解😎
进程
在进入多线程的讲解中,我们先引入进程的概念及其解释
· 操作系统都是大家耳熟能详的名词,常见的操作系统主要有:Linux,Windows,MacOs,IOS,Android,Unix
· 操作系统是计算机中的一个重要软件,一个搞管理的软件:
1.管理各种硬件设备,通过驱动程序来管理各种硬件设备
2.给各种应用程序,提供一个相对稳定的工作环境
· 进程是操作系统中的一个非常重要的概念,一个运行起来的程序,就称为进程。
· 在现代计算机中,同时运行着数十个进程,甚至上百个都是不奇怪的,这就需要操作系统很好的管理这里进程,避免在进程在运行过程中发生不必要的意外。
· 这就需要借助数据结构来管理这些进程。
· 进程是操作系统中资源分配的基本单位
· 站在操作系统的角度上,是如何管理进程的?
1. 首先需要一个结构体,描述该进程的一个属性以及数据,也就是进程控制块(PCB)
2. 随后,需要将这些结构体通过某个数据结构组织起来,方便执行增删查改等操作,例如:Linux就是使用链表来组织这些结构体的。
· 那么一个进程控制块(PCB)中有哪些重要属性呢?
1. pid(进程id),作为唯一标识符指定该线程,进程的身份标识符
2. 内存指针,进程在运行的过程中依赖于内存资源,进程通过内存指针知道执行指令的位置在哪里。
3. 文件描述符表,在进程运行的时候,需要和硬盘的数据进行交互,硬盘上的数据,就是通过文件的形式存储的,在进程打开硬盘中的文件数据时,就会保存到文件描述符表中。
4. 进程状态,主要有 "就绪状态" 和 "阻塞状态" ,就绪状态表示此进程随时可以在CPU上执行,阻塞状态则是不适合到CPU上执行。
5. 进程优先级,同一时间在运行在CPU上运行的进程可能非常多,那么有些进程可能执行的指令多,在整个进程列表中,占据了更重要的位置,那么其的优先级就更高,比如在电脑上运行3A游戏时,这个游戏的进程的优先级一定时最高的。
6. 进程上下文,在进程执行的过程中,可能尚未执行完,被调度走了,那么回过头再度执行该进程时,就要根据该进程的上下文来定位到上次执行到哪里了。类似于游戏的存档读档。
7. 进程的记账信息,起到统计功能,统计每个进程都在CPU上运行了多久,如果发现某个进程很久没有吃到CPU资源了,那么就会倾斜一个资源给该进程。
· 在Windows系统,打开一个后缀为exe的文件,运行了一个程序,就是创建了一个进程。
· 在启动时,操作系统会把exe文件的指令和数据加载到内存中,后续在运行该程序时,就从内存读取指令和数据执行。
· 在Windows系统中可以通过查看任务管理器来进一步查看进程的相关信息,不过不会太详细,只会展示一个简单的PCB信息。
· 早期的操作系统,都是单任务操作系统,一个程序启动了,另一个程序就得结束
· 随着时代的发展,也就诞生了多任务操作系统,可以同时执行多个任务的操作系统,但是早期的CPU还都是单核的,一个核心该如何执行多个任务呢?这就使用了分时复用:把一个单位时间,分成很多份,第一份执行进程1 的指令,第二份执行进程2 的指令,以此类推,在切换过程,由于CPU执行指令的速度时很快的,人还未反应过来,指令就执行完了,也就达成了执行多任务的效果。
· 把一个CPU核心上,按照分时复用,执行多个进程的方式称为:"并发执行"
· 把多个CPU核心上,同时执行多个进程的方式称为:"并行执行"
· 在现代CPU运行这些进程时,并发执行和并行执行是同时存在的,也很少会把作区分,统一习惯性称为 并发。
线程
· 聊完了进程,终于进入正题,也就是线程了。
· 服务器就好像一个餐馆,需要在同一时间处理多个客户的订单,所以引入多进程编程的方式,可以高效处理多个客户端发送请求的情况。
· 但随着时间的推移,互联网越来越普及,走进了千家万户,导致网民大幅增加,服务器所要接受的请求以及给出的响应也就愈来愈多。
· 进程是个很 "重" 的概念,服务器每接受一个请求,都要创建销毁一个进程来响应客户的请求。由于创建和销毁进程的开销都很大,频繁这样做导致服务器的处理效率也越来越低。
· 于是就引入了线程(Thread),轻量级线程,相比较于进程,线程的创建和销毁的开销远小得多。一定程度缓解了请求增多,服务器处理低效的问题
· 每个进程,都相当于要执行的一个任务,每个线程,也是一个要执行的任务(运行的一段代码指令)。每个进程中,都会包含一个或者多个线程。所以进程是包含线程的。
· 上诉红框框起来的可以看成是一个个线程,但Windows任务管理器看到的是并不是线程,它是看不到进程内部的线程的。
· 可以借助一些其他工具查看,例如:VS的调试工具,Windbg等等。
· 如上述所说,进程是操作系统资源分配的基本单位。进程内部管辖的多个线程之间,会共享该进程的内存资源,硬盘资源和网络带宽等等。
· 进程创建时,需要申请资源,销毁时,需要释放资源,这些都很消耗性能的事情。
· 但对于线程来说,只是第一个线程创建时(随着进程的创建而创建)申请资源,后续再次创建线程时,不再涉及到申请资源的操作,同理,只有最后一个线程销毁(随着进程的销毁而销毁)才释放资源。通过这样的的操作,大大缩小了性能的消耗。
· 进程与进程之间,所涉及到的资源是相互独立,互不打扰的。但是某个进程里的线程与线程之间就不是相互独立的,而是资源共享的,这样就难免会导致 "线程安全" 问题。
· 线程的在CPU的调度与进程在CPU的调度相差不大,线程是CPU上调度执行的基本单位。
· 线程在CPU上的调度是随机的。例如:一个进程中包含三个线程,那么可能是线程1先执行,或者线程2先执行,甚至线程3先执行。这三个线程可能在CPU的一个核心上执行,也可能是在三个核心上执行。这些线程的调度都是由操作系统的 "调度器" 的完成的,程序员无从干涉。
· 线程与进程一样,所记录的数据无非就是,调度相关,状态,优先级,记账信息,上下文。
多线程
现假设一个场景,有一个房子,房子的桌子上摆放着 100 只鸡,房间目前只有一个人,只能由他吃完这些鸡。
我们都知道,这样由一个人吃完,效率是非常低效的,也就是好比单进程开发,效率是远比多进程低的。
于是,我们引入第二个进程,也就是第二套房子,第二张桌子以及第二个人,将鸡对半两份,一人吃 50 份。
这样效率确实上去了,但是又是创建房子,又是创建桌子的,难免消耗过多的资源,不如直接叫第二个人来第一套房子,与第一个人一起吃,这样便大大缩小了资源的开销。
这里的人也就是一个线程,两个线程在一个进程里同时工作,效率也会大大加大,也不需要消耗过多的资源。
那么这时候就有人问了:那我多几个线程是不是更多,从理论上来说确实是的。
虽然提高线程的数目,能够提升效率,但也不是 “线性增长” 的。在线程达到一定数目时,就算线程再多,效率也不会又显著的增加了。
桌子的空间本来就那么大,人多了还挤来挤去,不能很好的管理,也就导致拖慢了效率。
线程的数目如果太多,线程的开销也会变得明显,因为调度开销从而拖慢程序的性能。
现控制只有四个线程工作,也能确保一定不会出现问题吗?不一定的。
比如:同一个人,同时拿到了同一个鸡,这时候该怎么办,就导致线程冲突问题。
再比如:一个人没用吃的想吃的,非常生气,直接掀桌不干了,导致整个进程崩溃,这是非常严重的。
Java中也是提供了相应的类,以编写多线程代码。
至于该如何编写多线程代码。
毕竟后事如何,且听下回分解。😊😊😊