本章问题:什么是线程?线程的使用场景?什么是线程池?线程池是如何工作的?线程池共享了哪些资源?线程安全代码怎么写?什么是线程安全?
什么是线程?
线程是为了提高进程的效率。进程的地址空间中保存了cpu执行的机器指令以及函数运行时的堆栈信息,要想让程序运行起来,就要不拿main函数的第一条机器指令地址写入pc寄存器,从而形成一个指令的执行流。
进程的缺点在于只有一个入口函数,就是main()函数。因此进程中的机器指令一次只能被一个cpu执行,有没有办法让多个cpu执行同一个进程中的机器指令呢?
当然,pc寄存器既然可以指向main()函数,也可以指向其他函数,从而创建一个新的执行流。
至此,一个进程内可以有多个入口函数,也就是一个进程存在多个执行流。
更关键的是,这些执行流共享同一个进程地址空间,因此也不再需要进程间通信了。
对于每一条执行流,我们都称其为“线程”。
多线程与内存布局
函数在执行时依赖的信息包括函数参数,局部变量,返回地址等信息,这些信息都被保存在相应的栈帧中。每个函数在运行时都有自己的栈帧,随着函数的调用,以及返回,这些栈帧按照先进后出的顺序增长或减少。栈帧的增长或减少形成地址进程空间中的栈区。
在线程这个概念没有出现时,一个进程中只有一个执行流,因此只有一个栈区,现在有了线程之后就有了多个执行流,每个执行流都要有自己的栈区。
言而总之,想说的就是创建线程是要消耗进程内存看空间的,这一点值得注意。
线程的使用场景(引出线程池的概念)
从生命周期来看,线程要处理的任务有两种:长任务,短任务。
对于长任务没有什么好说的。收到哦一个请求就创建一个线程来处理任务,处理完成之后销毁该栈帧即可。
对于短任务来说,短任务的生命周期短,如一次网络请求一次数据库查询等。这类任务往往判断着一个特点:量大。
(1)对于每次收到一个短任务就创建一个线程,等周期结束再消耗栈帧,必然会消耗大量的时间。(线程的创建和销毁是会消耗时间的)
(2)每个线程都有独立的栈区,当创建大量线程时会消耗过多的内存。
(3)大量线程会使线程的切换开销增加。
因此我们可以提前创建一批线程,有任务就交给做这些线程进行处理。不需要频繁的创建,销毁,没任务就让这些线程的任务队列中阻塞等待。
线程池是如何工作的?
有了任务,有了线程,有了线程池,怎么把任务提交给线程池中的线程呢?
我们用数据结构中的队列来维护线程池。
在没有任务的时候线程池中的线程会在任务队列中阻塞等待,当生产者向任务队列中写入数据课后,线程池中的某个线程会被唤醒,该线程会从任务队列中取出上述结构体并执行该结构体中handle指向的处理函数:
线程到底共享了哪些进程资源?
在讨论线程共享了哪些资源前我们先想想线程都有哪些资源。
线程其实就是函数的执行,那么函数的执行都有哪些信息呢?
函数在运行时信息保存在栈帧中,栈帧组成了栈区,栈帧中保存了函数的返回值,调用其他函数的参数,该函数使用的局部变量及该函数适用的寄存器信息等。
所属线程的栈区,栈指针,程序计数器,以及执行函数时使用的寄存器信息都是线程私有的。
剩下的堆区,数据区,代码区都是共享的: