Linux之线程及线程安全详解

前言：在操作系统中，进程是资源分配的基本单位，那么线程是什么呢？线程是调度的基本单位，我们该怎么理解呢？

一，线程概念理解

二，Linux里面的线程原理

三，为什么要有线程

四，线程相关接口

1)线程创建

2）获取本线程ID

3)线程等待

4）线程取消

5）线程退出

五，多线程安全

1，互斥锁的原理

2,互斥锁的使用

3，锁带来的饥饿问题

4，信号量

六，线程安全条件

1，常见的线程安全情况

2，常见的线程不安全情况

3，死锁

一，线程概念理解

现在我们举一个例子：我们以家庭为单位，将家庭看作一个整体，假如分配房子，车子等社会资源，这些资源被分配是以家庭为单位，这就类似于进程，每个进程执行一个大任务，进程之间的联系并不紧密并且相对独立。线程则类似与家庭里面的每一个人，家里面有许多为了完成大任务而拆分出来的小任务，比如孩子要上学，父母要上班，还有家务，家庭里面的每一个人有关联但也有各自不同的小任务，家庭里面的每一个人都共享所有资源，比如电视剧，客厅，车子——进程被分配的资源，但是同时它们也有自己的私人空间，线程同样如此，但线程的私人空间是

线程 ID

一组寄存器

栈

errno

信号屏蔽字

调度优先级

为什么线程要有自己的私人空间呢？因为即使每个人都是为这个家庭（进程）做事，但是每个人做的事情不一样，我们需要一些私人数据才能完成不同的任务，而且为了区分不同的家庭成员（线程）我们也需要对他们进行起名（编号），这也是私人数据。

二，Linux里面的线程原理

大家有没有发现，线程和进程的功能其实有点类似，比如进程是执行一个复杂的大任务，而线程则是执行大任务里面拆分出来的小任务，并且它们都有自己的栈，共享进程的资源那我们可以使用进程的PCB来复用代替线程的TCB吗？答案是可以的，这样子不仅提高了代码的复用率，降低了编写的难度，让代码结构和维护变得更加简单，LinuxTCP的结构体就和PCB一样，但也可以自己编写一个独立的TCB，比如：windows系统。但也有所不同，进程号是标识进程唯一性的编号，而线程号则是一个地址——线程地址。

Linux里面的线程被称作轻量级进程，我们需要理清楚线程（轻量级进程）和进程之间的关系，进程是一组线程集合，一个进程最少有一个线程，线程则是进程里面的一个执行流（执行小任务）

三，为什么要有线程

大家可能很好奇为什么有进程了还要有线程，一个CPU一个时间段执行一个指令吗？线程虽称并行执行流，但底层还是不能同时执行，也得排队。

现在举一个例子：有一个进程A需要执行一个任务，从外设输入字符串并且打印到屏幕上，并且要计算一些加减乘除。

如果只有一个进程我们只能顺序执行，也就是当输入输出的时候我们不能干其他事必须等待，而IO流的速度是很慢的，如果我们一直等待不就把CPU的资源浪费了吗？如果我们利用线程呢？一个线程负责IO流，一个线程负责计算，这样子当我们进行IO操作的时候，我们可以把它挂起，利用CPU去进行计算，当IO操作完成再唤醒执行这个线程，这样子CPU的利用率就提高了，执行效率也提高了。

但是有人可能有疑问，我们为什么不切换到下一个进程，等到IO操作完成再唤醒这个进程呢？这就涉及到了开销的问题，进程之间是相互独立的，我们切换是需要进行保存现场等工作，这样子不断的切换开销是很大的，而线程它们之间的切换的开销小的很多，他们的页表，数据都是共享的。

那么线程适合什么样的场景使用，线程是越多越好吗？
线程适合IO操作较多的场景，计算流操作效果比较差，因为CPU的算力是有限的，同一时间只允许一个计算任务。

线程并不是越多越好，因为线程也是有开销的，例如TCB结构体，栈，对这些进行管理也要开销。

四，线程相关接口

在Linux里面实际上是没用线程的，只有轻量级进程，但是为了迎合主流，Linux还是对轻量级进程进行了包装成了线程库，因此在编译时要连接原生线程库，在g++指令后面加上 -lpthread，例如：

g++ -o test.o test.cpp -std=c++11 -lpthread

线程接口使用类似于进程间通信的接口，首先我们要认识一下区分线程的唯一标识符，也就是线程地址

pthread_t

底层实际上就是一个unsigned int

1)线程创建

第一个参数thread会通过指针返回创建线程的ID，第二个参数大部分情况是NULL，用来调整线程的属性，第三个参数是线程执行的函数，第四个参数是执行函数的参数。成功返回0，失败返回错误编号。

void* task(void* arg){
int* i=(int*)arg;
cout<<"这是一个线程任务："<<*i;
}
pthread_t tid;
int i=1;
pthread_create(&tid,NULL,task,(void*)i);

2）获取本线程ID

没有参数，返回值就是本线程的ID。

3)线程等待

第一个参数是等待线程ID，第二个是对线程进行管理的参数，一般默认NULL。

这个函数的作用是等待一个线程结束，成功返回0，失败返回错误编号，在这个线程结束前这个函数不会结束。

pthread_t tid=pthread_self();
pthread_join(tid,NULL);

4）线程取消

函数参数是取消线程的ID，操作成功返回0。

pthread_t tid=pthread_self();
pthread_cancel(tid)；

5）线程退出

这个作用于pthread_exit作用效果类似，但是只能退出本线程，不能退出指定线程。

五，多线程安全

大家有没有想过多线程执行会不会带来安全问题，答案是必然的，为什么呢？因为线程简单切换会发生在如何不是原子代码执行的时候（原子性是指代码执行不会被中断，要么不开始，一开始就必须执行完，不存在中间状态），

int tictik=100;
void* RobTictik(void* arg){
while(titck>0){
cout<<"线程："<<pthread_self()<<"抢到了票"<<tictik--<<endl;
}
}

如果所有线程执行这个函数，很有可能就会出现tictik最后小于0的情况，也就是最后卖出了多于100张的票，为什么呢？假如tictik已经是1了，线程A刚刚进入还未来得及打印将tictik打印就切换到了线程B，就会出现多卖票的情况。

那我们有什么办法解决吗？

1，互斥锁的原理

互斥锁是什么呢？人如其名它的功能类似于一把锁，你进去时候加上一把锁，当别人试图进来的时候就会因为没有钥匙而无法进来，你出去的是就把锁换回去，让其他想进来的人竞争这把钥匙。

锁的原理是什么呢？其实挺简单的，就是锁里面本来有一个1，当线程切换的时候线程会把自己的上下文保存，将数据1拿走，其他线程走到这块区域的时候就发现是0无法运行，继续等待抢锁，直到线程将这块区域运行完才会将锁换回去。下面这个图就是类似我讲述的锁原理。

2,互斥锁的使用

互斥锁的使用需要初始化，然后加锁，解锁。

初始化有两种方式，一种是全局锁，一种是局部锁（作用域）

这是互斥锁的结构体

全局互斥锁初始化

局部互斥锁的初始化

第一个参数是锁结构体，第二个参数一般填NULL。

加锁

成功返回0，需要注意的是加锁代码是原子性的，防止多个线程进入锁

解锁

成功返回0，注意解锁并不是原子性的，因为解锁时是不是原子性已经不重要了，如果锁已经归还，多线程也只能有一个抢到，如果还未归还不过是让其他线程多等等。

pthread_mutex_init(&_mutex,NULL);pthread_mutex_lock(&p->_mutex);//临界区代码，被保护，原子性 pthread_mutex_unlock(&p->_mutex);

3，锁带来的饥饿问题

互斥锁的抢夺是公平的，但是有一些线程的抢锁能力强，这就会导致一个问题，一个线程长期霸占着锁，其他线程就一直无法运行代码，导致饥饿问题，那有什么解决办法吗？答案是条件变量。

条件变量是什么呢？之前我们举例子所有人抢钥匙开门，现在我们加一个规矩，那就是排队，新来的和出去的只能从后面开始排队，而且这段时间你们都处于休眠，直到轮到你们有人唤醒你们才继续执行。

条件变量使用很类似于互斥锁

条件变量结构体

初始也分全局初始化和局部初始化

全局条件变量初始化

局部条件变量初始化

第一个参数是条件变量结构体，第二个参数一般是NULL。

互斥锁的使用一般是放在互斥锁里面的，如果将线程放入条件队列，会先解锁，然后继续抢锁，因此建议进入互斥锁临界区就先检查是否需要放入条件队列等待

参数一是条件变量结构体，参数二是互斥锁，因为条件变量是需要结合互斥锁使用的。

条件变量的唤醒，我们直到进入条件变量等待队列后是无法自己醒来的，需要使用函数唤醒

唤醒指定条件变量里面的一个线程，成功返回0

唤醒指定条件变量里面的所有线程，成功返回0

破坏条件变量

pthread_mutex_init(&_mutex,NULL);
pthread_cond_init(&cond,NULL);pthread_mutex_lock(&p->_mutex);
while(条件不满足){pthread_cond_wait(&cond,&mutex);
}//临界区代码，被保护，原子性 pthread_mutex_unlock(&p->_mutex);

上面的代码为什么要用循环来判断条件是否满足呢？因为即使抢到锁了条件也不一定满足，如果是if语句就会直接执行接下里的代码，导致线程安全问题