此为牛客Linux C++课程笔记。

0. 关于线程

在这里插入图片描述
注意：LWP号和线程id不同， LWP号是CPU分配时间片的依据，线程id是用于在进程内部区分线程的。

1. 线程与进程的区别

在这里插入图片描述

对于进程来说，相同的地址(同一个虚拟地址)在不同的进程中，反复使用而不冲突。原因是他们虽虚拟址一样，但，页目录、页表、物理页面各不相同。相同的虚拟址，映射到不同的物理页面内存单元，最终访问不同的物理页面。

但！线程不同！两个线程具有各自独立的PCB，但共享同一个页目录，也就共享同一个页表和物理页面。所以两个PCB共享一个地址空间。

实际上，无论是创建进程的fork，还是创建线程的pthread_create，底层实现都是调用同一个内核函数clone。
如果复制对方的地址空间，那么就产出一个“进程”；如果共享对方的地址空间，就产生一个“线程”。

因此：Linux内核是不区分进程和线程的。只在用户层面上进行区分。所以，线程所有操作函数 pthread_* 是库函数，而非系统调用。

优点： 1. 提高程序并发性 2. 开销小 3. 数据通信、共享数据方便
缺点： 1. 库函数，不稳定 2. 调试、编写困难、gdb不支持 3. 对信号支持不好
优点相对突出，缺点均不是硬伤。Linux下由于实现方法导致进程、线程差别不是很大。

2. 线程相关操作函数

在这里插入图片描述

2.1 获取线程id

#include <pthread.h>
pthread_t pthread_self(void);

功能：获取线程ID。其作用对应进程中 getpid() 函数。

2.2 创建线程： pthread_create

#include <pthread.h>
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);

功能：创建一个子线程

参数：

thread：传出参数，线程创建成功后，子线程的线程ID被写到该变量中。
attr : 设置线程的属性，一般使用默认属性，即NULL
start_routine : 函数指针，这个函数是子线程需要处理的逻辑代码
arg : 给第三个参数（回调函数）使用，是回调函数的参数

返回值：

成功：0
失败：返回错误号。这个错误号和之前errno不太一样，获取错误号的信息使用：

#include <string.h>
char * strerror(int errnum);

创建线程示例代码如下：

#include <stdio.h>
#include <pthread.h>
#include <string.h>
#include <unistd.h>void* callback(void* arg) {printf("its child thread, thread id is %lu\n", pthread_self());printf("arg = %d\n", *(int *)arg);
}int main()
{pthread_t pid;int a = 5;int ret = pthread_create(&pid, NULL, callback, &a);if(ret != 0) {// 说明创建失败char * errstr = strerror(ret);printf("error: %s\n", errstr);}printf("its main thread, thread id is %lu\n", pthread_self());sleep(1);return 0;
}

发现无法编译
在这里插入图片描述
查阅文档发现：

编译时加-pthread即可，运行结果如下：

2.3 终止线程： pthread_exit

注意，不能使用exit函数终止当前线程，exit将终止当前进程，进程中的所有线程将一并终止。

#include <pthread.h>
void pthread_exit(void *retval);

参数：retval表示线程退出状态，通常传NULL

多线程环境中，应尽量少用，或者不使用exit函数，取而代之使用pthread_exit函数，将单个线程退出。任何线程里exit导致进程退出，其他线程未工作结束，主控线程退出时不能return或exit。

2.4 连接已终止的线程（回收线程）：pthread_join

#include <pthread.h>
int pthread_join(pthread_t thread, void **retval);

功能：和一个已经终止的线程进行连接（回收子线程的资源）

注意：这个函数是阻塞函数，调用一次只能回收一个子线程，一般在主线程中使用

参数：

thread：需要回收的子线程的ID
retval: 接收子线程退出时的返回值（即pthread_exit的void *retval参数），而且是传出参数。

返回值：0 : 成功；非0 : 失败，返回的错误号

不使用传出参数的一个简单使用如下：

#include <stdio.h>
#include <pthread.h>
#include <string.h>
#include <unistd.h>void* callback(void* arg) {printf("子线程运行中...\n");sleep(2);
}int main()
{pthread_t pid;int ret = pthread_create(&pid, NULL, callback, NULL);if(ret != 0) {// 说明创建失败char * errstr = strerror(ret);printf("error: %s\n", errstr);}pthread_join(pid, NULL);printf("子线程已回收\n");return 0;
}

子线程执行2秒后，主进程才输出“子线程已回收”，说明pthread_join函数是阻塞的。

pthread_join函数比较难以理解的地方是他的第二个参数：void **retval，是void二级指针类型，这是因为：

首先这个参数是想接收pthread_exit所传出的void *retval，这个参数本身是void *的一级指针类型，而pthread_join函数的void **retval在设计时是设计成一个传出参数的，以便把pthread_exit传出的void *retval带回主线程，所以要想把 void * 类型变量设计成传出参数，即是 void **。

示例程序如下：

#include <stdio.h>
#include <pthread.h>
#include <string.h>
#include <unistd.h>int value = 10;void* callback(void* arg) {printf("子线程运行中...\n");pthread_exit((void *)&value);
}int main()
{pthread_t pid;int ret = pthread_create(&pid, NULL, callback, NULL);if(ret != 0) {// 说明创建失败char * errstr = strerror(ret);printf("error: %s\n", errstr);}int *thread_retval;  // 给pthread_join调用，接收pthread_exit的传出参数pthread_join(pid, (void **)&thread_retval);printf("exit data : %d\n", *thread_retval);return 0;
}

运行结果如下：
在这里插入图片描述

2.5 线程分离：pthread_detach

#include <pthread.h>
int pthread_detach(pthread_t thread);

功能：使进程处于分离状态。被分离的线程在终止的时候，会自动释放资源返回给系统，避免产生僵尸线程。

线程分离状态：指定该状态，线程主动与主控线程断开关系。线程结束后，其退出状态不由其他线程获取，而直接自己自动释放。网络、多线程服务器常用。

参数：需要分离的线程的ID

返回值：成功：0，失败：返回错误号

注意：

线程不能多次分离，会产生不可预料的行为。
不能去连接（pthread_join）一个已经分离的线程，会报错：一般情况下，线程终止后，其终止状态一直保留到其它线程调用pthread_join获取它的状态为止。但是线程也可以被置为detach状态，这样的线程一旦终止就立刻回收它占用的所有资源，而不保留终止状态。不能对一个已经处于detach状态的线程调用pthread_join，这样的调用将返回EINVAL错误。也就是说，如果已经对一个线程调用了pthread_detach就不能再调用pthread_join了。

2.6 线程取消：pthread_cancel

#include <pthread.h>
int pthread_cancel(pthread_t thread);

功能：取消线程（让线程终止）

【注意】：线程的取消并不是实时的，而有一定的延时。需要等待线程到达某个取消点(检查点)。
类似于玩游戏存档，必须到达指定的场所(存档点，如：客栈、仓库、城里等)才能存储进度。杀死线程也不是立刻就能完成，必须要到达取消点。
取消点：是线程检查是否被取消，并按请求进行动作的一个位置。通常是一些系统调用creat，open，pause，close，read，write…
执行命令man 7 pthreads可以查看具备这些取消点的系统调用列表。也可参阅 APUE.12.7 取消选项小节。
可粗略认为一个系统调用(进入内核)即为一个取消点。如线程中没有取消点，可以通过调用pthreestcancel函数自行设置一个取消点。

看下面这个代码示例，子线程无限循环：

#include <stdio.h>
#include <pthread.h>
#include <string.h>
#include <unistd.h>void* callback(void* arg) {while(1) {printf("子线程运行中...\n");sleep(1);}return NULL;
}int main()
{pthread_t pid;int ret = pthread_create(&pid, NULL, callback, NULL);if(ret != 0) {char * errstr = strerror(ret);printf("error: %s\n", errstr);}pthread_cancel(pid);ret = pthread_join(pid, NULL);if(ret != 0) {char * errstr = strerror(ret);printf("error: %s\n", errstr);}printf("线程已回收\n");return 0;
}

运行后成功输出”线程已回收“，这是因为pthread_cancel终止了子线程的运行，故pthread_join得以执行。

但是如果将子进程中循环语句中的内容去掉：

#include <stdio.h>
#include <pthread.h>
#include <string.h>
#include <unistd.h>void* callback(void* arg) {while(1) {// printf("子线程运行中...\n");// sleep(1);}return NULL;
}int main()
{pthread_t pid;int ret = pthread_create(&pid, NULL, callback, NULL);if(ret != 0) {char * errstr = strerror(ret);printf("error: %s\n", errstr);}pthread_cancel(pid);ret = pthread_join(pid, NULL);if(ret != 0) {char * errstr = strerror(ret);printf("error: %s\n", errstr);}printf("线程已回收\n");return 0;
}

运行以后发现没有输出，主线程阻塞。这是因为子线程的while(1)死循环中没有任何语句，也就不会执行任何系统调用，也就不会到达任何一个“取消点”，所以子线程并没有被终止，主线程被阻塞在pthread_join处。而之前的代码循环语句中的printf会调用系统调用write，所以会到达“取消点”，pthread_join将已经结束的子线程回收。