线程控制
操作系统并没有提供创建线程的系统调用接口,因此大佬们封装了一个线程的接口库实现线程控制。意为着用户创建线程都使用的是库函数(所以有时候我们说创建的线程是一个用户态线程,但是在内核中对应有一个轻量级进程实现线程程序的调度)
进程ID == 线程组id–tgid == 主线程pid
线程控制函数
pthread_self 函数
获取线程 ID。其作用对应进程中 getpid() 函数。
pthread_t pthread_self(void);
返回值:成功:0; 失败:无!
线程 ID:pthread_t 类型,本质:在 Linux 下为无符号整数(%lu),其他系统中可能是结构体实现
线程 ID 是进程内部,识别标志。(两个进程间,线程 ID 允许相同)
注意:不应使用全局变量 pthread_t tid
,在子线程中通过 pthread_create
传出参数来获取线程 ID,而应使用 pthread_self
。
pthread_create 函数
创建一个新线程。 其作用,对应进程中 fork() 函数。
int pthread_create (pthread_t * thread,const pthread_attr_t *attr,void* (*start_routine)(void*),void* arg);
返回值:成功:0; 失败:错误号 -----Linux 环境下,所有线程特点,失败均直接返回错误号。
参数:
pthread_t:当前 Linux 中可理解为:typedef unsigned long int pthread_t;
参数 1:传出参数,保存系统为我们分配好的线程 ID
参数 2:通常传 NULL,表示使用线程默认属性。若想使用具体属性也可以修改该参数。
参数 3:函数指针,指向线程主函数(线程体),该函数运行结束,则线程结束。
参数 4:线程主函数执行期间所使用的参数。
在一个线程中调用 pthread_create()创建新的线程后,当前线程从 pthread_create()返回继续往下执行,而新的线 程所执行的代码由我们传给 pthread_create 的函数指针 start_routine 决定。
start_routine 函数接收一个参数,是通过 pthread_create 的 arg 参数传递给它的,该参数的类型为 void *
,这个指针按什么类型解释由调用者自己定义。
start_routine 的返回值类型也是 void*
,这个指针的含义同样由调用者自己定义。start_routine 返回时,这个线程就 退出了,其它线程可以调用 pthread_join 得到 start_routine 的返回值,类似于父进程调用 wait(2)得到子进程的退出 状态,稍后详细介绍 pthread_join。
pthread_create 成功返回后,新创建的线程的 id 被填写到 thread 参数所指向的内存单元。我们知道进程 id 的类 型是 pid_t,每个进程的 id 在整个系统中是唯一的,调用 getpid(2)可以获得当前进程的 id,是一个正整数值。
线程 id 的类型是 thread_t,它只在当前进程中保证是唯一的,在不同的系统中 thread_t 这个类型有不同的实现,它可能 是一个整数值,也可能是一个结构体,也可能是一个地址,所以不能简单地当成整数用printf打印,调用pthread_self(3) 可以获得当前线程的 id。
pthread_t到底是什么类型呢?取决于实现。对于Linux目前实现的NPTL实现而言,pthread_t类型的线程ID,本质就 是一个进程地址空间上的一个地址。线程空间的首地址
练习:创建一个新线程,打印线程 ID。注意:链接线程库 -lpthread
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<pthread.h>void *thrd_func(void *arg)
{//子线程的IDprintf(" In thread id = %lu,pid = %u\n",pthread_self(),getpid());return NULL;
}int main(void)
{pthread_t tid;int ret;//主控线程IDprintf(" In main1 id = %lu,pid = %u\n",pthread_self(),getpid());ret = pthread_create(&tid,NULL,thrd_func,NULL);if(ret != 0){ printf("pthread_create error\n");exit(1);} printf(" In main2 id = %lu,pid = %u\n",pthread_self(),getpid()); sleep(1);//主控线程等待子线程1秒,让它打印return 0;
}
思考:
由于 pthread_create 的错误码不保存在 errno 中,因此不能直接用 perror(3)打印错误信息,可以先用 strerror(3) 把错误码转换成错误信息再打印。如果任意一个线程调用了 exit 或_exit,则整个进程的所有线程都终止,由于从 main 函数 return 也相当于调用 exit,为了防止新创建的线程还没有得到执行就终止,我们在 main 函数 return 之前 延时 1 秒,这只是一种权宜之计,即使主线程等待 1 秒,内核也不一定会调度新创建的线程执行。
循环创建多个线程,每个线程打印自己是第几个被创建的线程。(类似于进程循环创建子进程)
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<pthread.h>void *thrd_func(void *arg)
{int i=(int)arg;sleep(i); //子线程的IDprintf("%d th In thread id = %lu,pid = %u\n", i+1 ,pthread_self(),getpid());return NULL;
}int main(void)
{pthread_t tid;int ret,i;for(i=0;i < 5; i++){ ret = pthread_create(&tid,NULL,thrd_func,(void *)i);if(ret != 0){ fprintf(stderr,"pthread_create error:%s\n",strerror(ret));exit(1);} } sleep(i);// 主控线程等待子线程1秒,让它打印 return 0;// 将当前进程退出
}
注意:将 pthread_create
函数参 4 修改为(void*)&i
, 将线程主函数内改为 i=*((int*)arg)
不可以
线程间共享全局变量
验证
#include<stdio.h>
#include<pthread.h>
#include<stdlib.h>
#include<unistd.h>int var =100;void *tfn(void * arg)
{//子线程修改varvar = 200;printf("thread\n");return NULL;
}int main(void)
{printf("At first var = %d\n",var);pthread_t tid;pthread_create(&tid,NULL,tfn,NULL);sleep(1);//等子线程退出后,再次打印var printf("after pthread_create, var = %d\n",var);return 0;
}
线程默认共享数据段、代码段等地址空间,常用的是全局变量。而进程不共享全局变量,只能借助 mmap
pthread_exit 函数
将单个线程退出
void pthread_exit (void*retval)
; 参数:retval
表示线程退出状态,通常传 NULL
思考:使用 exit 将指定线程退出,可以吗?
结论:线程中,禁止使用 exit 函数,会导致进程内所有线程全部退出。
在不添加 sleep 控制输出顺序的情况下。pthread_create 在循环中,几乎瞬间创建 5 个线程,但只有第 1 个线程 有机会输出(或者第 2 个也有,也可能没有,取决于内核调度)如果第 3 个线程执行了 exit,将整个进程退出了, 所以全部线程退出了。
所以,多线程环境中,应尽量少用,或者不使用 exit 函数,取而代之使用 pthread_exit
函数,将单个线程退出。 任何线程里 exit 导致进程退出,其他线程未工作结束,主控线程退出时不能 return 或 exit。
另注意,pthread_exit 或者 return 返回的指针所指向的内存单元必须是全局的或者是用 malloc 分配的,不能在 线程函数的栈上分配,因为当其它线程得到这个返回指针时线程函数已经退出了。