注意:使用线程库函数用gcc编译时,要加参数:-lpthread(libpthread.so),因为线程库函数属于第三方c库函数,不是标准库函数(/lib、/usr/lib或者/usr/local/lib)。
(1)pthread_self函数
获取线程ID。其作用对应进程中 getpid() 函数。
pthread_t pthread_self(void); 返回值:成功:调用该函数的线程ID;失败:永远不会失败。
pthread_t:typedef unsigned long int pthread_t; 输出格式格式为:%lu
线程ID是进程内部,识别标志。(两个进程间,线程ID允许相同)
注意:不应使用全局变量 pthread_t tid(因为全局变量被一个进程中的多个线程共享),在子线程中通过pthread_create传出参数来获取线程ID或者使用pthread_self。
(2)pthread_create函数
创建一个新线程。其作用对应进程中fork() 函数。
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
返回值:成功:0;失败:错误编号。Linux环境下,所有线程特点,失败均直接返回错误编号,即直接返回errno number。
参数1:传出参数,新建线程的线程ID
参数2:传入参数,通常传NULL,表示使用线程默认属性。若想使用具体属性也可以修改该参数。
参数3:函数指针,指向线程主控函数(线程体),该函数运行结束,则线程结束。
参数4:线程主函数执行期间所使用的参数,若不同参数传NULL。
在一个线程中调用pthread_create()创建新的线程后,当前线程从pthread_create()返回继续往下执行,而新的线程所执行的代码由我们传给pthread_create的函数指针start_routine决定(线程创建成功后就立即去执行start_routine函数)。start_routine函数接收一个参数,是通过pthread_create的arg参数传递给它的,该参数的类型为void *,这个指针按什么类型解释由调用者自己定义。start_routine的返回值类型也是void *,这个指针的含义同样由调用者自己定义。start_routine返回时,这个线程就退出了,其它线程可以调用pthread_join得到start_routine的返回值,类似于父进程调用wait( )得到子进程的退出状态,稍后详细介绍pthread_join。
pthread_create成功返回后,新创建的线程的id被填写到thread参数所指向的内存单元。我们知道进程id的类型是pid_t,每个进程的id在整个系统中是唯一的,调用getpid( )可以获得当前进程的id,是一个正整数值。线程id的类型是pthread_t,它只在当前进程中保证是唯一的,在不同的系统中pthread_t这个类型有不同的实现,它可能是一个整数值,也可能是一个结构体,也可能是一个地址,所以不能简单地当成整数(%lu)用printf打印,调用pthread_self( )可以获得当前线程的id。
attr参数表示线程属性,本节不深入讨论线程属性,所有代码例子都传NULL给attr参数,表示线程属性取缺省值,感兴趣的读者可以参考APUE。
//pthread_self和pthread_create函数示例
#include <stdio.h>
#include <pthread.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>void *tfn(void *arg)
{printf("In thread, the process id is %d and thread id is %lu.\n",getpid( ),pthread_self( ));return NULL;
}int main(void)
{pthread_t tid;int ret;printf("In main1, the process id is %d and thread id is %lu.\n",getpid( ),pthread_self( ));ret = pthread_create(&tid, NULL, tfn, NULL);if( ret != 0 ) //出错判断{fprintf(stderr,"pthread_create error: %s\n",strerror(ret));exit(1);}printf("the created thread's id is %lu\n",tid);sleep(1); //注意一定要睡1sprintf("In main2, the process id is %u and thread id is %lu.\n",getpid( ),pthread_self( ));return 0;
}
[root@localhost 01_pthread_test]# ./pthrd_crt
In main1, the process id is 9814 and thread id is 4151932608.
the created thread's id is 4149869376
In thread, the process id is 9814 and thread id is 4149869376.
In main2, the process id is 9814 and thread id is 4151932608.
分析:
- 在main函数中调用sleep函数的原因。在Linux环境中,进程的本质就是含有一个线程的进程,其在创建线程之前就包含一个线程,因此此时有一个进程ID和一个线程ID(当然也有一个线程号),两个ID不想等,将此时的线程称为主控线程,后面创建的线程称为子线程。主线程创建完子线程后,如果主线程提前就结束了(执行了return或者exit等语句),则此时进程的地址空间会被回收,因此子线程也就被终止了(因为线程共享地址空间)。因此,主线程(main函数)必须要睡1s等待子线程完成工作后再结束。
- 注意线程库函数调用失败返回值的判断。出错不会再置ennro的值为相应的值,而是直接输出错误编号,因此不能再用perror函数来输出详细错误信息(该函数是根据errno的值输出相应的错误信息)。可以采用strerror函数,其作用:返回一个字符串,这个字符串描述了错误编号所对应的错误信息。char * strerror(int errnum); 如上所示:fprintf(stderr,"pthread_create error: %s\n",strerror(ret)); 采用fprintf函数将错误信息输出。相对于printf,fprintf函数可以将内容输出到指定文件中,第一个参数为文件的结构体指针。printf与fprintf都是标准输出,stdin、stdout和stderr为标准输入、标准输出和标准错误输出对应的文件结构体。
- 输出结果可以看出:在创建子线程前,进程本身包含一个线程;同一个进程中的所有线程的进程ID都一样;线程ID明显比线程号和进程ID大得多。
总结:由于pthread_create的错误码不保存在errno中,因此不能直接用perror( )打印错误信息,可以先用strerror( )把错误码转换成错误信息再打印。为了防止新创建的线程还没有得到执行就终止,我们在main函数return之前延时1秒,这只是一种权宜之计,即使主线程等待1秒,内核也不一定会调度新创建的线程执行,后面会有更好的办法。
//循环创建n个子线程的架构
#include <stdio.h>
#include <pthread.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>void *tfn(void *arg)
{int s = (int)arg;sleep(s);printf("The %dth thread: the process id is %d and thread id is %lu.\n",s+1,getpid( ),pthread_self( ));return NULL;
}int main(void)
{pthread_t tid;int ret, i;for( i=0;i<5;i++ ){ret = pthread_create(&tid, NULL, tfn,(void *)i);if( ret != 0 ){fprintf(stderr,"pthread_create error: %s\n",strerror(ret));exit(1);}}sleep(i);printf("In main: the process id is %u and thread id is %lu.\n",getpid( ),pthread_self( ));return 0;
}
[root@localhost 01_pthread_test]# ./pthrd_crt
The 1th thread: the process id is 4026 and thread id is 4149246784.
The 2th thread: the process id is 4026 and thread id is 4140854080.
The 3th thread: the process id is 4026 and thread id is 4132461376.
The 4th thread: the process id is 4026 and thread id is 4124068672.
The 5th thread: the process id is 4026 and thread id is 4115675968.
In main: the process id is 4026 and thread id is 4151466240.
分析:
- 如上循环创建5个线程,该进程中有6个线程,进程ID均相同,线程ID不一样;
- 每一个进程中线程的数目是有限的,不能超过这个值;
- 特别强调:主控线程调用的pthread_create函数中的第4个参数(void *)i不能改为:(void *)&i,相应在子线程执行的函数tfn中为s = *( (int *)arg ); 详细分析如下:首先,main函数是主控线程执行的函数,因此位于主控线程的用户栈帧空间中,该空间保存了main函数中的局部变量和形参值:tid、red、i,当main函数又去调用pthread_create函数时,main函数的栈帧头尾作为临时值保存在栈帧空间中。pthread_create函数的形参值保存在它的栈帧空间中。对于tfn函数(子线程执行的函数),它的局部变量和形参值(s和arg)又保存在各个线程的用户栈空间中,相互独立。外界参数的值传递给函数的形参时,都是按值传递(指针则传地址值,非指针变量则传变量值),如果传参数(void *)i,则将数值i转变为指针值 (指针值与数值i在大小上是相等的,只是在32位系统中指针值和整型i都占据4个字节;在64位系统中,指针值占据8个字节,而整型i依然占据4个字节,此时高位补0即可。然后将该指针值赋值给指针变量arg,即arg的值大小上是等于i的,但arg位于子线程的用户栈空间中,然后:(int)arg;即把指针值转变为整型s,s当然等于i,因此该方式是正确的。在64位系统中,指针值转变为整型i,8字节变为4字节,截取高位,而高位都是0,因此无影响。但如果是:(void *)&i *( (int *)arg),这种情况下传递的是i的地址给arg,因此在子线程中是通过i的地址来访问数值i的,而数值i在主控线程中是会随时发生变化的(for循环中的i++导致),因此该方式不成立。
- pthread_create函数是一个回调函数,若创建子线程成功,则会去调用相应的函数;
- 子线程执行完自己的函数后返回的值通过pthread_join函数回收;
- return的作用是返回到函数的调用点,如果是main函数中的return,则代表该进程结束,并释放进程地址空间,所有线程都终止。对于其它函数的return,则直接返回到函数的调用点。exit和_exit函数会直接终止整个进程,导致所有线程结束。pthread_exit函数则会导致调用该函数的线程结束。所以,多线程环境中,应尽量少用,或者不使用exit函数,取而代之使用pthread_exit函数,将单个线程退出。任何线程里exit导致进程退出,其他线程也结束,主控线程退出时不能return或exit。