进程控制块,英文名(Processing Control Block),简称 PCB 。
进程控制块是系统为了管理进程设置的一个专门的数据结构,主要表示进程状态。
每一个进程都对应一个PCB来维护进程相关的信息;
在Linux中,PCB结构为task_struct;
task_struct是Linux内核的一种数据结构,它会被装载到RAM里并且包含进程的信息,每个进程都把它的信息放在task_struct这个数据结构里。
task_struct结构图:
task_struct描述:
1.进程状态:是调度和兑换的依据
linux进程的状态 | |
内核表示 | 含义 |
TASK_RUNNING | 可运行 |
TASK_INTERRUPTIBLE | 可中断的等待状态 |
TASK_UNINTERRUPTIBLE | 不可中断的等待状态 |
TASK_ZOMBIE | 僵死 |
TASK_STOPPED | 暂停 |
TASK_SWAPPING | 换入/换出 |
2.标识符:描述本进程的唯一标识符,用来区别其它进程
每个进程都有一个唯一的标识符,内核通过这个标识符来识别不同的进程,同时,进程标识符PID也是内核提供给用户程序的接口,用户程序通过PID对进程发号施令。PID是32位的无符号整数,它被顺序编号:新创建进程的PID通常是前一个进程的PID加1。然而,为了与16位硬件平台的传统Linux系统保持兼容,在Linux上允许的最大PID号是32767,当内核在系统中创建第32768个进程时,就必须重新开始使用已闲置的PID号。
各种标识符 | |
域名 | 含义 |
pid | 进程标识符 |
ppid | 父进程 |
uid、gid | 用户标识符、组标识符 |
euid、egid | 有效用户标识符、有效组标识符 |
suid、sgid | 备份用户标识符、备份组标识符 |
fsuid、fsgid | 文件系统用户标识符、文件系统组标识符 |
3.进程调度信息
调度程序利用这部分信息决定系统中哪个进程应该优先运行,并结合进程的状态信息保证系统运转的公平和高效。这一部分信息通常包括进程的类别(普通进程还是实时进程)、进程的优先级(priority)等等
进程调度信息 | |
域名 | 含义 |
need_resched | 调度标志 |
nice | 静态优先级 |
counter | 动态优先级 |
policy | 调度策略 |
rt_priority | 实时优先级 |
当need_resched被设置时,在“下一次的调度机会”就调用调度程序schedule()。 counter代表进程剩余的时间片,是进程调度的主要依据,也可以说是进程的动态优先级,因为这个值在不断地减少;nice是进程的静态优先级,同时也代表进程的时间片,用于对counter赋值,可以用nice()系统调用改变这个值;policy是适用于该进程的调度策略,实时进程和普通进程的调度策略是不同的;rt_priority只对实时进程有意义,它是实时进程调度的依据。
进程调度的策略 | ||
名称 | 解释 | 适用范围 |
SCHED_OTHER | 其它调度 | 普通进程 |
SCHED_FIFO | 先来先服务调度 | 实时进程 |
SCHED_RR | 时间片轮转调度 |
4.程序计数器:程序中即将被执行的下一条指令的地址
5.内存指针:包括程序代码和进程相关数据指针,还有和其他进程共享的内存块的指针
6.与处理器相关的上下文数据:程序执行时处理器的寄存器中的数据
7.I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表
8.记账信息:可以包括处理器时间总和,使用的时钟数总和、时间限制、记账号等
struct task_struct {volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped *//*表示进程的当前状态:TASK_RUNNING:正在运行或在就绪队列run-queue中准备运行的进程,实际参与进程调度。TASK_INTERRUPTIBLE:处于等待队列中的进程,待资源有效时唤醒,也可由其它进程通过信号(signal)或定时中断唤醒后进入就绪队列run-queue。TASK_UNINTERRUPTIBLE:处于等待队列中的进程,待资源有效时唤醒,不可由其它进程通过信号(signal)或定时中断唤醒。TASK_ZOMBIE:表示进程结束但尚未消亡的一种状态(僵死状态)。此时,进程已经结束运行且释放大部分资源,但尚未释放进程控制块。TASK_STOPPED:进程被暂停,通过其它进程的信号才能唤醒。导致这种状态的原因有二,或者是对收到SIGSTOP、SIGSTP、SIGTTIN或SIGTTOU信号的反应,或者是受其它进程的ptrace系统调用的控制而暂时将CPU交给控制进程。TASK_SWAPPING: 进程页面被交换出内存的进程。*/ unsigned long flags; //进程标志,与管理有关,在调用fork()时给出int sigpending; //进程上是否有待处理的信号mm_segment_t addr_limit; //进程地址空间,区分内核进程与普通进程在内存存放的位置不同/*用户线程空间地址: 0..0xBFFFFFFF。内核线程空间地址: 0..0xFFFFFFFF */struct exec_domain *exec_domain; //进程执行域volatile long need_resched; //调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度unsigned long ptrace;int lock_depth; //锁深度long counter; //进程的基本时间片,在轮转法调度时表示进程当前还可运行多久,在进程开始运行是被赋为priority的值,以后每隔一个tick(时钟中断)递减1,减到0时引起新一轮调 度。重新调度将从run_queue队列选出counter值最大的就绪进程并给予CPU使用权,因此counter起到了进程的动态优先级的作用long nice; //静态优先级unsigned long policy; //进程的调度策略,有三种,实时进程:SCHED_FIFO,SCHED_RR,分时进程:SCHED_OTHER //在Linux 中, 采用按需分页的策略解决进程的内存需求。task_struct的数据成员mm 指向关于存储管理的mm_struct结构。struct mm_struct *mm; //进程内存管理信息int has_cpu, processor;unsigned long cpus_allowed;struct list_head run_list; //指向运行队列的指针unsigned long sleep_time; //进程的睡眠时间//用于将系统中所有的进程连成一个双向循环链表,其根是init_task//在Linux 中所有进程(以PCB 的形式)组成一个双向链表,next_task和prev_task是链表的前后向指针struct task_struct *next_task, *prev_task;struct mm_struct *active_mm; //active_mm 指向活动地址空间。struct linux_binfmt *binfmt; //进程所运行的可执行文件的格式int exit_code, exit_signal;int pdeath_signal; //父进程终止是向子进程发送的信号unsigned long personality;int dumpable:1;int did_exec:1;pid_t pid; //进程标识符,用来代表一个进程pid_t pgrp; //进程组标识,表示进程所属的进程组pid_t tty_old_pgrp; //进程控制终端所在的组标识pid_t session; //进程的会话标识pid_t tgid;int leader; //表示进程是否为会话主管
//指向最原始的进程任务指针,父进程任务指针,子进程任务指针,新兄弟进程任务指针,旧兄弟进程任务指针。 struct task_struct *p_opptr, *p_pptr, *p_cptr, *p_ysptr, *p_osptr;struct list_head thread_group; //线程链表
//用于将进程链入HASH表,系统进程除了链入双向链表外,还被加入到hash表中struct task_struct *pidhash_next;struct task_struct **pidhash_pprev; wait_queue_head_t wait_chldexit; //供wait4()使用struct semaphore *vfork_sem; //供vfork()使用unsigned long rt_priority; //实时优先级,用它计算实时进程调度时的weight值
//it_real_value,it_real_incr用于REAL定时器,单位为jiffies,系统根据it_real_value//设置定时器的第一个终止时间.在定时器到期时,向进程发送SIGALRM信号,同时根据//it_real_incr重置终止时间,it_prof_value,it_prof_incr用于Profile定时器,单位为jiffies。//当进程运行时,不管在何种状态下,每个tick都使it_prof_value值减一,当减到0时,向进程发送信号SIGPROF,并根据it_prof_incr重置时间.//it_virt_value,it_virt_value用于Virtual定时器,单位为jiffies。当进程运行时,不管在何种//状态下,每个tick都使it_virt_value值减一当减到0时,向进程发送信号SIGVTALRM,根据it_virt_incr重置初值unsigned long it_real_value, it_prof_value, it_virt_value;unsigned long it_real_incr, it_prof_incr, it_virt_incr;struct timer_list real_timer; //指向实时定时器的指针struct tms times; //记录进程消耗的时间unsigned long start_time; //进程创建的时间long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS];//记录进程在每个CPU上所消耗的用户态时间和核心态时间//内存缺页和交换信息://min_flt, maj_flt累计进程的次缺页数(Copyon Write页和匿名页)和主缺页数(从映射文件或交换//设备读入的页面数);nswap记录进程累计换出的页面数,即写到交换设备上的页面数。//cmin_flt, cmaj_flt,cnswap记录本进程为祖先的所有子孙进程的累计次缺页数,主缺页数和换出页面数。//在父进程回收终止的子进程时,父进程会将子进程的这些信息累计到自己结构的这些域中unsigned long min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;int swappable:1; //表示进程的虚拟地址空间是否允许换出//进程认证信息//uid,gid为运行该进程的用户的用户标识符和组标识符,通常是进程创建者的uid,gid,euid,egid为有效uid,gid//fsuid,fsgid为文件系统uid,gid,这两个ID号通常与有效uid,gid相等,在检查对于文件系统的访问权限时使用他们。//suid,sgid为备份uid,giduid_t uid,euid,suid,fsuid;gid_t gid,egid,sgid,fsgid;int ngroups; //记录进程在多少个用户组中gid_t groups[NGROUPS]; //记录进程所在的组kernel_cap_t cap_effective, cap_inheritable, cap_permitted;//进程的权能,分别是有效位集合,继承位集合,允许位集合int keep_capabilities:1;struct user_struct *user; //代表进程所属的用户struct rlimit rlim[RLIM_NLIMITS]; //与进程相关的资源限制信息unsigned short used_math; //是否使用FPUchar comm[16]; //进程正在运行的可执行文件名//文件系统信息int link_count;struct tty_struct *tty; //进程所在的控制终端,如果不需要控制终端,则该指针为空unsigned int locks; /* How many file locks are being held *///进程间通信信息struct sem_undo *semundo; //进程在信号量上的所有undo操作struct sem_queue *semsleeping; //当进程因为信号量操作而挂起时,他在该队列中记录等待的操作struct thread_struct thread; //进程的CPU状态,切换时,要保存到停止进程的task_struct中struct fs_struct *fs; //文件系统信息,fs保存了进程本身与VFS(虚拟文件系统)的关系信息struct files_struct *files; //打开文件信息//信号处理函数spinlock_t sigmask_lock; /* Protects signal and blocked */struct signal_struct *sig; //信号处理函数sigset_t blocked; //进程当前要阻塞的信号,每个信号对应一位struct sigpending pending; //进程上是否有待处理的信号unsigned long sas_ss_sp;size_t sas_ss_size;int (*notifier)(void *priv);void *notifier_data;sigset_t *notifier_mask;/* Thread group tracking */u32 parent_exec_id;u32 self_exec_id;spinlock_t alloc_lock; //用于申请空间时用的自旋锁。自旋锁的主要功能是临界区保护};