进程_PCB 的理解

目录

一. PCB 的概念

1. 为什么需要PCB

2. PCB的属性

二. task struct

1. task struct 介绍

2. 查看进程指令

3. PID

4. PPID

父进程是什么?

为什么要有父进程?

5. fork 创建子进程

1) fork 后的现象

为什么会打印两次?

2) 的返回值

getpid petppid

3) fork 如何办到?

三. 总结


一. PCB 的概念

在我们的操作系统中,如果我们想要运行一个程序,那么我们显然是需要将程序加载到内存中的,所以我们可以先不怎么准确的理解一下进程是什么——加载到内存中的程序。

更为官方的概念是这样的,进程 PCB(Process Control Block,进程控制块)是操作系统中用于描述和管理进程的数据结构。每个正在运行的进程都有一个对应的进程 PCB。

那么我们首先谈论一下为什么需要进程

1. 为什么需要PCB

我们前面说了,我们的进程就是一个程序加载到内存,那么我们的系统中显然是不可能只有一个进程的,因为我们需要运行很多软件(进程),所以我们是需要对这么多的进程需要进行管理的,而我们的操作系统如何管理?   先描述再组织。

那么我们如何描述一个进程呢?通过用数据结构来描述进程的特定的属性来描述进程,所以我们用来描述进程的数据结构就叫做PCB,而我们的操作系统也就是通过管理PCB来管理我们的进程。

但是我们上面一直是在说PCB,那么PCB就等于进程吗? 这里说一下,其实PCB并不等于进程,我们说了PCB只是系统给我们创建的一个用来描述进程的控制块,但是我们不仅仅需要用来描述,我们还是需要我们自己程序的代码和数据,所以我们的进程应该是: 进程 = PCB + 代码和数据

根据上面说的,我们的PCB就是用来描述我们的进程的一个控制块,而PCB的作用就是方便操作系统对我们的进程进行管理。 

2. PCB的属性

我们现在知道,PCB就是系统用来描述进程的一个数据结构,那么既然是一个数据结构里面当然是有各种关于进程的属性的,我们下面看一下关于进程的各种属性。

  • 进程标识符(Process ID):用于唯一标识一个进程。
  • 程序计数器(Program Counter):记录当前进程正在执行的指令位置。
  • 寄存器状态(Register State):包括通用寄存器、堆栈指针和程序状态字等寄存器的内容。
  • 进程状态(Process State):表示进程的当前状态,如运行、就绪、等待等。
  • 内存信息:包括进程的代码段、数据段和堆栈段的起始地址和大小。
  • 调度信息:包括进程的优先级、调度算法使用的时间片大小等。
  • 进程控制信息:包括父进程标识符、子进程标识符、打开的文件列表等。

这上面只是笼统的介绍一下,后面会详细说的~

二. task struct

前面说的是大多数操作系统的一个概念,但是如果我们想要学习操作系统,那么我们必须要学习的是一款具体的操作系统,我们这里说的就是 linux

1. task struct 介绍

我们这里说的 task struct 就是 PCB ,而PCB是所有操作系统里面进程的一个叫法,而我们的
task struct 是一款具体的操作系统(linux)里面的PCB的一个叫法。

task struct 里面的属性和PCB里面的都是差不多的,但是肯定是有差别的。

下面我们就先简单的看一下 linux 里面的进程

2. 查看进程指令

指令:ls /proc(查看所有进程)

指令:ps axj (查看所有进程)

我们现在写一个死循环,然后我们执行该程序,在执行的时候我们的该程序会被加载到内存,然后被执行,我们使用命令查看该进程

测试代码:

#include<stdio.h>
#include<unistd.h>int main()
{while(1){printf("I am a process...\n");sleep(2);}return 0;
}


上面是 ps axj 查看,下面是 ls /proc查看 

其实这样看的管感并不太好,我们还可以使用 grep 命令来查看

 [lxy@hecs-165234 linux2]$ ps axj | head -1 && ps axj | grep myprocessPPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
18563 18611 18611 18563 pts/1    18611 S+    1000   0:00 ./myprocess
18169 18859 18858 18169 pts/0    18858 D+    1000   0:00 grep --color=auto myprocess前面的那个是为了查看第一行

我们看到,我们查到的内容里面有几个属性,我们这里先值说一个,PID(进程的标识符),也就是在系统中表示唯一的一个进程

既然我们现在知道了PID,那么我们看到 ls /proc查看到的里面的那些数字,其实就是PID

我们可以通过 ls /proc 查看一下我们的 myproc 进程,然后我们关掉我们的程序后在查看一下

[lxy@hecs-165234 linux2]$ ls /proc | grep 18611
18611[lxy@hecs-165234 linux2]$ ls /proc | grep 18611
[lxy@hecs-165234 linux2]$ 

 我们看到我们第一次查到了,然后关掉程序后就查看不到了

我们继续启动程序,然后我们查看该程序

[lxy@hecs-165234 linux2]$ ps axj | grep myprocess
18563 18940 18940 18563 pts/1    18940 S+    1000   0:00 ./myprocess
18169 18942 18941 18169 pts/0    18941 R+    1000   0:00 grep --color=auto myprocess
[lxy@hecs-165234 linux2]$ ls /proc/18940 -dl
dr-xr-xr-x 9 lxy lxy 0 Jul 12 19:04 /proc/18940
[lxy@hecs-165234 linux2]$ 

我们看到我们的 18940 是一个文件,那么我们打开看一下里面有一些什么内容

lxy@hecs-165234 linux2]$ cd /proc/18940
[lxy@hecs-165234 18940]$ ll
total 0
dr-xr-xr-x 2 lxy lxy 0 Jul 12 19:06 attr
-rw-r--r-- 1 lxy lxy 0 Jul 12 19:06 autogroup
-r-------- 1 lxy lxy 0 Jul 12 19:06 auxv
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 cgroup
--w------- 1 lxy lxy 0 Jul 12 19:06 clear_refs
-r--r--r-- 1 lxy lxy 0 Jul 12 19:04 cmdline
-rw-r--r-- 1 lxy lxy 0 Jul 12 19:06 comm
-rw-r--r-- 1 lxy lxy 0 Jul 12 19:06 coredump_filter
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 cpuset
lrwxrwxrwx 1 lxy lxy 0 Jul 12 19:06 cwd -> /home/lxy/108/linux2
-r-------- 1 lxy lxy 0 Jul 12 19:06 environ
lrwxrwxrwx 1 lxy lxy 0 Jul 12 19:06 exe -> /home/lxy/108/linux2/myprocess
dr-x------ 2 lxy lxy 0 Jul 12 19:04 fd
dr-x------ 2 lxy lxy 0 Jul 12 19:06 fdinfo
-rw-r--r-- 1 lxy lxy 0 Jul 12 19:06 gid_map
-r-------- 1 lxy lxy 0 Jul 12 19:06 io
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 limits
-rw-r--r-- 1 lxy lxy 0 Jul 12 19:06 loginuid
dr-x------ 2 lxy lxy 0 Jul 12 19:06 map_files
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 maps
-rw------- 1 lxy lxy 0 Jul 12 19:06 mem
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 mountinfo
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 mounts
-r-------- 1 lxy lxy 0 Jul 12 19:06 mountstats
dr-xr-xr-x 5 lxy lxy 0 Jul 12 19:06 net
dr-x--x--x 2 lxy lxy 0 Jul 12 19:06 ns
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 numa_maps
-rw-r--r-- 1 lxy lxy 0 Jul 12 19:06 oom_adj
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 oom_score
-rw-r--r-- 1 lxy lxy 0 Jul 12 19:06 oom_score_adj
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 pagemap
-r-------- 1 lxy lxy 0 Jul 12 19:06 patch_state
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 personality
-rw-r--r-- 1 lxy lxy 0 Jul 12 19:06 projid_map
lrwxrwxrwx 1 lxy lxy 0 Jul 12 19:06 root -> /
-rw-r--r-- 1 lxy lxy 0 Jul 12 19:06 sched
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 schedstat
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 sessionid
-rw-r--r-- 1 lxy lxy 0 Jul 12 19:06 setgroups
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 smaps
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 stack
-r--r--r-- 1 lxy lxy 0 Jul 12 19:04 stat
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 statm
-r--r--r-- 1 lxy lxy 0 Jul 12 19:04 status
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 syscall
dr-xr-xr-x 3 lxy lxy 0 Jul 12 19:06 task
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 timers
-rw-r--r-- 1 lxy lxy 0 Jul 12 19:06 uid_map
-r--r--r-- 1 lxy lxy 0 Jul 12 19:06 wchan

 这里面我们介绍两个字段

  • exe:我们前面说了,我们的程序就是 PCB + 代码和数据,而我们的 exe就是软连接指向我们的代码和数据,而我们的代码和数据就在后面的那条路劲下
  • cwd:我们的一个程序里面其实有一个默认的路劲,就是当前目录,我们的程序在哪里执行,我们的默认当前目录就在哪个目录下

3. PID

在操作系统中,每一个进程都是由自己独立的编号的,而在PCB中进程的编号就是 PID, PID 可以表示某一个操作系统中的特定的一个进程。

现在我们自己编写一个程序,我们的程序之打印 hello world,下面查看该进程的 PID

#include<stdio.h>
#include<unistd.h>int main()
{while(1){printf("hello world\n");sleep(1);}return 0;
}

查看进程的前面已经说过了,下面直接查看一下。

[lxy@hecs-165234 linux3]$ ps axj | head -1 && ps axj | grep procPPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND6468  6552  6552  6468 pts/1     6552 S+    1000   0:00 ./proc

这里使用 head -1 来显示第一行的信息,第一行可以看到 PID 而该进程的 PID 就是 6552

4. PPID

这里先介绍 PPID 是什么,PPID 就是 该进程的父进程。

父进程是什么?

父进程就是创建该进程的进程,就叫做父进程,而在 linux 中,进程的创建时有两种方法的:

  • 第一种就是: ./程序名,然后操作系统会帮助我们将该进程的代码和数据加载到内存中,然后操作系统也会帮我们为该进程创建对应的 tash_struct 
  • 第二种就是:自己创建,操作系统为我们提供一部分接口,而用户就可以使用这一部分接口来手动的创建进程(fork函数)。

所以系统中的进程都是由别的进程创建的,或者是自己手动创建的,而当用户 ./ 执行一个程序的时候其实也是由父进程的,而这个父进程就是 bash 这个之前说过,bash 在 这里就是命令行解释器,当 bash 察觉到我们是要启动一个进程的时候,就是 bash 帮助用户创建进程,而这里的进程的父进程也就是 bash。

下面查看一下刚才的 6468 的进程,这里可以看到就是 bash

[lxy@hecs-165234 linux3]$ ps axj | head -1 && ps axj | grep 6468PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND6467  6468  6468  6468 pts/1     6468 Ss+   1000   0:00 -bash

为什么要有父进程?

这个我们在下一期说。

5. fork 创建子进程

前面说了, fork 可以创建子进程,那么怎么创建呢?

fork 是一个系统接口,所以如果当我们不明白的时候我们可以使用 man 进程查看该函数的信息。

[lxy@hecs-165234 linux3]$ man 2 forkNAMEfork - create a child processSYNOPSIS#include <unistd.h>pid_t fork(void);RETURN VALUEOn  success, the PID of the child process is returned in the parent, and 0 isreturned in the child.  On failure, -1 is returned in the  parent,  no  childprocess is created, and errno is set appropriately.

这里没有全部显示出来,想了解的可以自己查看。

这里可以看到,该函数的作用就是创建一个子进程,然后下面就是该函数的返回值和头文件,而该函数成功的话有两个返回值, 一个是给父进程返回子进程的 PID, 另一个是给子进程返回0,如果失败的话,就返回 -1.

下面看一下使用。

1) fork 后的现象

#include<stdio.h>
#include<unistd.h>int main()
{printf("begin....\n");fork();printf("end....\n");sleep(1);return 0;
}

运行.... 

[lxy@hecs-165234 linux3]$ ./proc 
begin....
end....
end....

这里是运行后的结果,看到 end 打印的两次。

为什么会打印两次?

第一次解释:

因为 fork 后就会创建一个进程,然后这时候就会有两个执行流执行,所以说 end 被打印了两次

2) 的返回值

这里继续编写一段代码。

 

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>int main()
{pid_t id = fork();if(id == 0){// 子进程while(1){printf("I am a child... \n");sleep(1);}}else if(id > 0){// 父进程while(1){    printf("I am a father... \n");sleep(1);}}else{//创建失败}return 0;
}

然后我们运行看一下结果。

[lxy@hecs-165234 linux3]$ ./proc 
I am a father... 
I am a child... 
I am a father... 
I am a child... 
I am a father... 
I am a child... 

结果就是我们该程序不仅在打印 father 还在打印 child ,我们该进程不仅进了 if 还进了 else if,所以为什么会有这个现象呢?

下面在看一下查看到的进程。

[lxy@hecs-165234 linux3]$ ps axj | head -1 && ps axj | grep procPPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND6468  7387  7387  6468 pts/1     7387 S+    1000   0:00 ./proc7387  7388  7387  6468 pts/1     7387 S+    1000   0:00 ./proc

这里看到确实是这样,第一个是父进程,第二个是子进程,子进程的 PPID 就是父进程的 PID

在下面开始之前先介绍两个函数。

getpid petppid
NAMEgetpid, getppid - get process identificationSYNOPSIS#include <sys/types.h>#include <unistd.h>pid_t getpid(void);pid_t getppid(void);DESCRIPTIONgetpid()  returns the process ID of the calling process.  (This is often usedby routines that generate unique temporary filenames.)

这就是两个函数的介绍,我这里在简单介绍一下,这两个函数一个是返回PID 另一个是返回 PPID 其中,谁调用该函数就返回谁的 PID 和 PPID。

这里为什么会有上面的结果:

  • fork 有两个返回值
  • fork  后又两个进程在执行代码

3) fork 如何办到?

概念铺设:进程之间是互相独立的。进程是有自己的代码和数据的,所以进程之间是互不干扰的。

  • fork为何会有两个返回值:首先,我们相信 fork 会帮我们创建好子进程,而fork 是有返回值的,那么当fork执行到 return 的时候主要的逻辑就执行结束了,所以返回之前就已经创建好了,所以就可以返回两个返回值。
  • fork 后为什么一个 id 里面看起来是有两份数据?在 fork 创建进程后,子进程是和父进程共享代码的,因为子进程没有自己独立的代码,而且代码是不会被修改的,所以没有必要拷贝一份代码。
  • 子进程和父进程的数据是“写时拷贝”的,就是当子进程不修改数据的时候,那么和父进程时共用同一份数据,那么当子进程修改数据后,会为子进程单独拷贝该数据到子进程的地址空间里面,所以就实现了由看起来时一份数据,但是存储了两份数值。

三. 总结

  • PCB 就是一个用来描述进程的一个控制块,操作系统通过对 PCB 进行管理来达到对进程进行管理。
  • task_struct 是 linux 中的 PCB,tash_struct 中有很多属性用来描述该PCB中的信息,其中PID 就是该进程控制块的编号,PPID 就是该进程的父进程
  • fork 是用户自己创建进程的一个手段,fork 通过不同的返回值来进行分流达到父进程和子进程可以区分来完成不同的工作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/13763.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自动驾驶感知系统--惯性导航定位系统

惯性导航定位 惯性是所有质量体本身的基本属性&#xff0c;所以建立在牛顿定律基础上的惯性导航系统&#xff08;Inertial Navigation System,INS&#xff09;(简称惯导系统)不与外界发生任何光电联系&#xff0c;仅靠系统本身就能对车辆进行连续的三维定位和三维定向。卫星导…

Linux学成之路(基础篇0(二十三)MySQL服务(主从MySQL服务和读写分离——补充)

目录 一、MySQL Replication概述 优点 异步复制&#xff08;Asynchronous repication&#xff09; 全同步复制&#xff08;Fully synchronous replication&#xff09; 半同步复制&#xff08;Semisynchronous replication&#xff09; 三、MySQL支持的复制 四、部署主从…

手写vuex

vuex 基本用法 vuex是作为插件使用&#xff0c;Vue.use(vuex) 最后注册给new Vue的是一个new Vuex.Store实例 // store.js import Vue from vue import Vuex from vuexVue.use(Vuex) // Vue.use注册插件 // new Vuex.Store实例 export default new Vuex.Store({state: {},gette…

【树链剖分+MST】CF609E

Problem - E - Codeforces 题意&#xff1a; 思路&#xff1a; 先把全局的MST求出来&#xff0c;然后对于一条边&#xff0c;如果它本来就在MST中&#xff0c;说明代价就是MST的权值和&#xff0c;否则它加入MST中&#xff0c;此时MST形成了环&#xff0c;我们把环中最大的那…

docker安装rabbitmq

1&#xff0c;拉取rabbitmq容器 docker pull rabbitmq 2&#xff0c;下载完以后启动容器 先查看自己的容器id&#xff1a; [rootch ~]# docker images REPOSITORY TAG IMAGE ID CREATED SIZE rabbitmq latest bcef1e…

Power BI-网关设置与云端报表定时刷新(一)

网关的工作原理 网关是将本地数据传输至云端的桥梁&#xff0c;不仅Power BI能使用&#xff0c;其他微软软件也能够使用。 我们发布在云上的报表&#xff0c;发布后是静态的&#xff0c;不会自动刷新。需要通过网关设置定时刷新。 安装与设置 1.登录到Powerbi 在线服务–设置…

实战项目——基于多设计模式下的同步异步日志系统

系列文章目录 1.项目介绍 2.相关技术补充 3.日志系统框架 4.代码设计 5.功能测试 6.性能测试 文章目录 目录 系列文章目录 1.项目介绍 2.相关技术补充 3.日志系统框架 4.代码设计 5.功能测试 6.性能测试 文章目录 前言 一、项目介绍 二、开发环境 三、核心技…

Ubuntu更改虚拟机网段(改成桥接模式无法连接网络)

因为工作需要&#xff0c;一开始在安装vmware和虚拟机时&#xff0c;是用的Nat网络。 现在需要修改虚拟机网段&#xff0c;把ip设置成和Windows端同一网段&#xff0c;我们就要去使用桥接模式。 环境&#xff1a; Windows10、Ubuntu20.04虚拟机编辑里打开虚拟网络编辑器&#…

7.Docker-compose

文章目录 Docker-compose概念Docker-compose部署YAML文件格式和编写注意事项注意数据结构对象映射序列属组布尔值序列的映射映射的映射JSON格式文本换行锚点和引用 Docker compose配置常用字段docker compose常用命令Docker Compose 文件结构docker compose部署apachedocker co…

Ubuntu Server版 之 mysql 系列(-),安装、远程连接,mysql 创建用户、授权等

Ubuntu 分 桌面版 和 服务版 桌面版 &#xff1a;有额外的简易界面 服务版&#xff1a;是纯黑框的。没有任何UI界面的可言 安装mysql 安装位置 一般按照的位置存放在 /usr/bin 中 sudo apt-get install mysql-server退出程序或应用 exit 或 Ctrl D 查看mysql的状态 servic…

springboot参数校验

springboot参数传递 PathVariableRequestParamRequestBody JSR303 jsr303 &#xff1a; 也称 bean validation 规范&#xff0c;用于java bean 验证的标准API&#xff0c;&#xff0c;他定义了一组注解&#xff0c;可以在javabean 的属性上声明验证规则 JSR&#xff1a; ja…

【Android安全】Embedded Trace Microcell模块

ETM: Embedded Trace Macrocell, hardware unit responsible to generate hardware instruction trace. ETM模块用于在硬件层面实现instruction trace&#xff0c;可用于辅助逆向分析。 使用教程&#xff1a; https://mcuoneclipse.com/2016/11/05/tutorial-getting-etm-inst…

鸿鹄协助管理华为云与炎凰Ichiban

炎凰对华为云的需求 在炎凰日常的开发中&#xff0c;对于服务器上的需求&#xff0c;我们基本都是采用云服务。目前我们主要选择的是华为云&#xff0c;华为云的云主机比较稳定&#xff0c;提供的云主机配置也比较多样&#xff0c;非常适合对于不同场景硬件配置的需求&#xff…

Java IO,BIO、NIO、AIO

操作系统中的 I/O 以上是 Java 对操作系统的各种 IO 模型的封装&#xff0c;【文件的输入、输出】在文件处理时&#xff0c;其实依赖操作系统层面的 IO 操作实现的。【把磁盘的数据读到内存种】操作系统中的 IO 有 5 种&#xff1a; 阻塞、 非阻塞、【轮询】 异步、 IO复…

NLP From Scratch: 生成名称与字符级RNN

NLP From Scratch: 生成名称与字符级RNN 这是我们关于“NLP From Scratch”的三个教程中的第二个。 在<cite>第一个教程< / intermediate / char_rnn_classification_tutorial ></cite> 中&#xff0c;我们使用了 RNN 将名称分类为来源语言。 这次&#xff…

Java泛型

文章目录 1. 泛型入门1.1 定义简单泛型类1.2 泛型方法1.3 限定类型变量 2. 擦除和转换2.1 类型擦除 3. 类型通配符3.1 通配符上限3.2 通配符下限3.3 例子 4. java的Type4.1 UML总览 1. 泛型入门 泛型的英文名Generic&#xff0c;java5以后&#xff0c;引入参数化类型&#xff…

原型模式——对象的克隆

1、简介 1.1、概述 可以通过一个原型对象克隆出多个一模一样的对象&#xff0c;该模式被称为原型模式。 在使用原型模式时&#xff0c;需要首先创建一个原型对象&#xff0c;再通过复制这个原型对象来创建更多同类型的对象。 1.2、定义 原型模式&#xff08;Prototype Patt…

14.python设计模式【模板方法模式】

内容&#xff1a;定义一个操作中的算法的骨架&#xff0c;而将一些步骤延迟到子类中。模板方法使得子类可以不改变一个算法的结构即可重定义该算法某特定步骤。 角色&#xff1a; 抽象类&#xff08;AbstractClass&#xff09;&#xff1a;定义抽象的原子操作&#xff08;钩子…

基于开源IM即时通讯框架MobileIMSDK:RainbowChat v9.0版已发布

关于MobileIMSDK MobileIMSDK 是一套专门为移动端开发的开源IM即时通讯框架&#xff0c;超轻量级、高度提炼&#xff0c;一套API优雅支持UDP 、TCP 、WebSocket 三种协议&#xff0c;支持iOS、Android、H5、标准Java平台&#xff0c;服务端基于Netty编写。 工程开源地址是&am…

HTML5前端开发工程师的岗位职责说明(合集)

HTML5前端开发工程师的岗位职责说明1 职责 1、根据产品设计文档和视觉文件&#xff0c;利用HTML5相关技术开发移动平台的web前端页面; 2、基于HTML5.0标准进行页面制作&#xff0c;编写可复用的用户界面组件; 3、持续的优化前端体验和页面响应速度&#xff0c;并保证兼容性和…