Linux修炼之路之进程概念,fork函数,进程状态

目录

一:进程概念 

二:Linux中的进程概念

三:用getpid(),getppid()获取该进程的PID,PPID

四:用fork()来创建子进程

五:操作系统学科的进程状态 

 六:Linux中的进程状态

接下来的日子会顺顺利利,万事胜意,生活明朗-----------林辞忧

一:进程概念 

1.操作系统学科层面的概念

一个加载到内存中的程序,叫做进程;   正在运行的程序叫做进程

2.深层次的进程概念

对于一个操作系统不仅仅只能运行一个进程,而是可以运行很多个进程,为了更好的管理这些进程,就需要用先描述再组织的思想

因此对于任何一个进程在加载到内存当中的时候,形成真正的进程时,操作系统要先创建描述该进程(属性)的struct结构体对象,即PCB(进程属性的集合)----进程控制块

PCB是在操作系统中定义的struct结构体类型。当加载进程的时候,本质上不仅仅是把对应的数据和代码加载到内存,而且操作系统会根据描述该进程的PCB类型为当前进程创建对应的PCB对象,把该进程的相关属性值填充完成初始化。这个PCB结构体变量是由操作系统自己形成的。

进程=内核PCB数据结构对象(描述该进程所有的属性值)+对应的代码和数据

在操作系统中,对于所有进程的PCB结构体对象使用双向链表的方式 进行连接,在每个PCB结构体对象中包含相应的指针字段指向该进程对应的代码和数据,此后操作系统只需对PCB对象进行管理,便可以达到管理进程的目的,这样对于进程的管理就转化为对这个链表的增删查改

二:Linux中的进程概念

1.在Linux中描述进程的结构体叫做task_struct(Linux系统中的PCB)。

2.task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含着进程的信息

3.根据task_struct实例化进程对象,创建一个具体的PCB对象,再把所有对象的PCB组织起来

4.task_struct中包含的进程属性

     标示符: 描述本进程的唯一标示符,用来区别其他进程(PID)

    状态: 任务状态,退出代码,退出信号等

    优先级: 相对于其他进程的优先级

    程序计数器: 程序中即将被执行的下一条指令的地址

    内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针

    上下文数据: 进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]

    I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表

    其他信息

6.查询进程信息相关指令

  ps axj 查看进程信息

  top 查看正在运行的进程信息

  ls /proc -l  :在系统当中启动的所有进程默认在/proc目录里,就会给相应进程在/proc目录里创建以该进程PID命名的文件夹/目录,在该目录里保存了进程的大多属性;在关机后,/proc目录下的所有数据就都没有了,在开机时,操作系统会自动创建这些目录/文件,这上面显示的所有信息是Linux操作系统用文件系统的方式把内存当中的文件/进程信息可视化出来,而且这些信息都是内存级别的

ls  /proc/进程PID -l 显示系统当中具体动态运行的进程的相关信息

注:1.进程所对应的可执行程序是在磁盘exe目录下的这个文件当中,所以PID对应的进程的可执行程序是可以被找到的

2.cwd:当进程在启动时,该进程的PCB属性里就记录了当前Linux所在的绝对路径,也就是当前进程的工作目录;在当前特定目录下工作的一个进程,默认自己的进程在哪个目录下,这个目录就是这个进程的当前目录,创建文件/搜索文件都是在这个当前目录下完成的

三:用getpid(),getppid()获取该进程的PID,PPID

1.创建一个进程,就要操作系统创建对应的PCB,在Linux中称为task_struct结构体对象,当存在多个时,就要用双向链表方式进行连接管理,通过找到头结点来访问各个进程,为了区分这些进程,操作系统就分配了对应的PID,对应的PID是存在于task_struct结构体当中

2.进程在运行时,都会有独属于自己的PID,对于PID当每个进程在系统运行期间终止了后再启动,操作系统分配的PID标识符多数情况下是会改变的

注:这里检索指令也可以写为 ps axj | head -1 && ps axj | grep test 

当grep自己过滤时,也要变为一个进程,而grep命名的进程中也含有关键字test,所以当它在执行过滤系统当中的进程时,首先得把grep变为一个进程,然后被cpu调度执行过滤代码,在过滤时也就会把自己带上,所以所有指令运行时都是进程

ps axj | head -1 ; ps ajx | grep test | grep -v grep       这样的话就不会带自己了

3.ps指令的本质:遍历链表,在task_struct中将对应属性格式化打印出来

4.kill -9 进程PID  杀掉进程 

5.PID存在于task_struct结构体当中,这个结构体是属于操作系统所维护的,是系统内的数据,所以用户不能直接通过task_struct结构体对象以.的方式访问PID,而是要通过对应的系统调用接口来获取进程的PID,对于PPID也是如此

6.当每次重新登录时,系统会为我们单独创建一个bash进程,即创建一个命令行解释的进程,在显示器中打印出对应的对话框终端 

7.当运行一个进程时,命令行解释器会将后面的指令变为bash的子进程,由子进程执行对应的命令,当子进程出现问题时,不影响bash进程,即在命令行中输入的所有指令都是bash进程的子进程,bash进程只负责命令行解释

四:用fork()来创建子进程

fork()是用来创建一个子进程,创建成功的话,给父进程返回子进程的PID,给自己返回0;失败的话,给自己返回-1 

 

这里我们会发现fork()之后的代码执行了两次,即fork()之后会变成两个进程,执行不同的代码块 

 1.为什么fork要给子进程返回0,给父进程返回子进程的PID?

返回不同的返回值,是为了区分不同的执行流,执行不同的代码块

给父进程返回子进程的PID,是为了通过父进程的PID去明确控制访问的是哪个子进程(控制并区分子进程),PID也是用来标定子进程的唯一性的

而子进程只需要调用getpid()就能获取进程的PID/PPID,所以找到父进程很容易,只需要返回0来标识成功即可

2.fork()函数究竟干了什么?

     当执行到fork()时,就要创建对应的子进程,而进程=内核task_struct数据结构对象+对应的代码和数据,而创建对应的task_struct结构体对象是以原先老进程的task_struct为模板拷贝一份并用父进程的相应字段来初始化子进程,做相应修改,但对于代码是没有的,所以只能共享父进程的代码;而对于数据,如果子进程也把对应的和父进程共享的数据拷贝一份的话,由操作系统自动完成,但这样必然会造成子进程对这部分数据只修改一部分或者不修改,造成有两份相同的数据形成冗余,占有资源,因此当子进程要访问父进程的某一部分数据,并且操作系统识别到要对父进程的这部分数据做修改时,这时就在系统的内存位置重新开辟一块空间将数据拷贝过去,写入。这样对于子进程想对父进程修改的数据,就再开辟空间,在新空间写入==>父子进程间数据层面的写时拷贝

 

对于fork本质上是一个函数,也是一个系统调用,在操作系统当中是有实现的 

所以这样同一个函数就返回了两次

3.一个变量是怎么会有不同的内容的?

 

五:操作系统学科的进程状态 

1.cpu负责把一个进程放到cpu中去执行,由调度器决定被调度的具体进程,所有进程参与到操作系统的调度过程,所有的进程之间对于cpu资源本质是一种竞争关系,所以存在调度器是为了保证进程间的公平调度

2.为合理调度,每个cpu都要维护一个runqueue的结构体,cpu以运行队列的形式对进程进行调度

 

3.对于每个进程都有时间片的概念,在时间片的时间中被cpu调度执行,时间结束,自动切换到下一个进程,如果这个进程还需要被调度执行的话,就会被链接到队列最后面排队等待调度执行

4.在一个时间段内,所有进程的代码都会被调度执行------->并发执行

把进程放到cpu上去执行,再拿下来--------->进程切换

 

5.对于底层的硬件设备也可以采用先组织,再描述的方式进行管理,即每个外设都维护一个对应的结构体对象。这样操作系统对于底层设备的管理也就转换为在系统当中对某种设备结构体的管理,如果当前要访问的资源不存在/未准备好,此时进程卡住了,这就是阻塞状态

此时该进程 就在对应外设的等待队列中排队等待资源就绪,一旦资源就绪就可以链接到运行队列中等待被cpu调度执行

6.当进程资源不足时,操作系统会将进程的代码和数据置换到外设当中,这样数据和代码并未在内存当中,这时所处的状态就是挂起状态

 六:Linux中的进程状态

1.Linux内核中的定义

"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};

2. R运行状态(running): 并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列里

当无IO,纯运行时,就会变为R状态 

3.S睡眠状态(sleeping): 意味着进程在等待事件完成(这里的睡眠有时候也叫做可中断睡眠
(interruptible sleep)

这里当printf是要访问显示器 的,当死循环打印时,设备不是处于一个正写入的状态,进程有很大可能是一直在等待的,所以是S+而不是R+;对于这里有+的表示是在前台执行的(当运行起来程序时,bash命令行解释器对输入的指令不再有反应),可以用ctrl+c终止进程,可以采用./test & 这样就会变为S,变为后台执行,此时就必须用kill -9 PID来终止进程

4.D磁盘休眠状态(Disk sleep)有时候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的进程通常会等待IO的结束

只要进程当前正在有写入任务交给磁盘时,如果磁盘没有办法立马响应的话,需要等待进程,这个进程就不能以S浅度睡眠的状态去等待,必须把自己设为D状态,D状态进程任何人都不能杀掉,包括操作系统,这样可以保证向磁盘中写入数据时,数据不会丢失。当磁盘把数据写完之后返回时,此时进程的状态就由D转变为R,供cpu调度执行

即进程在等待磁盘进行写入时,此时进程所处状态为D状态,是不响应操作系统的任何请求的

5.T停止状态(stopped): 可以通过发送 SIGSTOP 信号给进程来停止(T)进程。这个被暂停的进程可以通过发送 SIGCONT 信号让进程继续运行

kill -l 查看信号

kill -19 PID 让当前进程停下  kill -18 PID 恢复当前进程由T变为R状态

S状态一定是在等待某种资源,而T状态可能在等待某种资源/被其他进程控制 

6.X死亡状态(dead):这个状态只是一个返回状态,你不会在任务列表里看到这个状态

7.Z(zombie)-僵尸状态

当一个进程死亡的时候,在死亡之时,并不会立即进入dead的状态,而是先进入Z状态

当一个进程退出时,它并不是退出之后立即将所有资源进行释放,而是操作系统需要把当前进程退出之时的退出信息维持一段时间,当对应的父进程读取到进城的信息,进程的资源才会被释放,这段时间所处的状态为Z状态,即我们把这样已经死掉的,但是当前需要由父进程来关心,此时进程所维持的状态

进程一般退出的时候,如果父进程没有主动收回子进程信息,子进程会让自己一直处于Z状态进程的相关资源尤其是task_struct结构体不能释放,所以会一直占用资源而且不释放,就会导致内存泄露,父进程是bash进程的子进程,退出时会被bash所回收

父子进程当父进程先退出,子进程的父进程会被改为1号进程(操作系统),即父进程是1号进程的子进程也叫做孤儿进程,该进程被操作系统所领养,为未来该进程退出时的释放资源

僵死状态(Zombies)是一个比较特殊的状态。当进程退出并且父进程使用wait()系统调用,后面讲没有读取到子进程退出的返回代码时就会产生僵死(尸)进程

僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码

只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入Z状态

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/38311.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

配置windows环境下独立浏览器爬虫方案【不依赖系统环境与chrome】

引言 由于部署浏览器爬虫的机器浏览器版本不同,同时也不想因为部署了爬虫导致影响系统浏览器数据,以及避免爬虫过程中遇到的chrome与webdriver版本冲突。我决定将特定版本的chrome浏览器与webdriver下载到项目目录内,同时chrome_driver在初始…

我使用 GPT-4o 帮我挑西瓜

在 5 月 15 日,OpenAI 旗下的大模型 GPT-4o 已经发布,那时网络上已经传开, 但很多小伙伴始终没有看到 GPT-4o 的体验选项。 在周五的时候,我组建的 ChatGPT 交流群的伙伴已经发现了 GPT-4o 这个选项了,是在没有充值升…

NSSCTF-Web题目21(文件上传-phar协议、RCE-空格绕过)

目录 [NISACTF 2022]bingdundun~ 1、题目 2、知识点 3、思路 [FSCTF 2023]细狗2.0 4、题目 5、知识点 6、思路 [NISACTF 2022]bingdundun~ 1、题目 2、知识点 文件上传,phar伪协议 3、思路 点击upload,看看 这里提示我们可以上传图片或压缩包&…

Unity 解包工具(AssetStudio/UtinyRipper)

文章目录 1.UtinyRipper2.AssetStudio 1.UtinyRipper 官方地址: https://github.com/mafaca/UtinyRipper/ 下载步骤: 2.AssetStudio 官方地址: https://github.com/Perfare/AssetStudio 下载步骤:

STM32mp157aaa按键中断实验

效果图&#xff1a; 源码&#xff1a; #include "key.h" void hal_key1_rcc_gpio_init() {// 使能GPIOF组RCC->MP_AHB4ENSETR | (0x1 << 5);// 设置引脚位输入模式GPIOF->MODER & (~(0X3 << 18));GPIOF->MODER & (~(0X3 << 16))…

VMware创建新虚拟机教程(保姆级别)

&#x1f4e2; 续上一篇 最新超详细VMware虚拟机安装完整教程-CSDN博客 &#xff0c;本章将详细讲解VMware创建虚拟机。 一、创建新的虚拟机 点击【创建新的虚拟机】&#xff01; 点击【自定义&#xff08;高级&#xff09;】> 下一步&#xff01; > 默认下一步&#x…

耐克:老大的烦恼

股价暴跌20%&#xff0c;老大最近比较烦。 今天说说全球&#xff08;最&#xff09;大运动品牌——耐克。 最近耐克发布2023-2024财年业绩&#xff08;截止于2024.5.31&#xff09;&#xff0c;还是爆赚几百亿美元&#xff0c;还是行业第一&#xff0c;但业绩不及预期&#xf…

Redis为什么设计多个数据库

​关于Redis的知识前面已经介绍过很多了,但有个点没有讲,那就是一个Redis的实例并不是只有一个数据库,一般情况下,默认是Databases 0。 一 内部结构 设计如下: Redis 的源码中定义了 redisDb 结构体来表示单个数据库。这个结构有若干重要字段,比如: dict:该字段存储了…

scikit-learn教程

scikit-learn&#xff08;通常简称为sklearn&#xff09;是Python中最受欢迎的机器学习库之一&#xff0c;它提供了各种监督和非监督学习算法的实现。下面是一个基本的教程&#xff0c;涵盖如何使用sklearn进行数据预处理、模型训练和评估。 1. 安装和导入包 首先确保安装了…

【漏洞复现】D-Link NAS 未授权RCE漏洞(CVE-2024-3273)

0x01 产品简介 D-Link 网络存储 (NAS)是中国友讯&#xff08;D-link&#xff09;公司的一款统一服务路由器。 0x02 漏洞概述 D-Link NAS nas_sharing.cgi接口存在命令执行漏洞&#xff0c;该漏洞存在于“/cgi-bin/nas_sharing.cgi”脚本中&#xff0c;影响其 HTTP GET 请求处…

Java 汉诺塔问题 详细分析

汉诺塔 汉诺塔&#xff08;Tower of Hanoi&#xff09;&#xff0c;又称河内塔&#xff0c;是一个源于印度古老传说的益智玩具。大梵天创造世界的时候做了三根金刚石柱子&#xff0c;在一根柱子上从下往上按照大小顺序摞着64片黄金圆盘。大梵天命令婆罗门把圆盘从下面开始按大小…

vulnhub靶场ai-web 2.0

1 信息收集 1.1 主机发现 arp-scan -l 主机地址为192.168.1.4 1.2 服务端口扫描 nmap -sS -sV -A -T5 -p- 192.168.1.4 开放22&#xff0c;80端口 2 访问服务 2.1 80端口访问 http://192.168.1.4:80/ 先尝试admin等其他常见用户名登录无果 然后点击signup发现这是一个注…

prescan软件中导入路径文件txt/lpx

由于博主收到的是lpx格式的路径文件&#xff0c;因此&#xff0c;第一步 1.记事本打开 ctrla 全选 ctrlc 复制 2.新建一个excel 鼠标定位到第一行第一列的格子 ctrlv 复制 3.数据栏“分列”功能 4. (0.1递增的数列&#xff0c;纬度&#xff0c;经度&#xff0c;高程) 导入…

JDBC操作流程

目录 简介 具体操作 1. 引入驱动包 1&#xff09;下载驱动包 2&#xff09;引入驱动包到项目中 2. 编写代码 1&#xff09;创建数据源 2&#xff09;建立连接 3&#xff09;构造 SQL 语句 4&#xff09;执行 SQL 语句 5&#xff09;释放资源 总结 简介 JDBC 就是使…

某网页gpt的JS逆向

原网页网址 (base64) 在线解码 aHR0cHM6Ly9jbGF1ZGUzLmZyZWUyZ3B0Lnh5ei8 逆向效果图 调用代码&#xff08;复制即用&#xff09; 把倒数第三行换成下面的base64解码 aHR0cHM6Ly9jbGF1ZGUzLmZyZWUyZ3B0Lnh5ei9hcGkvZ2VuZXJhdGU import hashlib import time import reques…

C语言+ MSSQL技术开发的 PACS系统源码:CT后处理技术之仿真内镜CTVE

C语言 MSSQL技术开发的 PACS系统源码&#xff1a;CT后处理技术之仿真内镜CTVE 仿真内窥镜VE VE是利用医学影像作为原始数据&#xff0c;融合图像处理、计算机图形学、科学计算可视化、虚拟现实技术&#xff0c;模拟传统光学内镜的一种技术。 又叫做腔内重建技术&#xff0c;是…

试用笔记之-汇通来电显示软件

首先汇通来电显示软件下载 http://www.htsoft.com.cn/download/httelephone.rar

平衡树专题Splay

写在前面&#xff1a; 部分来自孙宝&#xff08;Steven24&#xff09;的博客&#xff0c;表示感谢。 认识 什么是Splay 就是BST的一种&#xff0c;整体效率是很高的&#xff0c;均摊的次数是O(logn)级别的。 基本操作就是把节点旋转到BST的root&#xff0c;从而改善BST的平…

免交互简单操作

免交互 交互&#xff1a;我们发出指令控制程序的运行&#xff0c;程序在接收到指令后按照指令的效果作出对应的反应 免交互&#xff1a;间接的&#xff0c;通过第三方的方式把指令传给程序&#xff0c;不用直接下达指令 Here Document免交互 这是命令行格式&#xff0c;也可…

不用找了!这个软件自带各行业话术,客服效率飞跃

有一款客服工具软件&#xff0c;不但能吸附聊天窗口&#xff0c;实现图文视频话术的一键发送&#xff0c;还内置了多行业的优质客服话术模板&#xff0c;允许用户直接下载使用&#xff0c;快速构建起适合自身企业的专业客服知识库。 前言 在今天的快节奏商业环境中&#xff0c…