【Linux的进程篇章 - 环境变量的理解】

Linux学习笔记---007

  • Linux之进程优先级、环境变量以及地址空间的理解
    • 1、进程优先级
      • 1.1、什么是优先级?
      • 1.2、为什么要有优先级?
      • 1.3、Linux的优先级特点以及查看方式
      • 1.4、进程的几个特性
    • 2、环境变量
      • 2.1、概念
      • 2.2、命令行参数
        • 2.2.1、什么是命令行参数?
        • 2.2.2、为什么要有命令行参数?为什么要这么干?
        • 2.2.3、这个工作过程由谁完成?
        • 2.2.4、命令行参数的意义
      • 2.3、环境变量
      • 2.4、见识更多的环境变量以及操作。
      • 2.5、整体理解环境变量、系统以及程序的结合
      • 2.6、内建命令
    • 3、地址空间
      • 3.1、代码直观现象
      • 3.2、引入最基本的理解
      • 3.2、细节问题
        • 3.2.1、如何理解地址空间?
        • 3.2.2、为什么要有地址空间?
        • 3.2.3、如何进一步理解页表和写时拷贝?
      • 3.3、写时拷贝
      • 3.4、如何理解虚拟地址?
      • 3.5、地址空间小结
    • 4、内核进程调度队列
      • 4.1、Linux真正是如何调度的呢?

Linux之进程优先级、环境变量以及地址空间的理解

前言:
前篇了解学习了Linux的进程概念、冯诺依曼体系结构,操作系统等基础知识,这篇介绍开始学习LInux的进程更深一层次的理解,优先级、环境变量、地址空间和进程调度等相关内容,更深入地了解这个强大的开源操作系统。
/知识点汇总/

1、进程优先级

1.1、什么是优先级?

本质就是指定一个进程,并获取某种资源(CPU)的先后顺序。

Linux中优先级数字越小,优先级越高。

优先级和权限的区别:
权限决定的是能不能的问题;优先级是已经能的前提条件。只是能了,来获取某种资源的先后顺序。

1.2、为什么要有优先级?

要明白进程访问的资源(CPU)始终是有限的。系统中进程数量大部分情况都是较(硬件等资源)多的(windows的任务管理器)。

1.3、Linux的优先级特点以及查看方式

测试代码:
在这里插入图片描述
查看进程命令:ps -al
查看结果显示
在这里插入图片描述
说明:

UID:执行者身份
PID:进程ID
PPID:父进程ID
PRI:进程优先级
NI:进程优先级的修正数据(nice值)
其中:nice值–>新的优先级 = 优先级 + nice值,达到对于进程优先级动态修改的过程。
nice和renice命令 – 调整优先级方法1
用top命令更改已存在的进程的nice值 – 调整优先级方法2
步骤:
1.top
2.进入top后输入’r’–>输入需修改的进程PID–》输入nice值

调整优先级方法2:
当nice输入100时,观察现象可知:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

nice值并不能被任意调整,它是属于一定范围的数值。–》[-20,19]–>40个数值
(通常情况下,不提倡随意更改nice值)默认情况下,每次调整都是从80开始的。[60,99]

1.4、进程的几个特性

竞争性: 系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争属性的。为了高效完成任务,更合理竞争相关资源,便具有了优先级。
独立性: 多进程运行,需要独享各种资源,多进程运行期间互不干扰
并行: 多个进程在多个CPU下分别,同时进行运行,这称之为并行
并发: 多个进程在一个CPU下采用进程切换的方式,在一段时间之内,让多个进程都得以推进,称之为并发。

2、环境变量

2.1、概念

概念:一般是指操作系统中用来指定操作系统运行环境的一些参数。 环境变量通常具有某些特殊的用途,还有在系统中通常具有的全局特性。

2.2、命令行参数

引言:

int main(int argc,char* argv[])
{}

main函数的参数可带可不带。

这里研究可带:那么这些参数的意义又是什么呢?

2.2.1、什么是命令行参数?

测试代码:
在这里插入图片描述
说明

main函数的前两个参数:int argc,char* argv[]
argc表示argv的个数,argv表示的是字符数组,并以’\0’/NULL结尾,命令行字符串(选项)

代码现象

argv[0]->./process —程序的路径+名称
argv[0]->a —和进程匹配的选项
argv[0]->b —和进程匹配的选项
argv[0]->c —和进程匹配的选项
argv[0]->d —和进程匹配的选项

结论:说明命令行参数本质就是字符串。

2.2.2、为什么要有命令行参数?为什么要这么干?

本质是可以交给我们程序的不同选项,用来定制不同功能的程序。通常命令中携带很多的选项。

其次,可以这么理解,windows中关机选项有:关机、重启、睡眠
本质就是一个程序的不同选项,从而跑三个功能。解决资源和提升利用效率。

2.2.3、这个工作过程由谁完成?

是父进程bash利用命令行解释器完成的
测试代码
在这里插入图片描述
发现:
不管父子进程,对于全局变量都能拿到数据。
即:父进程的数据,默认能被子进程看到并访问(注意:并不代表能访问写)。

再次观察父进程ID:
命令行中启动的程序,都会变成进程,其实都是bash的子进程。

命令行参数默认是输入给父进程bash的。所以是父进程bash利用命令行解释器完成的。

2.2.4、命令行参数的意义

小结
这些参数是在命令行中执行程序时传递给程序的值,用于控制程序的运行方式和实现更多功能。命令行参数可以分为可选参数和必选参数,其中可选参数是程序运行时可以省略的,而必选参数则是必须提供的。
通过命令行参数,用户可以定制程序的运行行为,以满足不同的需求。
命令行参数是参数化程序执行的一种常见且简单的方法。它们允许程序在运行时接收外部数据,如文件路径或其他配置信息,并通过主函数的参数将这些数据传递进函数内部。这样,程序就能够根据这些参数执行相应的操作,从而扩展了程序的功能和灵活性。
总之,命令行参数的意义在于提供了一种简单而有效的方式来控制和定制程序的运行行为,使得程序能够适应不同的应用场景和用户需求。

2.3、环境变量

引言:
我们自己写的程序想要执行需要带上:./ + filename.exe(可执行程序路径)?
而像ls/touch/makdir/rm…可带可不带呢?

为什么呢?

因为Linux系统中存在一些全局的设置,表明来告诉命令行解释器,应该去哪些路径下去找对应的可执行程序。

查看指定环境变量命令

echo $PATH

说明:
系统中有很多的设置,在我们登录Liunx系统时,就已经被加载到了bash进程(内存)中了,通常是一些重要的配置文件。
当我们把我们自己写的程序想像ls命令一样不用输入路径时,可以将程序拷贝或添加到PATH环境变量中去。

PATH= (赋值就是覆盖)/home/class/process(path) – 会导致其他指令被覆盖无法再运行其他指令了。不建议
好在此时的环境变量处于内存级,属于在登录Linux时被加载过来的,具有临时属性(内存级),所以重启一下即可恢复。

要想真的添加进环境变量不能任性的赋值,可以使用如下格式:

PATH=$PATH:+path

其次要想永久有效,不需要每次重启后都添加,那么就可以直接到具体的配置文件中添加即可。
具体的配置文件:

在各自账户的home下,有两个特殊的隐藏文件就是配置文件。
1…bash_profile
2…bashrc

如图所示
在这里插入图片描述

小结:环境变量默认是在配置文件里。

2.4、见识更多的环境变量以及操作。

echo $HOME/SHELL/HISTRIZE/PWD…
在这里插入图片描述

自己定义一个环境变量:
环境变量赋值:export HELLO=1233 — 环境变量
export HELLO=12345
hellobit=1233 —不加export时,属于本地变量
在这里插入图片描述
取消环境变量:
unset +环境变量名
在这里插入图片描述

2.5、整体理解环境变量、系统以及程序的结合

a.代码获取环境变量
测试代码
在这里插入图片描述

环境变量默认也是可以被子进程拿到的。
磁盘中包含了环境变量,加载(拷贝)到内存中(全局的),父进程的数据默认能被子进程所访问的(并不能代表访问并修改)。

那么环境变量可是有很多的,bash内部如何组织呢?
由char* env[]的链表管理。(管理 --》先描述再组织)
bash进程启动的时候,默认会给我子进程形成两张表:
argv[]命令行参数表,env[]环境变量表,bash通过各种方式交给子进程。

argv[]命令行参数表 — 用户输入命令行
env[]环境变量表 — 从os配置文件来
export:本质就是把我们的环境变量拿到表里去。
环境变量具有系统级的全局属性,因为环境变量本身会被子进程继承下去。

单个获取环境变量的内容:getenv
在这里插入图片描述

环境变量三种获取
1.extern char** environ
2.通过mian函数参数
3.getenv(‘path’)

2.6、内建命令

像export/echo/…由bash亲自执行的命令属于内建命令。就算把环境变量清空,也正常能跑。

新建的环境变量HELLO=123456(仅仅这样赋值的变量是本地变量),不用export命令导入时,getenv()和 env | grep HELLO 是找不到的。只有echo $HELLO内建命令能找到。
所以需要使用:export HELLO导入才行。可理解为修改为全局。不然仅仅作为本地变量。
unset HELLO释放环境变量

结论:

本地变量只在本bash内部有效,无法被子进程继承下去使用,只有利用export导入全局环境变量,此时才能够被获取到。
要想真的添加进环境变量不能任性的赋值,可以使用如下格式:
PATH=$PATH:+path

3、地址空间

3.1、代码直观现象

1.直接写代码,看现象
在这里插入图片描述
现象
在这里插入图片描述
发现同一个变量,地址相同,父子进程的变量值可不同。但是这个地址一定不是物理地址。而是虚拟地址。
父子进程是具有独立性的。
理解

进程 = 内核数据结构(task_struct) + 代码和数据

3.2、引入最基本的理解

地址空间示意图
在这里插入图片描述

地址空间的本质就是内核中一个结构体对象
子进程会把父进程的很多内核数据全拷贝一份。

1.所以变量值不同,但是地址相同,是由操作系统通过页表把地址空间的虚拟地址与物理内存地址进行匹配或管理,如果对应物理地址已经有了地址,可访问但不代表能访问修改;
2.所以就在物理内存上开辟另一个相同大小的空间,且把数据拷贝过来,再修改为指定的数值。
3.所以物理地址实际是不同的,返回的是虚拟地址,再页表上虚拟地址是相同的,所以地址会显示相同而值不同。
操作系统对页表和物理内存的匹配机制分配操作称为写时拷贝(OS自主完成)。
本质就是按需申请。更好的利用效率。提升容错率。

每一个进程都会有一个虚拟地址空间,都会有一个独立的页表

3.2、细节问题

父子进程具备独立性。如果父进程不写呢?
未来一个全局变量,默认是被父子共享的,代码是共享的(只读)
为什么要独立呢?可不可以,把数据在创建子进程的时候,全部给子进程拷贝一份?

3.2.1、如何理解地址空间?

a.什么是划分区域?
地址空间的本质就是内核的一个struct结构体。
内部有很多属性都是表示,区域的范围。

b、地址空间的理解。

地址空间包括物理空间和虚拟空间两部分。物理空间指的是实际存在的硬件内存,而虚拟空间则是通过内存管理技术(如分页、分段等)创建的,用于扩展程序的可用内存范围。这种扩展是通过将部分物理内存与硬盘上的空间结合使用来实现的,从而给程序提供更大的内存空间。

3.2.2、为什么要有地址空间?

①将无序变成有序,让进程以统一的视角看待物理内存,以及自己运行的各个区域。实际的物理内存中,代码区、数据区、堆区、栈区、共享区、命令行参数和环境变量。
②进程管理和内存管理模块进行解耦。
③拦截非法请求。防止废旧的数据,影响物理内存。
本质就是对物理内存的保护。

3.2.3、如何进一步理解页表和写时拷贝?

进程挂起、字符串常量不可修改。(权限只读)
所以页表具有权限属性。

当时匹配识别到错误:
1.是不是数据不存在物理内存。 – 缺页中断
2.是不是数据需要写时拷贝。 — 发生写时拷贝
3.如果都不是,才进行异常处理。 – error

3.3、写时拷贝

**写时拷贝主要适用于深拷贝,**以提高效率。深拷贝是在对象再开一块空间,将值拷贝过去,再让新对象的指针指向新开辟的空间。
写时拷贝在开始时不会立即申请新空间,而是让新对象的指针先指向原对象的空间。在读取或写入时,再在堆上申请新空间。
这种技术通过引用计数来记录资源使用者的个数,当销毁对象时,引用计数会相应减少,只有当引用计数为1时,才会释放空间。

写时拷贝的一个典型应用是Linux的fork()系统调用。
传统的fork()系统调用会复制所有的资源给新创建的进程,这既简单又低效,因为很多数据其实是可以共享的。
而Linux的fork()使用写时拷贝技术,使得父子进程在开始时共享同一个地址空间,只有在实际需要写入数据时,才会复制地址空间,从而提高了效率。

3.4、如何理解虚拟地址?

在最开始的时候,地址空间在页表里的数据从哪里来的?

程序本身就自带的地址。 – 虚拟地址,高地址向低地址,地址空间(虚拟地址/逻辑地址)。
所以虚拟地址和页表的数据都来自于程序本身的字段。 — 因为已经被编址了。

反汇编指令

objdump -S filename.c

测试代码
virtual.c

再次理解父子进程的return
本质就是对id赋值。
所以fork有两个返回值就明白了,底层发生写时拷贝。

3.5、地址空间小结

地址空间(Address Space)是一个用于描述计算机实体(如外设、文件、服务器或网络计算机)所占用的内存大小的概念。在计算机科学中,地址空间不仅仅指的是物理内存的大小,还包括了虚拟内存的部分。每个计算机设备以及进程都会被分配一个特定的地址空间,这个空间定义了该实体可以访问的内存范围。
总的来说,地址空间是计算机内存管理中的一个核心概念,它决定了计算机实体可以访问的内存范围和方式。通过对地址空间的合理分配和管理,可以确保计算机系统的稳定性和安全性,提高程序的运行效率。

4、内核进程调度队列

4.1、Linux真正是如何调度的呢?

首先已经知道了,nice值并不能让你任意的调整,而是有范围的。([-20,19] – 40个数字)

1.Linux系统中每一个CPU都有一个运行队列。
2.分时操作系统(基本公平)
进程调度是操作系统中的一个核心功能,它负责在多个进程之间分配处理器时间片,以确保这些进程能够并发执行。
进程调度程序可以被视为在可运行态进程之间分配有限的处理器时间资源的内核子系统,是像Linux这样的多任务操作系统的基础。
调度程序通过一系列算法来决定下一个应该运行的进程是哪个,这些算法会考虑多个因素,包括进程的优先级、资源占用情况以及等待时间等。
其主要目标是最大化系统资源的利用率,最小化进程的等待时间,并保证系统的高吞吐量和低延迟。
Linux的进程调度是一个复杂且精细的过程,旨在有效地管理并发执行的进程,确保它们公平且高效地共享系统资源。
Linux采用了多种调度策略和算法,如完全公平调度器(CFS)和实时调度策略(SCHED_FIFO和SCHED_RR),以及主动和被动调度方式,以应对不同场景的需求。
通过这些机制,Linux能够动态地计算进程优先级,并根据优先级和执行历史来决定下一个执行的进程,从而最大化CPU利用率并保证进程的公平执行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/804776.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自定义类型—结构体

目录 1 . 结构体类型的声明 1.1 结构的声明 1.2 结构体变量的创建与初始化 1.3 结构体的特殊声明 1.4 结构体的自引用 2. 结构体内存对齐 2.1 对齐规则 2.2 为什么存在内存对齐 2.3 修改默认对齐数 3. 结构体传参 4.结构体实现位段 4.1 位段的内存分配 4.3 位段的…

强化学习MPC——(二)

本篇主要介绍马尔科夫决策(MDP)过程,在介绍MDP之前,还需要对MP,MRP过程进行分析。 什么是马尔科夫,说白了就是带遗忘性质,下一个状态S_t1仅与当前状态有关,而与之前的状态无关。 为…

【重磅消息】2024年中国质量协会正式发布六西格玛项目报告编制要求及撰写模板

2024年,中国质量协会正式发布六西格玛系列项目报告编制要求及撰写模板(以下简称模板),模板针对项目报告的项目简介、项目背景、项目选择、项目管理、项目实施、效果总结等几个部分的内容、格式以及撰写注意事项等方面作了详细要求…

【前端捉鬼记】使用nvm切换node版本后再用node -v查看仍然是原来的版本

今天遇到一个诡异的问题,使用nvm切换node版本,明明提示已经切换成功,可是再次查看node版本还是之前的! 尝试了很多办法,比如重新打开一个cmd窗口、切换前执行nvm install version都没成功,直到找到这篇文章…

New Phytologist | 丛枝菌根真菌介导的土壤有机质动态过程的新概念框架

8月2日,中国科学院生态环境研究中心陈保冬团队等合作在著名期刊New Phytologist上发表题为"Soil organic matter dynamics mediated by arbuscular mycorrhizal fungi – an updated conceptual framework"的观点类文章,详述了丛枝菌根真菌介导…

App 测试必备 - 建议所有测试人收藏

移动端App性能测试需要关注多个方面,包括响应时间、稳定性、内存使用、CPU使用率、网络性能、电池消耗以及设备兼容性等。通过综合考虑这些方面,并在不同条件下进行全面的测试,可以确保应用程序在各种情况下都能够提供优质的用户体验&#xf…

QGIS操作:制作速率专题图

1、修改配色色带 双击打开的矢量文件,弹出如下图所示的图层属性界面,如下图所示; 点击左侧 符号化,选择色带的变化方式、符号、颜色渐变等方式; 设置每个色带所表示的数值范围,变化模式等内容&#xff1…

《深入Linux内核架构》第2章 进程管理和调度 (2)

目录 2.4 进程管理相关的系统调用 2.4.1 进程复制 2.4.2 内核线程 2.4.3 启动新程序 2.4.4 退出进程 本专栏文章将有70篇左右,欢迎关注,订阅后续文章。 2.4 进程管理相关的系统调用 2.4.1 进程复制 1. _do_fork函数 fork vfork clone都最终调用_…

逻辑卷和磁盘配额

文章目录 一、逻辑卷二、磁盘配额 一、逻辑卷 为什么会出现技术? 分区的缺点: 没有备份功能无法扩容性能取决于硬盘本身 相关概念 LVM 是 Logical Volume Manager 的简称,译为中文就是逻辑卷管理。它是 Linux 下对硬盘分区的一种管理机制。…

玩转儿童数码摄影,儿童人像摄影指南

一、资料前言 本套儿童人像摄影,大小250.91M,共有8个文件。 二、资料目录 《爱孩子爱摄影》.pdf 《六招拍儿童》.pdf 《数码摄影工坊-儿童摄影》.pdf 《专业儿童人像摄影指南》.pdf 宝贝看镜头.pdf 儿童摄影手册.pdf 儿童摄影艺术.pdf 玩转儿童…

如何通过VPN访问内网?

VPN(Virtual Private Network)是一种通过公共网络建立私有网络连接的技术,可以在不同地点的网络中建立安全通道,实现远程访问内网资源的目的。本文将介绍如何通过VPN访问内网,并介绍一款名为“天联”的VPN服务。 什么是…

C/S医学检验LIS实验室信息管理系统源码 医院LIS源码

LIS系统即实验室信息管理系统。LIS系统能实现临床检验信息化,检验科信息管理自动化。其主要功能是将检验科的实验仪器传出的检验数据经数据分析后,自动生成打印报告,通过网络存储在数据库中,使医生能够通过医生工作站方便、及时地…

拥抱智能,IT运维将有哪些变化?

Gartner数据显示,2023年AIOps在中国市场渗透率只达到目标受众的5%-20%。这一数据意味着仍有大量企业还未进行AIOps建设,未来AIOps市场前景广阔。目前,已经开始应用AIOps的企业,智能运维水平普遍还处于辅助智能化运维阶段&#xff…

Linux-线程知识点

目录 线程与进程区别pthread库接口介绍pthread_createpthread_self和syscall(SYS_gettid);pthread_equal测试主线程的栈空间大概是多大pthread_setname_nppthread_exitpthread_join为什么要连接退出的线程 pthread_detach 线程与进程区别 进程是一个动态的实体,有自…

一维前缀和与差分数组

目录 前缀和 差分数组 性质 例题: 前缀和 前缀和主要适用场景是原始数组不会被修改的情况下,频繁查询某个区间的累加和。 差分数组 性质 当我们需要更新区间[l,r]时候(仅指加减运算),我们仅仅可以只更新d[l]x,d[r1…

通信分类3G,4G,5G,通信专用名词

Generation: 2G: GSM全名为:Global System for Mobile Communications,中文为全球移动通信系统,俗称"全球通",是一种起源于欧洲的移动通信技术标准,是第二代移动通信技术 3G:WCDMA 4G&#xff1a…

VMware vSphere Hypervisor,ESXi的介绍,下载与安装

1.介绍 看这篇文章就好了 Vmware ESXi 是免费吗?一文弄懂vSphere功能特性及ESXi与vSphere到底有什么区别和联系。 - 知乎 (zhihu.com) 2.下载 这里面有7.0各个版本的下载镜像文件和校验信息 VMware-Esxi7.0各个版本镜像文件iso下载链接_esxi7.0镜像-CSDN博客 3.…

计算机网络-TCP基础、三次挥手、四次握手过程

TCP基础 定义:TCP是面向连接的、可靠的、基于字节流的传输层通信协议。这意味着在发送数据之前,TCP需要建立连接,并且它能确保数据的可靠传输。此外,TCP将数据视为无结构的连续字节流。面向连接:TCP只能一对一进行连接…

RAG文本加载和分块调研

文本加载和分块 一、文本加载 文本加载是RAG文本增强检索重要环节。文件有不同类型(excel、word、ppt、pdf、png、html、eps、gif、mp4、zip等),衍生出了很多第三方库。使用python处理文件是各种python开发岗位都需要的操作。主要涉及到的标准…

【智能算法】随机油漆优化算法(SPO)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献 1.背景 2022年,A Kaveh等人受到绘画艺术启发,提出了减法平均优化器(Stochastic Paint Optimizer,SPO)。 2.算法原理 2.1算法思想 SPO将搜索空间…