【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?

  • 知识引入
  • 初识线程
    • 1.什么叫做进程?
    • 2.什么叫做线程?
    • 3.如何看待我们之前学习的进程?
  • 理解线程
  • 创建线程函数调用
    • 1.线程一旦被创建,几乎所有资源都是被线程所共享的
    • 2.与进程之间切换相比,线程的切换
  • 初识线程总结:
    • 线程的优点
    • 线程的缺点
    • 线程异常
    • 线程用途
    • Linux进程VS线程

知识引入

如何看待地址空间和页表:

  1. 地址空间是进程能看到的资源窗口
  2. 页表决定,进程真正拥有资源的情况(页表映射多少才是拥有多少)
  3. 合理的对地址空间+页表进行资源划分,我们就可以对一个进程所有的资源进行分类

虚拟地址如何找到物理地址:
在这里插入图片描述
最后一级页表存放的是页框的起始物理地址然后通过虚拟地址后12位为页内偏移量→物理地址


初识线程

1.什么叫做进程?

在这里插入图片描述
进程组成:PCB + 地址空间 + 页表 + 物理内存映射的一部分

2.什么叫做线程?

线程:进程内的一个执行流

虚拟内存里面决定了进程能够看到的“资源”,我们将我们的代码分成一块一块的区域,我们不再像以前那样创建进程就将原进程的虚拟地址空间、页表再复制一份,而是只创建PCB指向父进程指向的位置:
在这里插入图片描述
我们首先要知道:一个进程所对应的资源是可以通过虚拟地址空间和页表将部分资源划分给不同的PCB中的,因为我们可以通过虚拟地址空间+页表方式对进程进行资源划分,单个“进程”执行力度,一定要比之前的进程要细

思考:
如果OS真的要专门设计“线程”概念,OS要不要管理这个线程呢?
 肯定是需要的,方法还是:先描述,在组织。在windows中为线程设计专门的数据结构表示线程对象TCB,而在Linux中单纯从线程调度角度,线程和进程有很多的地方是重叠的!所以,我们的Linux工程师,不想给Linux"线程"专门设计对应的数据结构!而是直接复用PCB
 用PCB用来表示Linux内部的"线程"。而对于CPU来说,它并不关心你的PCB是表示进程还是线程,它只关心task_struct(PCB)

线程在进程内部运行,线程在进程的地址空间内运行,拥有该进程的一部分资源!

3.如何看待我们之前学习的进程?

在这里插入图片描述
进程:一堆的PCB + 地址空间 + 页表 + 对应的物理地址

之前的进程:承担系统资源的基本实体,只不过内部只有一个执行流,一个进程内部可以有多个执行流

站在CPU的角度看待task_struct:以前:进程—现在:进程内的一个分支
CPU很笨,它不会区分,它只需要拿来就能用就行。

Linux下统称task_struct:轻量级进程

小总结:

  1. Linux内核中有没有真正意义的线程呢?没有。Linux是用进程PCB来模拟线程的,是一种完全属于自己的一套线程方案
  2. 站在CPU的视角,每一个PCB,都可以称之为叫做轻量级进程
  3. Linux线程是CPU调度的基本单位,而进程是承担分配系统资源的基本单位
  4. 进程用来整体申请资源,线程用来伸手向进程要资源。(比如公司、小组、组员关系,小组向公司申请资金,组员向小组长拿钱)
  5. Linux中没有真正意义的线程
  6. 好处是什么?简单,维护成本大大降低–可靠高效!
    我们使用PCB来模拟线程,那么我们曾经给PCB创建的一整套的数据结构与算法都可以复用。而且线程与进程有很多地方是重叠的,这也给我们重新创建线程方法的编码难度大大提高,更为复杂的代码,带来的就是维护成本的增高

OS只认线程,用户(程序员)也只认线程
Linux无法直接提供创建线程的系统调用接口,而只能给我提供创建轻量级进程的接口


理解线程

我们将
 家庭比作进程
 家庭成员比作线程
 (家庭成员)你的爸爸妈妈努力工作是为了生活更美好,你的爷爷奶奶每天锻炼跳广场舞是为了身体健康,你每天努力学习是为了未来有更好的生活,(家庭)所有人的目的都是为了这个家更美好。家庭与家庭成员关系类比也就是进程与线程的关系


创建线程函数调用

在这里插入图片描述
函数原型:(具体可看下一章 线程控制)

int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine) (void *), void *arg);

创建线程参考:

#include <iostream>
#include <cstdio>
#include <cassert>
#include <pthread.h>
#include <unistd.h>
using namespace std;
// 新线程
void *thread_routine(void *args)
{while (true){cout << "我是新线程, 我正在运行!" << endl;sleep(1);}
}int main()
{// typedef unsigned long int pthread_t;pthread_t tid;int n = pthread_create(&tid, nullptr, thread_routine, (void *)"thread one");assert(0 == n);(void)n;while (true){// 地址 -> ?cout << "我是主线程, 我正在运行!" << endl;sleep(1);}return 0;
}

直接运行的结果:
在这里插入图片描述
错误:对“pthread create”的未定义引用
原因:这个函数并不是OS提供给我们的系统调用,Linux没有真正意义上的线程,只有轻量级进程,所以Linux只能提供轻量级进程的接口,无法给我们直接创建线程。而这个函数是第三方库提供给我们的,不是语言提供的也不是OS提供的,这个库是:

Compile and link with -pthread.

当然这个库大概率是在系统之中已经有的,为了使用这个第三方库,我们编译时需要找到这个库 -lpthread

g++ -o mythread mythread.cc -lpthread -std=c++11

在这里插入图片描述
在这里插入图片描述

代码执行结果:
在这里插入图片描述
很明显有两个执行流在一起运行,但是:
在这里插入图片描述
在这里插入图片描述
如何看到这两个执行流信息呢?

ps -aL

在这里插入图片描述
在这里插入图片描述
LWP:light weight process 轻量级进程ID
两个线程的PID都是相同的,主线程PIDLWP相同的那个

CPU调度的时候,是以哪一个id为标识符表示特定一个执行流的呢? LWP
当我们只有一个执行流的时候,PID与LWP是相同的,在这种情况下使用PID标识或LWP标识都可以

在这里插入图片描述

1.线程一旦被创建,几乎所有资源都是被线程所共享的

int g_val = 0;
// 新线程
void *thread_routine(void *args)
{const char *name = (const char *)args;while (true){cout << "我是新线程, 我正在运行!" << " : " << g_val++ << " &g_val : " << &g_val << endl;sleep(1);}
}
int main()
{typedef unsigned long int pthread_t;pthread_t tid;int n = pthread_create(&tid, nullptr, thread_routine, (void *)"thread one");assert(0 == n);(void)n;while (true){cout << "我是主线程, 我正在运行!"<< " : " << g_val << " &g_val : " << &g_val << endl;sleep(1);}return 0;
}

在这里插入图片描述

线程也一定要有自己私有的资源,什么资源应该是线程私有的呢?

  1. PCB属性私有
  2. 要有一定私有上下文结构
  3. 每一个线程都要有自己独立的栈结构-

2.与进程之间切换相比,线程的切换

  • 进程:切换页表&&虚拟地址空间&&切换PCB &&上下文切换
  • 线程:切换PCB &&上下文切换
  • 线程切换cache不用太更新,但是进程切换,全部更新
    cache:高速缓冲存储器,比CPU的寄存器慢些,但是比内存块
    软件存在一种属性叫做局部性原理,当前访问的代码和数据那么它相邻的代码和数据也非常容易被访问到。
    在这里插入图片描述
     当多个线程切换时,这些热点数据本来就是被线程所共享的,线程切换时,cache不用被切换。因为这部分数据,线程PCB再怎么切换可能之前缓存的数据还是能用得上,能命中,所以缓存根本不用切换。(热点数据就是经常被访问到的数据)
     如果是进程切换,A进程代码和数据保存一大堆,切换到B进程时,上下文一保存,那么之前cache里的缓存数据都失效,新进程B需要重新加载到cache,切换到旧进程A,又要重新加载,来回切换增加了很多成本与效率。


初识线程总结:

进程 VS 线程
Linux进程是申请资源的基本单位,而线程是进程里面的一个小执行流,是CPU调度的基本单位。下图整个框里面是进程,而线程是绿色的PCB执行流
在这里插入图片描述

线程的优点

  • 创建一个新线程的代价要比创建一个新进程小得多
  • 与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多
  • 线程占用的资源要比进程少很多
  • 能充分利用多处理器的可并行数量
  • 在等待慢速I/O操作结束的同时,程序可执行其他的计算任务
  • 计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现
  • I/O密集型应用,为了提高性能,将I/O操作重叠。线程可以同时等待不同的I/O操作。

计算密集型应用(CPU,加密,解密,算法等) VS I/O密集型应用(外设,访问磁盘,显示器,网络)

线程的缺点

  • 性能损失
    一个很少被外部事件阻塞的计算密集型线程往往无法与共它线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指的是增加了额外的同步和调度开销,而可用的资源不变。

  • 健壮性降低
    编写多线程需要更全面更深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的,换句话说线程之间是缺乏保护的。
    在这里插入图片描述
     为什么一个线程出问题会影响其余线程?进程信号,信号是整体发给进程的,它会向PID相同的执行流全部写入出错信号。
     线程出异常本身就是进程出异常,比如小组里面的成员删库跑路,公司问责不仅仅要问责这个成员,还需要问责整个小组。一个线程出异常导致整个进程的资源都被释放掉,那么其余的线程赖以生存的资源已经没了,所以也就只能释放

  • 缺乏访问控制
    进程是访问控制的基本粒度,在一个线程中调用某些OS函数会对整个进程造成影响。

  • 编程难度提高
    编写与调试一个多线程程序比单线程程序困难得多

线程异常

  • 单个线程如果出现除零,野指针问题导致线程崩溃,进程也会随着崩溃
  • 线程是进程的执行分支,线程出异常,就类似进程出异常,进而触发信号机制,终止进程,进程终止,该进程内的所有线程也就随即退出

线程用途

  • 合理的使用多线程,能提高CPU密集型程序的执行效率
  • 合理的使用多线程,能提高IO密集型程序的用户体验(如生活中我们一边写代码一边下载开发工具,就是多线程运行的一种表现)

Linux进程VS线程

进程和线程比较:

  • 进程是资源分配的基本单位
  • 线程是调度的基本单位
  • 线程共享进程数据,但也拥有自己的一部分数据,比如:
    1.线程ID
    2.一组寄存器
    3.栈
    4.errno
    5.信号屏蔽字
    6.调度优先级

在这里插入图片描述

线程的共享:
进程的多个线程共享同一地址空间,因此Text Segment、Data Segment都是共享的,如果定义一个函数,在各线程中都可以调用,如果定义一个全局变量,在各线程中都可以访问到,除此之外,各线程还共享以下进程资源和环境:

  • 文件描述符表
  • 每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)
  • 当前工作目录
  • 用户id和组id

如有错误或者不清楚的地方欢迎私信或者评论指出🚀🚀

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/5781.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用 Docker 快速上手中文版 LLaMA2 开源大模型

本篇文章&#xff0c;我们聊聊如何使用 Docker 容器快速上手朋友团队出品的中文版 LLaMA2 开源大模型&#xff0c;国内第一个真正开源&#xff0c;可以运行、下载、私有部署&#xff0c;并且支持商业使用。 写在前面 感慨于昨天 Meta LLaMA2 模型开放下载之后&#xff0c;Git…

操作系统练习:进程间通信(共享内存方式)

说明 本文是《操作系统概念(第九版)》3.4节“进程间通信”的练习。 进程间通信主要由两种模型&#xff1a; 共享内存消息传递 本文使用共享内存的方式实现进程间的通信 创建消息生产者 创建生产者的主要操作包括&#xff1a; 定义共享内存的大小、名称&#xff0c;以及通…

netty知识集锦2

粘包半包 粘包半包解决方案&#xff0c; 1短链接&#xff0c;它的消息边界是从链接建立到链接断开 2.定长解码器&#xff1a;服务器端选最大长度的消息作为定长&#xff0c;客户端不足补齐&#xff0c;缺点造成浪费 netty协议设计与解析 Message编码解码

AWS IAM介绍

前言 AWS是世界上最大的云服务提供商&#xff0c;它提供了很多组件供消费者使用&#xff0c;其中进行访问控制的组件叫做IAM(Identity and Access Management)&#xff0c; 用来进行身份验证和对AWS资源的访问控制。 功能 IAM的功能总结来看&#xff0c;主要分两种&#xff1…

《零基础入门学习Python》第060讲:论一只爬虫的自我修养8:正则表达式4

有了前面几节课的准备&#xff0c;我们这一次终于可以真刀真枪的干一场大的了&#xff0c;但是呢&#xff0c;在进行实战之前&#xff0c;我们还要讲讲正则表达式的实用方法和扩展语法&#xff0c;然后再来实战&#xff0c;大家多把持一会啊。 我们先来翻一下文档&#xff1a;…

openGauss学习笔记-17 openGauss 简单数据管理-表达式

文章目录 openGauss学习笔记-17 openGauss 简单数据管理-表达式17.1 简单表达式17.2 条件表达式17.3 子查询表达式17.4 数组表达式17.5 行表达式 openGauss学习笔记-17 openGauss 简单数据管理-表达式 表达式类似一个公式&#xff0c;我们可以将其应用在查询语句中&#xff0c…

25 MFC 数据库

文章目录 导入ADO库 导入ADO库 #import "C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","rsEOF")void CADODlg::OnBnClickedBtnQuery() {//导入ADO库::CoInitialize(NULL);//初始化COM库_ConnectionPtr pCo…

《面试1v1》如何提高远程用户的吞吐量

&#x1f345; 作者简介&#xff1a;王哥&#xff0c;CSDN2022博客总榜Top100&#x1f3c6;、博客专家&#x1f4aa; &#x1f345; 技术交流&#xff1a;定期更新Java硬核干货&#xff0c;不定期送书活动 &#x1f345; 王哥多年工作总结&#xff1a;Java学习路线总结&#xf…

Flutter动画库:animations(路由过渡动画或者页面切换动画)

animations animations 是一个 Flutter 库&#xff0c;它提供了一组用于创建动画效果的工具和组件。这个库的核心重点是路由过渡动画或者页面切换动画 地址 https://pub-web.flutter-io.cn/packages/animations 安装 flutter pub add animations看了下官方文档和官方例子&a…

计科web常见错误排错【HTTP状态404、导航栏无法点开、字符乱码及前后端数据传输呈现、jsp填写的数据传到数据库显示null、HTTP状态500】

web排错记录 在使用javaweb的过程中会出现的一些错误请在下方目录查找。 目录 错误1&#xff1a;HTTP状态404——未找到 错误2&#xff1a;导航栏下拉菜单无法点开的问题 错误3&#xff1a;字符乱码问题 错误4&#xff1a;jsp网页全部都是&#xff1f;&#xff1f;&#x…

【单片机】MSP430F149单片机,晨启,音乐播放器,蜂鸣器音乐

四、音乐播放器 任务要求&#xff1a; 设计制作一个简易音乐播放器&#xff08;通过手柄板上的蜂鸣器发声&#xff0c;播放2到4首音 乐&#xff09;&#xff0c;同时LED模块闪烁&#xff0c;给人视、听觉美的感受。 评分细则&#xff1a; 按下播放按键P15开始播放音乐&#x…

【C++】继承基础知识及简单应用,使用reportSingleClassLayout(在Visual Studio开发人员命令提示窗口)查看派生类详细信息

author&#xff1a;&Carlton tag&#xff1a;C topic&#xff1a;【C】继承基础知识及简单应用&#xff0c;使用reportSingleClassLayout&#xff08;在Visual Studio开发人员命令提示窗口&#xff09;查看派生类详细信息 website&#xff1a;黑马程序员C date&#xf…

微信小程序原生上传图片和预览+云函数上传

1.前台页面 1.1wxml问阿金 <!-- 说明一个上传页面的按钮 --> <button type"primary" bindtap"uploadPage">上传页面展示</button> <!-- 声明一个上传服务器的按钮 --> <button type"warn" bindtap"uploadSeve…

第四讲:MySQL中DDL一些基本数据类型及表的创建、查询

目录 1、创建表:2、DDL一些基本数据类型&#xff1a; 1、创建表: 部分单词及解析&#xff1a; 1、tables:表 2、comment:评论&#xff0c;解释 3、gender:性别 4、neighbor&#xff1a;邻居 1、创建表&#xff1a;&#xff08;注&#xff1a;在自定义数据库操作&#xff0c;…

spring中bean实例化的三种方式 -- Spring入门(二)

文章目录 前言1.Bean实例化简介2.bean的实例化 -- 构造方法3.bean的实例化 -- 静态工厂实例化4.bean实例化 -- 实例工厂和FactoryBean5.三种bean实例化方式的区别 总结 前言 为了巩固所学的知识&#xff0c;作者尝试着开始发布一些学习笔记类的博客&#xff0c;方便日后回顾。…

Leetcode 112. 路径总和

题目链接&#xff1a;https://leetcode.cn/problems/path-sum/description/ 思路 递归&#xff0c;先序遍历二叉树&#xff0c;每遍历一个节点便减去当前存储值&#xff08;targetSum targetSum - root.val&#xff09;&#xff1b;当到达某个节点等于targetSum (targetSum…

labview 子画面插入面板

1.前言 在前面一篇文章中描述了弹框式显示子画面&#xff0c; labview 弹窗(子vi)_weixin_39926429的博客-CSDN博客 本文介绍插入式显示子画面。 本文的主题在以前的文章中介绍过&#xff0c; labview 插入子面板_labview插入子面板_weixin_39926429的博客-CSDN博客 借用…

机器学习算法分类

机器学习根据任务的不同&#xff0c;可以分为监督学习、无监督学习、半监督学习、强化学习。 1. 无监督学习 训练数据不包含任何类别信息。无监督学习里典型例子是聚类。要解决的问题是聚类问题和降维问题&#xff0c;聚类算法利用样本的特征&#xff0c;将具有相似特征的样本…

微服务 云原生:搭建 K8S 集群

为节约时间和成本&#xff0c;仅供学习使用&#xff0c;直接在两台虚拟机上模拟 K8S 集群搭建 踩坑之旅 系统环境&#xff1a;CentOS-7-x86_64-Minimal-2009 镜像&#xff0c;为方便起见&#xff0c;直接在 root 账户下操作&#xff0c;现实情况最好不要这样做。 基础准备 关…

React18和React16合成事件原理(附图)

&#x1f4a1; React18合成事件的处理原理 “绝对不是”给当前元素基于addEventListener做的事件绑定&#xff0c;React中的合成事件&#xff0c;都是基于“事件委托”处理的&#xff01; 在React17及以后版本&#xff0c;都是委托给#root这个容器&#xff08;捕获和冒泡都做了…