操作系统:线程

目录

前言: 

1.线程

1.1.初识线程

1.2.“轻量化”进程

1.3.线程与进程

2.线程控制 

2.1.pthread原生线程库

2.2.线程控制的接口 

2.2.1.线程创建

2.2.线程退出|线程等待|线程分离|线程取消

2.3.pthread库的原理

2.4.语言和pthread库的关系

2.5.线程局部存储


前言: 

在前面的学习中,我们知道进程是一种处理任务的执行流,操作系统中的大部分任务都由进程来处理,而进程的创建,需要开辟内存来产生进程PCB、进程虚拟地址空间、页表……,而这个进程的创建成本较大,于是操作系统实现了另一种执行流------线程。

  1. 线程是比进程更加轻量化的一种执行流,线程是进程内部的一种执行流。
  2. 线程是CPU调度的基本单位,进程是承担系统资源的实体。

那么我们大概就能猜到:进程是线程的载体,操作系统增加了线程这个新的执行流后,进程的角色变为了在系统中创建、获取资源,用来供给线程执行流,实现CPU对线程的不断调度,即:进程是线程的宏观体现?带着这个猜测,我们开始进入线程的学习……

1.线程

1.1.初识线程

在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程是“一个进程内部的控制序列”

我们在以往的博客中,把进程当做一个执行流来看待,是因为我们在进程中只有一条单一的执行流,当我们在某个进程中创建新的线程之后,就出现了“主线程”和“新线程”,那么这里我们就知道了进程是通过线程来作为执行流的。 

一言以蔽之:对于Linux而言,进程是一个资源的结合体,而线程就是通过这些资源来完成任务的一个个执行流。

比如:有一家大公司,干活的肯定不是大公司,而是公司里的各个部门中的打工人,公司这个进程提供的就是给线程的资源,给线程一个好的平台、环境去发挥。


1.2.“轻量化”进程

在操作系统中,虽然为了解决进程过于笨重的问题,引入了线程的概念,但是线程和进程一样都是一个需要描述的结构,那么进程用process control block(PCB)来描述,那么线程是不是也同样需要TCB这一个数据结构来进行描述呢?

答案:线程也是需要通过数据结构,进行“先描述再组织”的,但是我们实现这个结构可以通过两个方向:1.创建新的TCB体系,实现一份类似于PCB的体系。2.复用当前PCB体系。

对于Windows而言,实现了一个Thread的体系。而Linux则是在PCB的基础上,将线程抽象成“轻量化进程”这个概念,接着复用当前PCB体系……(这里也体现了tast_stuct不完全等于PCB)

如图:对应我们上面所述------Linux对线程的实现是抽象成“轻量化”进程,这是怎么理解的呢?

  1. 首先进程拥有它的内核数据结构、代码和数据,所以在空间中需要开辟较多资源来存储
  2. “轻量化”体现在于,Linux创建新的线程时,只创建一份新的task_struct,和部分的代码和资源,这样子就能够减少资源的开辟
  3. 我们说是创建了新的task_struct,但是实际上这些创建的“轻量化”进程共用着原进程的资源,也就是线程他们是可以访问同一个进程内的数据的。

除了上面的几点,线程的轻量化也体现在CPU的调度上……这里我们需要重点讲解!!!

我们知道:在进程间转换时,CPU在调度不同的进程时需要进行进程相关的上下文切换,以及页表、进程地址空间相关的寄存器内数据的切换……

而线程中的切换,因为访问的是同一个进程的资源,所以大部分的寄存器内容不用修改,这样子线程在CPU切换和调度就显得轻量化了。

实际上:CPU内会维护一块cache缓存,一般情况下CPU是从内存直接读取进程的数据并加载到CPU中,而为了减少IO提高系统效率,所以CPU会将进程的部分代码和数据提前读取进cache中,这部分预加载的代码和数据符合局部性原理。而进程切换,这一块缓存中保存的热数据也需要切换。线程切换并不需要切换cache

面试题:线程切换为什么效率高?

  1. 切换的寄存器少
  2. 不需要重新更新cache缓存 

1.3.线程与进程

  1. 进程是资源分配的基本单位,对于线程而言,进程是线程的载体,给线程提供资源。
  2. 线程是调度的基本单位,宏观上是进程被调度,其实在CPU中是通过线程(LWP)来进行任务的调度的
  3. 线程共享进程数据,但也拥有自己的一部分数据。

对于第三点,因为线程需要被CPU进行调度,处于多线程时,就需要保存当前线程的上下文(类似进程切换),所以线程会维护一份寄存器的结构体数据。并且因为线程会进行函数的跳转,所以内部也需要一个函数栈结构。另外,线程也维护着优先级、线程id等数据……

如图:即为进程与线程的关系,这就回应了我们在前言中的猜测“进程其实就是线程的载体,进程是线程的宏观体现”。

更加详细的进程与线程的关系:线程与进程,你真得理解了吗_进程和线程的区别-CSDN博客 

2.线程控制 

2.1.pthread原生线程库

在LInux中并没有实现线程这一个模块,而是通过轻量化进程来模拟线程,所以Linux操作系统只提供了“轻量化进程”的系统调用,并没有之间创建线程的接口。因此为了适配不同的开发需求,Linux实现了原生的pthread原生线程库,来实现用户级和系统的轻量化进程的适配,也就是实现了类似于上层C++、Java等面向对象语言的线程!

本质上就是:Linux封装了一层,通过内核中的轻量化进程和Pthread库实现了线程,而不是直接就创建线程这个模块,实现Linux操作系统适配多线程! 

如图即为:Linux自带的pthread库,所以我们在使用pthread库时,需要连接这个库!!! 


2.2.线程控制的接口 

2.2.1.线程创建

// 函数原型为pthread_create()
参数分别为:线程tid,栈的地址,调用函数指针,传入参数类型pthread_create(pthread_t *thread, const pthread_attr_t *attr, void * (*start_routine)(void*), void *arg);

对于进程创建我们需要注意的是:我们需要提前设置tid然后传入,并且传入参数为void*,表示可以传入多种类型的参数,可以是int、string、甚至是自定义的对象!

最基本的进程创建的使用: 

void *ThreadTest1(void *arg)
{const char *threadName = (const char *)arg;while (1){cout << "i am a new thread, mypid is: " << getpid() << ", my name is:" << threadName << endl;sleep(1);cout << endl;};
}
// 线程创建
int main()
{// 在main这个进程(主线程)中创建一个新线程pthread_t tid;// 创建完线程后线程跳转进程ThreadTest函数中pthread_create(&tid, nullptr, ThreadTest1, (void *)"Thread one");// 主线程while (1){cout << "my name is Thread main, my pid is: " << getpid() << endl;sleep(1);cout << endl;}
}

 这段代码中我们实现了:两个循环体循环打印各自的内容,这也表示了我们创建了新的执行流,并且他们的进程pid是一致的!

进程创建传入对象参数:

typedef function<void()> func_t;class ThreadData
{
public:ThreadData(const string &name, const uint64_t &ctime, func_t f): thread_name(name), creat_time(ctime), func(f){}string GetName() const { return thread_name; }uint64_t GetTime() const { return creat_time; }func_t GetFunc() const { return func; }private:string thread_name;uint64_t creat_time;func_t func;
};
void Print()
{cout << "only print……" << endl;
}
void *ThreadTest2(void *arg)
{ThreadData *td = (ThreadData *)arg;while (1){cout << "当前线程名为:" << td->GetName() << ",创建时间为:" << td->GetTime() << endl;(td->GetFunc())();sleep(1);}
}
// 线程函数是可以传对象作为参数的
int main()
{pthread_t tid;ThreadData *td = new ThreadData("Thread one", (uint64_t)time(nullptr), Print);// 可以传入任意类型的参数pthread_create(&tid, nullptr, ThreadTest2, td);// 主线程while (1){cout << "my name is Thread main, my pid is: " << getpid() << endl;sleep(3);cout << endl;}
}

 这段代码的核心和上一个一致,不过这里传入的参数是TreadData这个类的对象,并且在我们给线程完成任务的函数区ThreadTest2中,我们可以接收这个对象并且对这个对象进行操作……实际开发中,线程主要也是通过对传入对象进行操作来实现各种需求的处理的!

2.2.线程退出|线程等待|线程分离|线程取消

线程退出的方式:1.调用的函数完成当前的函数模块,这时会返回nullptr,线程退出。2.通过线程退出函数来实现。另外线程退出不能通过exit函数,exit函数会导致整个进程退出……

// 线程退出函数,填入返回的内容(注意不能返回临时变量)
pthread_exit(void *value_ptr);
// 线程等待函数,传入线程tid,接收的返回值
pthread_join(pthread_t thread, void **value_ptr);

跟进程退出类似,线程退出时也需要主线程进行等待,这里等待的内容主要是“子线程的返回内容”

// 1.不需要返回值!// ThreadFunc中
pthread_exit(nullptr);// main中
pthread_join(tid, nullptr);// 2.需要接收返回值// ThreadFunc中
pthread_exit((void*)"hello thread");    // 返回值为hello world// main中
void *ret = nullptr;
pthread_join(tid, &ret);    // 通过指针来接收这个返回值,原理涉及二级指针

 这里对应着线程等待的两种情况,一旦我们使用了pthread_join那么主线程就会进入阻塞等待。而在第一种情况中并不需要我们进行返回值的接收,这时的等待是不必要的!

因此pthread库中实现了线程分离的接口,这个接口主要是适配当我们不需要关心子线程返回值时,又不想对子线程进行等待,我们可以直接分离这个线程,

// 线程是可以设置为分离状态,主线程不用对新线程进行等待
// 可以是主线程对子线程进行分离
// 在main中分离线程
pthread_detach(tid);// 不过大部分情况下,我们一般在子进程自己的函数块中分离线程
// 也可子线程对自己进行分离,但是写在这里最好
pthread_detach(pthread_self());

 而线程取消接口主要是正常终止掉我们创建的某个线程

// 线程是可以取消的---相当于之间终止该线程
pthread_cancel(tid);// cancle后通过pthread_join接收该进程的返回值,会返回-1

2.3.pthread库的原理

在Linux操作系统中,并没有线程的概念。我们这里所讲的线程是用户级线程,是通过pthread库来实现的。所以我们在用户层需要对线程进行管理,在Pthread库中我们也需要定义struct TCB这一个结构,来实现先描述再组织!

既然要实现线程控制块,那么我们就需要定义“栈空间”和“寄存器”这些独立的属性,寄存器模块pthread库可以复用进程中维护的寄存器模块,但是栈空间这个模块我们该如何抽象并实现呢? 

背景:首先对于单个进程,只有一个地址空间也就只能开辟出一块栈空间,那么从进程中获取栈空间显然是不合理的。所以我们通过进程来实现线程的栈空间这个方向是无法实现的,我们在之前的学习中,对于用户级别的缓冲区,本身也是一块空间,而这块缓冲区的实现是通过C库的,那么我们也可以通过pthread库来实现这一块栈空间。

clone(int (*child_func)(void *),     // 调用的函数void *child_stack,        // 开辟的栈空间int flags,                // 创建方式void *arg, ...            // 传入参数/* pid_t *ptid, struct user_desc *tls, pid_t *ctid */ );

这个接口是Linux操作系统实现线程的底层系统调用,也是pthread_create的底层实现,因此我们知道通过库来实现这个栈空间是可行的! 

我们知道动态库是需要加载进物理内存,并且映射进地址空间,当我们创建一个新线程,就可以把维护的栈空间加载进内存中, 而进程原本的栈空间就是主线程的空间了。


并且当我们动态库加载进物理内存后,而库本身就是pthread实现的代码,当我们在创建线程时,我们从正文代码段跳转到动态库中,运行线程的创建“代码”,那么我们进行线程的管理也是通过动态库的资源(代码)即:进程读取映射进进程地址空间内的动态库的代码,创建数据结构

这时我们也明白了,为什么线程的pthread_t和Linux中的LWP在数值上并不相等!前者是库级别的概念,后者是操作系统的概念。 

2.4.语言和pthread库的关系

我们上面讲述了Linux环境下pthread的实现原理,那么对于C++、Java语言他们内置实现的多线程模块,有什么关系呢。这里我们以c++的thread为例

#include<iostream>
#include<thread>
#include<unistd.h>
#include<cstdlib>using namespace std;void ThreadFunc()
{while(1){cout<< "i am a thread from C++" <<endl;sleep(1);}
}int main()
{thread t(ThreadFunc);t.join();
}

接着我们在Linux环境中编译这个文件: 

  1. 当我们第一次编译并运行时(即为绿框内容),我们发现程序无法运行,并且报错为:程序运行在一个不支持多线程或者多线程被禁用的环境中。但是我们明明包括了C++中提供的线程库!
  2. 但是当我们链接上了Linux提供的动态库时,这个程序又可以正常运行!

 看到这里大家应该明白了:纯C++的接口创造线程时,也是需要Linux的pthread库,本质上就是C++的标准就是对pthread库的封装!即不同的语言实现多线程的本质就是对不同系统实现的多线程的实现进行封装!比如我们在STL容器中实现的Swap函数,内部是通过封装std中swap函数来实现的!这样就实现了语言代码的可移植性!

2.5.线程局部存储

我们在2.3.中的图看到了线程的属性集中维护了一个线程的局部存储模块,这个模块的作用是,设定同一个变量能给不同的线程维护一个各自独立的值。

int g_val = 100;
__thread int t_val = 0;
void *ThreadFunc(void *arg)
{while (1){g_val += 10;t_val--;cout << "new thread g_val = " << g_val << ", t_val = " << t_val << endl;sleep(2);}
}
// 线程的局部存储
void test7()
{pthread_t tid;pthread_create(&tid, nullptr, ThreadFunc, (void*)nullptr);while(1){t_val++;g_val = 0;cout << "main thread g_val = " << g_val << ", t_val = " << t_val << endl;sleep(2);cout<<endl;}
}

这段代码中我们定义了一个全局变量g_val和对于线程的__thread的t_val,然后我们各自对g_val和t_val进行修改

通过程序的运行结果:我们发现g_val用的是同一块空间,而t_val用的是不同的空间,那么由于__thread这个关键字,编译器编译时会把这个变量分别加载到线程的局部存储区,也就是同一个变量,在不同的空间维护着,不同的线程可以有独立的t_val,这也就是线程LWP的实现原理……


  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/5722.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据可视化宝典:Matplotlib图形实战

在数据分析领域&#xff0c;图形化展示数据是非常重要的环节。Python中的matplotlib库是绘制各类图形的强大工具。本文将介绍如何使用matplotlib绘制折线图、直方图、饼图、散点图和柱状图等数据分析中常见的图形&#xff0c;并附上相应的代码示例&#xff0c;可以当初matplotl…

模型智能体开发之metagpt-单智能体实践

需求分析 根据诉求完成函数代码的编写&#xff0c;并实现测试case&#xff0c;输出代码 代码实现 定义写代码的action action是动作的逻辑抽象&#xff0c;通过将预设的prompt传入llm&#xff0c;来获取输出&#xff0c;并对输出进行格式化 具体的实现如下 定义prompt模版 …

神经网络与深度学习--网络优化与正则化

文章目录 前言一、网络优化1.1网络结构多样性1.2高维变量的非凸优化1.鞍点2.平坦最小值3.局部最小解的等价性 1.3.改善方法 二、优化算法2.1小批量梯度下降法&#xff08;Min-Batch&#xff09;2.2批量大小选择2.3学习率调整1.学习率衰减&#xff08;学习率退火&#xff09;分段…

Android数据恢复软件快速比较:Android数据恢复的7最佳工具

您在 Android 设备上保留哪些类型的数据&#xff1f;如果您和大多数人一样&#xff0c;那么您可能已经列出了文档、照片、视频和音频文件。如果您使用智能手机或平板电脑的时间足够长&#xff0c;我们愿意打赌您拥有Android数据丢失的第一手经验。 幸运的是&#xff0c;我们也…

打破失联困境:门店如何利用AI智能名片B2B2C商城小程序重构与消费者的紧密连接?

在如今这个消费者行为日益碎片化的时代&#xff0c;门店经营者们时常感叹&#xff1a;消费者进店如同一场不期而遇的缘分&#xff0c;然而一旦离开门店&#xff0c;就仿佛消失在茫茫人海中&#xff0c;难以再觅其踪迹。这种“进店靠缘分&#xff0c;离店就失联”的困境&#xf…

Cisco IOS XE Web UI 权限提升漏洞复现(CVE-2023-20198)

0x01 产品简介 Web UI 是一种基于GUI的嵌入式系统管理工具,能够提供系统配置、简化系统部署和可管理性以及增强用户体验。它带有默认映像,因此无需在系统上启用任何内容或安装任何许可证。Web UI 可用于构建配置以及监控系统和排除系统故障,而无需CLI专业知识。 0x02 漏洞…

Codeforces Round 941 (Div. 2) D. Missing Subsequence Sum

题目 思路&#xff1a; #include <bits/stdc.h> using namespace std; #define int long long #define pb push_back #define fi first #define se second #define lson p << 1 #define rson p << 1 | 1 const int maxn 1e6 5, inf 1e18, maxm 4e4 5; c…

翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习三

合集 ChatGPT 通过图形化的方式来理解 Transformer 架构 翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习一翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习二翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深…

java-spring-mvc(服务端接收客户端传参)

目录 &#x1f3af; 服务端接收参数 ✨HttpServletRequest接收 ✨ 声明参数接收 ✨声明pojo类来接收 &#x1f52a;小试牛刀 &#x1f3af; 服务端接收参数 ✨HttpServletRequest接收 HttpServletRequest是Java Servlet规范中定义的一个接口&#xff0c;它提供了与HTTP请求…

解决Redis的键值前出现类似\xAC\xED\x00\x05t\x00*这样的字符序列

文章目录 1.问题2.解决方法3.StringRedisTemplate和RedisTemplate的区别 1.问题 在使用RedisTemplate对Redis进行操作时,发现Reids键值对前有\xAC\xED\x00\x05t\x00*这样的字符序列 如图所示: 虽说不影响使用,但是听影响观感的 2.解决方法 查找了很多方法,可以指定RedisTem…

用户中心(下)

文章目录 计划登录逻辑接口简单说明cookie和session写代码流程后端逻辑层控制层测试用户管理接口 前端简化代码对接后端代理 计划 开发完成后端登录功能 &#xff08;单机登录 > 后续改造为分布式 / 第三方登录&#xff09;✔开发后端用户的管理接口 &#xff08;用户的查询…

基于EO平衡优化器算法的目标函数最优值求解matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 5.完整程序 1.程序功能描述 基于EO平衡优化器算法的目标函数最优值求解matlab仿真。提供九个测试函数&#xff0c;分别对九个测试函数仿真输出最优解以及对应的优化收敛曲线。 2.测试软件版…

树莓派点亮LED灯

简介 使用GPIO Zero library 的 Python库实现点亮LED灯。接线 树莓派引脚参考图如下&#xff1a; LED正极 接GPIO17 LED负极 接GND 权限 将你的用户加到gpio组中&#xff0c; 否则无法控制GPIO sudo usermod -a -G gpio 代码 from gpiozero import LED from time impor…

ES全文检索支持拼音和繁简检索

ES全文检索支持拼音和繁简检索 1. 实现目标2. 引入pinyin插件2.1 编译 elasticsearch-analysis-pinyin 插件2.2 安装拼音插件 3. 引入ik分词器插件3.1 已有作者编译后的包文件3.2 只有源代码的版本3.3 安装ik分词插件 4. 建立es索引5.测试检索6. 繁简转换 1. 实现目标 ES检索时…

Springboot+Vue+小程序+基于微信小程序护农远程看护系统

开发平台为idea&#xff0c;maven管理工具&#xff0c;Mybatis操作数据库&#xff0c;根据市场数字化需要为农户打造小程序可远程查看农场的种植情况。项目是调试&#xff0c;讲解服务均可有偿获取&#xff0c;需要可在最下方QQ二维码处联系我。 SpringbootVue小程序&#xff…

【UE5】数字人基础

这里主要记录一下自己在实现数字人得过程中涉及导XSens惯性动捕&#xff0c;视频动捕&#xff0c;LiveLinkFace表捕&#xff0c;GRoom物理头发等。 一、导入骨骼网格体 骨骼网格体即模型要在模型雕刻阶段就要雕刻好表捕所需的表情体(blendshape)&#xff0c;后面表捕的效果直…

API安全

一&#xff0c;什么是API API指的是应用程序编程接口&#xff08;Application Programming Interface&#xff09;&#xff0c;是一组定义了软件组件如何相互交互的规范。通过API&#xff0c;不同的软件可以相互通信和交换数据&#xff0c;实现不同软件之间的集成和互操作。 …

代码随想录算法训练营DAY45|C++动态规划Part7|70.爬楼梯(进阶版)、322. 零钱兑换、279.完全平方数

文章目录 70.爬楼梯&#xff08;进阶版&#xff09;322. 零钱兑换思路CPP代码 279.完全平方数思路CPP代码 70.爬楼梯&#xff08;进阶版&#xff09; 卡码网&#xff1a;57. 爬楼梯 文章讲解&#xff1a;70.爬楼梯(进阶版) 322. 零钱兑换 力扣题目链接 文章讲解&#xff1a;322…

llama_index微调BGE模型

微调模型是为了让模型在特殊领域表现良好,帮助其学习到专业术语等。 本文采用llama_index框架微调BGE模型,跑通整个流程,并学习模型微调的方法。 一、环境准备 Linux环境,GPU L20 48G,Python3.8.10。 pip该库即可。 二、数据准备 该框架实现了读取各种类型的文件,给…

LNMP部署及应用(Linux+Nginx+MySQL+PHP)

LNMP 我们为什么采用LNMP这种架构? 采用Linux、PHP、MySQL的优点我们不必多说。 Nginx是一个小巧而高效的Linux下的Web服务器软件&#xff0c;是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的&#xff0c;已经在一些俄罗斯的大型网站上运行多年&#xff0c;目…