线程的概念和控制

文章目录

  • 线程概念
    • 线程的优点
    • 线程的缺点
    • 线程异常
    • 线程用途
    • 理解虚拟地址
  • 线程控制
    • 线程的创建
    • 线程终止
    • 线程等待
    • 线程分离
    • 封装线程库

线程概念

什么是线程?

  1. 在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程是“一个进程内部的控制序
  2. 一切进程至少都有一个执行线程
  3. 线程在进程内部运行,本质是在进程地址空间内运行
  4. 在Linux系统中,在CPU眼中,看到的PCB都要比传统的进程更加轻量化,线程是比进程更加轻量化的一种执行流。
  5. 透过进程虚拟地址空间,可以看到进程的大部分资源,将进程资源合理分配给每个执行流,就形成了线程
    执行流

如何看待之前的进程?
之前的进程是内部只有一个执行流。

如何看待现在的进程?
现在的进程内部有多个执行流。并且多个执行流共享大部分资源。

线程更像是一种标准,各个平台的实现方式可能不同,但是作用都是一样的。在Linux中,因为线程也是执行流,进程也是,并且一个进程内的所有线程共享大部分资源。所以Linux中线程的实现就直接复用了进程的代码,这样在OS的调度算法就只有一个进程调度就可以了,一个进程中的的线程是共享大部分数据,所以创建线程可以直接复制PCB就可以了,一个进程中是可以存在多个线程的,所以OS也一定会对线程进行管理,所以OS也一定要有对线程描述的结构体(TCB),但是线程是直接复制进程的,所以Linux中描述线程的结构体也是PCB。所以Linux下线程也称为轻量级进程。
在这里插入图片描述
因此现在看来,线程是CPU调度的基本单位,进程就是承担系统资源的基本实体。

线程的优点

  1. 创建一个新线程的代价要比创建一个新进程小得多
  2. 与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多
  3. 线程占用的资源要比进程少很多
  4. 能充分利用多处理器的可并行数量
  5. 在等待慢速I/O操作结束的同时,程序可执行其他的计算任务
  6. 计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现
  7. I/O密集型应用,为了提高性能,将I/O操作重叠。线程可以同时等待不同的I/O操作。

为什么说创建线程比进程的代价小呢呢?
因为线程是在进程的地址空间中运行的,并且线程创建更简单,只需要复制进程的PCB,只有一小部分的数据是私有的,大部分数据都和进程是一样的。

线程切换的效率为什么高?
如果是一个进程中的两个线程进程切换的话,CPU中的有一部分寄存器中的内容是不需要被切换的,并且因为局部性原理,CPU中是存在Cache缓存的,如果是一个进程中的两个线程进程切换,根据局部性原理Cache缓存也大部分不会被替换,但是如果是进程切换,所有的寄存器和Cache都是要被切换的。

线程的缺点

  1. 性能损失
    一个很少被外部事件阻塞的计算密集型线程往往无法与共它线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指的是增加了额外的同步和调度开销,而可用的资源不变。
  2. 健壮性降低
    编写多线程需要更全面更深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的,换句话说线程之间是缺乏保护的。
  3. 缺乏访问控制
    进程是访问控制的基本粒度,在一个线程中调用某些OS函数会对整个进程造成影响。
  4. 编程难度提高
    编写与调试一个多线程程序比单线程程序困难得多

线程异常

  1. 单个线程如果出现除零,野指针问题导致线程崩溃,进程也会随着崩溃
  2. 线程是进程的执行分支,线程出异常,就类似进程出异常,进而触发信号机制,终止进程,进程终止,该
    进程内的所有线程也就随即退出

线程用途

  1. 合理的使用多线程,能提高CPU密集型程序的执行效率
  2. 合理的使用多线程,能提高IO密集型程序的用户体验(如生活中我们一边写代码一边下载开发工具,就是多线程运行的一种表现)

我们说线程和线程之间大部分数据是共享的但是有一部分数据是私有的,那么什么共享什么私有?
共享

文件描述符表
每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)
当前工作目录
用户id和组id
地址空间

私有

线程ID(lwp)
一组寄存器

errno
信号屏蔽字
调度优先级

理解虚拟地址

我们现在直到磁盘中文件是以4KB为单位存储的,称之为页帧。并且我们编译好的可执行程序仍然遵守这样的规则,所以我们的内存空间也是被划分为4KB大小为单位的空间,称之页框,所以在访问一块内存时只需要知道页框的首地址+页内偏移就可以访问内存中的任意一个地址空间。因为内存会被划分成很多的页框,所以OS要对内存管理,就需要先描述在组织,可以理解为所有的页框都被放在一个数组中,然后OS对内存的管理就变成了对数组的增删查改。

虚拟地址到物理地址的转换是需要页表的,页表的每一行存在很多的字段,假设现在是10个字节,要是每个物理地址都存在一个虚拟地址跟他直接映射的话,假设是2^32的内存,就需要40G来存放页表,显然是不可能的,所以虚拟地址和物理地址并不是直接进行映射的。
以32为的地址为例假设先现在有一个地址 11110011 10111011 00101001 10100101 一个32个比特位,把前10 为1111001110作为一个整体,一共10个比特位,可以表示的范围就是0~1023,所以假设有一个1024大小的数组,就可以通过前十位的数据找到一个数组的下标,数组的内容还是一个大小为1024的数组,这个数组为页目录,然后11 ~ 20为比特位1110110010作为数组指向的那个数组的下标,数组的内容就是页框的起始地址,然后最后12个比特位就是页内的偏移地址。所以通过这样的方式找到物理地址,并且大大的减少了直接映射的使用空间,因此在页表中是没有物理地址的,在CPU中有一个MMU寄存器,我们只需要把一个虚拟地址放进去,就可以值就拿到物理地址然后进行访问。当然CPU中也有一个寄存器专门保存的就是当前页目录的起始地址。

在这里插入图片描述
每个线程要执行自己的代码,根据我们传递的函数,本质就是划分页表,划分页表的本质就是划分地址空间。所以在进程的视角,虚拟地址空间本身就是资源。

进程和线程关系如下:
在这里插入图片描述

线程控制

Linux中是没有真正的线程的,只有轻量级进程的概念,所以OS只会提供轻量级进程的系统调用,不会直接提供线程调用的接口。所以为了便于人们对线程的控制,写Linux的程序员就把对线程的控制封装成了pthread原生线程库。对上提供线程控制的接口。

  1. 与线程有关的函数构成了一个完整的系列,绝大多数函数的名字都是以“pthread_”打头的
  2. 要使用这些函数库,要通过引入头文<pthread.h>
  3. 链接这些线程函数库时要使用编译器命令的“-lpthread”选项

线程的创建

在这里插入图片描述

  1. 传统的一些函数是,成功返回0,失败返回-1,并且对全局变量errno赋值以指示错误。pthreads函数出错时不会设置全局变量errno(而大部分其他POSIX函数会这样做)。而是将错误代码通过返回值返回
  2. pthreads同样也提供了线程内的errno变量,以支持其它使用errno的代码。对于pthreads函数的错误,建议通过返回值判定,因为读取返回值要比读取线程内的errno变量的开销更小

在Linux中可以通过ps -aL 查看创建的线程
在这里插入图片描述
我们可以看到同个进程内的线程的pid是相同的,但是LWP是不同的,因为LWP是线程的id,LWP在内核中使用,和我们用pthread_create获取出来的线程id是不一样的。内核中用LWP来表示线程的唯一。

pthread_create获取出来的线程id是我们用户自己使用的,可以通过pthread_ self()来获取。
在这里插入图片描述
那么这个线程id到底是什么呢?
我们使用的所有的线程的函数都不是系统直接提供的,是原生线程库提供的,而原生线程库一定不只会有我们一个进程用,所以原生线程库中一定会存在多个进程创建的多个线程,所以线程库一定要把我们多个进程创建的线程给管理好,所以线程库中会存在描述线程的结构体,结构体中有很多线程的数据(属于哪个进程,线程id等),然后再用数据结构把各个描述线程的结构体管理起来。我们来认识一个系统调用:
在这里插入图片描述
它可以通过flags的标识符来表示创建一个进程或者是创建一个轻量级进程(线程),我们看到参数中有一个child_stack的参数,表示我们是可以传一段空间是作为线程的栈空间的,所以我们前面说每个线程有自已的独立栈空间,pthread_create的底层就是封装了这个函数。因此我们每个新线程都会有自己的栈空间,而默认地址空间中的栈由主线程使用。在原生线程库中每个线程和每个线程的数据结构和栈空间还有一些相关的独立的数据放在一起,而我们用户用的线程id就是线程属性在线程库中的地址。
在这里插入图片描述

现在理解了线程id后,我们迷惑的应该是线程的局部存储是什么,我们知道对于全局变量来说是被所有线程共享的,但是加了一个__thread修饰一个变量,程序在编译的时候就会为每个线程开辟一段空间专门存储这个变量,也就是说,这个变量每个线程都存在一份,互不干扰。
在这里插入图片描述

线程终止

如果需要只终止某个线程而不终止整个进程,可以有三种方法:

  1. 从线程函数return。这种方法对主线程不适用,从main函数return相当于调用exit。
  2. 线程可以调用pthread_ exit终止自己。
  3. 一个线程可以调用pthread_ cancel终止同一进程中的另一个线程。

pthread_exit
在这里插入图片描述
pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的,不能在线程函数的栈上分配,因为当其它线程得到这个返回指针时线程函数已经退出了。

pthread_cancel
在这里插入图片描述

线程等待

为什么要进程线程等待?

  1. 已经退出的线程,其空间没有被释放,仍然在进程的地址空间内。
  2. 创建新的线程不会复用刚才退出线程的地址空间。

pthread_join

在这里插入图片描述
调用该函数的线程将挂起等待,直到id为thread的线程终止。thread线程以不同的方法终止,通过pthread_join得到的终止状态是不同的,总结如下:

  1. 如果thread线程通过return返回,value_ ptr所指向的单元里存放的是thread线程函数的返回值。
  2. 如果thread线程被别的线程调用pthread_ cancel异常终掉,value_ ptr所指向的单元里存放的是常数PTHREAD_ CANCELED(-1)。
  3. 如果thread线程是自己调用pthread_exit终止的,value_ptr所指向的单元存放的是传给pthread_exit的参
    数。
  4. 如果对thread线程的终止状态不感兴趣,可以传NULL给value_ ptr参数。

线程分离

一般情况下对于创建的线程我们是需要join的,但是如果我们不关系线程的返回值,那么join就会成为一中负担,这时我们就可以对线程进程分离。即当线程退出时,自动释放线程资源。

pthread_detach

在这里插入图片描述
可以是线程组内其他线程对目标线程进行分离,也可以是线程自己分离,可以通过pthread_self()来获取自己的线程id。

join和分离是冲突的,一个线程不能既是join又是分离的。

如何理解语言中的线程库?
本质就是对原生线程库的封装。

线程中可以进程fork吗?可以进程execl程序替换吗?
线程中是可以fork的,也是可以进程execl程序替换的,但是进行程序替换整个进程的代码都会被替换,可能会影响其他线程的正常运行,比较推荐先fork然后在进程程序替换。

封装线程库

基于上面的接口,我们来模拟实现一下简单版的线程库。

#pragma once
#include <iostream>
#include <string>
#include <functional>
#include <pthread.h>
#include <unistd.h>template<class T>
using func_t = std::function<void(T)>;template<class T>
class Thread
{
public:Thread(const std::string& name, func_t<T> func, T data) : _name(name), _func(func), _tid(0), _isruning(false), _data(data){}static void* threadRountine(void* attr){Thread* t = static_cast<Thread*>(attr);t->_func(t->_data);}void Start(){int n = pthread_create(&_tid,nullptr,threadRountine,this);if(n == 0) {_isruning = true;}else {std::cerr << "pthread error" << std::endl;}}void Join(){if(!_isruning) return;int n = pthread_join(_tid,nullptr);if(n == 0){_isruning = false;}else {std::cerr << "join error" << std::endl;}}std::string getname(){return _name;}bool isruning(){return _isruning;}
private:std::string _name;pthread_t _tid;bool _isruning;func_t<T> _func;T _data;
};

如果需要返回值可以在成员变量可以加个模板参数在成员变量中定义一个返回值通过join得到就可以,如果调用的函数参数有多个也可以通过类似的方法实现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/839112.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024中青杯数学建模C题:“X 疾病”在人群中的传播代码论文思路分析

2024中青杯数学建模C题论文和代码已完成&#xff0c;代码为C题全部问题的代码&#xff0c;论文包括摘要、问题重述、问题分析、模型假设、符号说明、模型的建立和求解&#xff08;问题1模型的建立和求解、问题2模型的建立和求解、问题3模型的建立和求解&#xff09;、模型的评价…

c++ queue容器

在C标准库中&#xff0c;std::queue 是一个容器适配器&#xff0c;它提供了队列&#xff08;FIFO - First In First Out&#xff09;的数据结构。队列是一种特殊的线性数据结构&#xff0c;只允许在表的前端&#xff08;front&#xff09;进行删除操作&#xff0c;而在表的后端…

nssctf(Web刷题)

[SWPUCTF 2021 新生赛]gift_F12 打开题目是一个时间页面&#xff0c;不过看了一会儿发现没有什么用 直接F12打开网页源代码 CtrlF搜索flag 找到了flag NSSCTF{We1c0me_t0_WLLMCTF_Th1s_1s_th3_G1ft} [第五空间 2021]签到题 NSSCTF{welcometo5space} [SWPUCTF 2021 新生赛…

钉钉算是在线办公系统的设计标杆,尽管它依然很难用

不吹不黑&#xff0c;钉钉界面谁的的确简洁&#xff0c;无奈它面向的是场景复杂的办公领域&#xff0c;导致其越来越臃肿难用&#xff0c;反正我是该研究研究&#xff0c;但绝对不会用的。 举报 评论 1

Invoking “make cmake_check_build_system“ failed

前言&#xff1a; 在看过站内其他的方法且试过之后没奏效之后&#xff0c;偶然&#xff0c;无意间&#xff0c;随手整对了&#xff0c;然后后续在老赵的文档也找到了原因&#xff0c;对的上号&#xff0c;那在此我提出一种新的方法&#xff0c;且很简单的小tips。首先先来看看…

数据挖掘与机器学习——机器学习概述

一、什么是机器学习 机器学习的英文名称叫Machine Learning&#xff0c;简称ML&#xff0c;该领域主要研究的是如何使计算机能够模拟人类的学习行为从而获得新的知识。 机器学习与数据挖掘的联系&#xff1a;简单来说&#xff0c;机器学习就是让计算机从大量 的数据中学习到相关…

yaml文件格式详解 及 k8s实战演示

目录 一 k8s 支持的语言格式 1&#xff0c;YAML 语法格式 2&#xff0c;查看 api 资源版本标签 二 k8s 运行nginx pod实例 yaml文件 具体讲解 1&#xff0c;写一个yaml文件demo 2&#xff0c;deployment 管理nginx 的yaml 文件 3&#xff0c;创建资源对象 4&#…

【四、性能测试】Linux stress 压力模拟测试工具

在做 CPU 问题解析之前&#xff0c;需要先了解一下压力模拟工具&#xff0c;可以将 CPU、MEM、IO 等进行压力模拟&#xff0c;可以在模拟压力的过程中进行问题解析 一、STRESS 模拟对CPU、Memory、IO、磁盘进行压力测试。可以使用 stress 工具&#xff0c;它是专门针对 linux…

mysql 多表关联查询性能优化-同一sql不同的执行计划

一、问题背景 相同的sql&#xff0c;不同的日期&#xff0c;执行的时间差异很大&#xff0c;执行计划不一样。执行快时&#xff0c;30ms左右。执行慢时&#xff0c;15s左右。 二、分析结论 1、经过分析&#xff0c;发现不同日期下&#xff0c;sql的执行计划不同&#xff0c;驱…

基于springboot+vue的学生考勤管理系统

开发语言&#xff1a;Java框架&#xff1a;springbootJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包&#xff1a;…

实现mysql的主从复制、实现MySQL的读写分离与负载均衡

实验环境 &#xff08;注明&#xff09;以下的所有关于yum和rpm以及tar的软件需要自己准备&#xff0c;没有的话可以私信博主 实验目标&#xff1a; 1.实现mysql主从复制 2.实现mysql读写分离与负载均衡 实验一、搭建mysql主从复制 1.建立时间同步环境&#xff0c;在主节…

C++BuilderXE 如何让listView按文件名数字排序而非字母排序

int m_nDataColSort0; bool IsAsctrue; void __fastcall TForm1::RzListView4Compare(TObject *Sender, TListItem *Item1, TListItem *Item2, int Data, int &Compare) { if(m_nDataColSort0) { //按列表第二列排序 //CompareCompareText(Item1->SubItems-…

卷积神经网络(CNN)详细介绍及其原理详解

卷积神经网络&#xff08;Convolutional Neural Networks&#xff0c;简称CNN&#xff09;是深度学习中非常重要的一类神经网络&#xff0c;主要用于图像识别、图像分类、物体检测等计算机视觉任务。本文将详细介绍卷积神经网络的基本概念、结构组成及其工作原理&#xff0c;并…

BCD编码(8421)介绍

概念 BCD (Binary-Coded Decimal) 是一种二进制的数字编码形式&#xff0c;其特点每个十进制数位用4个二进制位来表示。 在网络IO中&#xff0c;你传输一个数字类型最少需要一字节&#xff0c;传输两个数字类型最少需要两字节&#xff0c;但是当你使用BCD编码后传输&#xff…

防静电液的这些用处你知道多少

防静电液又叫抗静电剂&#xff0c;是工业上常用来消除静电的化学用品&#xff0c;一般是液体状态&#xff0c;它的用途很广泛。 防静电液适用于对静电有控制要求的电器、仪器桌面、台面、塑料制品、包装品、存储盒、托盘、毛毯、织物等任何物品表面。 应用举例如消除各种塑胶材…

微服务中的鉴权怎么做?

大家好&#xff0c;我是苍何呀。 现在出去找工作&#xff0c;简历上不写上微服务的技术&#xff0c;仿佛自己跟不上时代了&#xff0c;面试官更是喜欢盯着微服务项目来提问。 但其实虽说微服务是主流&#xff0c;随着云原生架构的发展&#xff0c;微服务也是趋势&#xff0c;…

图论-最短路算法

1. Floyd算法 作用&#xff1a;用于求解多源最短路&#xff0c;可以求解出任意两点的最短路 利用动态规划只需三重循环即可&#xff08;动态规划可以把问题求解分为多个阶段&#xff09;定义dp[k][i][j]表示点i到点j的路径&#xff08;除去起点终点&#xff09;中最大编号不超…

数据库的约束 not null, unique, default, primary key, foreign key, check

约束可以理解成 数据库提供的一种针对数据的合法性进行验证的机制, 在创建表的时候使用 1. 约束类型 NOT NULL - 指示某列不能存储 NULL 值, 表里的这个内容是必填项UNIQUE - 保证某列的每行必须有唯一的值, 不能重复 每次插入/修改时, 都要先触发查询, 如果当前插入/修改的…

原来Rstudio还可以这么使用,又方便了一些

在别人的电子书&#xff0c;你的电子书&#xff0c;都在bookdown中我们讲述了bookdown用于自动化文档生成。里面涉及到一个文件Rproj用于项目管理。 本身是一个很简单的文件&#xff0c;里面的内容一般不需要修改&#xff0c;只是放置在每个项目目录下即可。 比如我们有个内容…

C语言-牛客-实现四舍五入

欢迎来到Harper.Lee的学习小世界&#xff01; 博主主页传送门&#xff1a;Harper.Lee的博客主页 想要一起进步的uu欢迎来后台找我哦&#xff01; 本篇博客总结C语言刷题的相关笔记~~~~ #牛客–实现四舍五入 题目描述&#xff1a;随机输入浮点数&#xff0c;输出四舍五入后的整数…