关于golang锁的一点东西

本文基于go 1.19.3

最近打算再稍微深入地看下golang的源码,先从简单的部分入手。正巧前段时间读了操作系统同步机制的一点东西,那么golang这里就从锁开始好了。

在这部分内容中,可能不会涉及到太多的细节的讲解。更多的内容会聚焦在我感兴趣的一些点,以及整体的设计方面。

那么,接下来就是我感兴趣的第一个点:golang的锁是什么级别的锁?

golang的锁是什么级别的锁

通常而言,操作系统会提供多种同步机制,常见的包括的原子操作、自旋锁、互斥锁。相较于自旋锁,互斥锁是我们在日常开发中最常使用的锁。操作系统提供的互斥锁状态变化时阻塞和唤醒影响的是操作系统级别的最小执行流–线程。因此,我在这里比较粗糙地称呼操作系统提供的锁或者编程语言基于系统调用封装的锁为线程级别的锁。

那么golang的锁呢?我们知道golang中最小的执行流为goroutine,并且在runtime中完整地实现了基于goroutine的调度机制。那么golang的锁在是什么级别的锁呢?获取锁时是会阻塞线程,还是仅会阻塞协程?下面我们以sync.Mutex为例来看下其实现。

加锁

sync.Mutex在加锁时会尝试自旋提前占位,自旋是发生在用户态的,直接跳过自旋部分,来到我关注的地方:sync/Mutex.go 171 runtime_SemacquireMutex调用。

// If we were already waiting before, queue at the front of the queue.
queueLifo := waitStartTime != 0
if waitStartTime == 0 {waitStartTime = runtime_nanotime()
}
runtime_SemacquireMutex(&m.sema, queueLifo, 1)

看runtime_SemacquireMutex的注释,runtime_SemacquireMutex的作用和runtime_Semacquire基本一样,都会阻塞地等待,直到信号量的值(传入的s参数)大于0,然后将值减少。从这点上讲,和linux提供的信号量的功能描述基本上是一致的。

runtime_SemacquireMutex相比runtime_Semacquire还多了两个参数。lifo参数会影响阻塞队列的行为,当lifo为true时,会将当前执行流(这里我们还没确定是goroutine还是线程)置于等待队列的头部,后入先出嘛,对不对。skipframes是跳过的调用栈的层数,看起来是在调试或者观测时起作用,我们不去深究。

// Semacquire waits until *s > 0 and then atomically decrements it.
// It is intended as a simple sleep primitive for use by the synchronization
// library and should not be used directly.
func runtime_Semacquire(s *uint32)// SemacquireMutex is like Semacquire, but for profiling contended Mutexes.
// If lifo is true, queue waiter at the head of wait queue.
// skipframes is the number of frames to omit during tracing, counting from
// runtime_SemacquireMutex's caller.
func runtime_SemacquireMutex(s *uint32, lifo bool, skipframes int)

sync_runtime_SemacquireMutex调用了semacquire1函数。semacquire1除了信号量、lifo、skipframs参数外,还多了一个profile参数,其值有semaBlockProfile和semaMutexProfile。看这个两个值,应该和pprof的mutex和block有关系?这里同样不去深究,保证主线,后面有空再看。

//go:linkname sync_runtime_SemacquireMutex sync.runtime_SemacquireMutex
func sync_runtime_SemacquireMutex(addr *uint32, lifo bool, skipframes int) {semacquire1(addr, lifo, semaBlockProfile|semaMutexProfile, skipframes)
}func semacquire1(addr *uint32, lifo bool, profile semaProfileFlags, skipframes int) {}

进入semacquire1方法,我们的疑问似乎要得到解答了。

  • 首先会尝试获取锁,easy path,如果成功,就直接返回。
  • 构建sudog,并且根据传入信号量的地址获取到对应的阻塞队列。
  • 如果不能获取锁,就将sudog加入到root的阻塞队列中,同时调用gopark阻塞当前goroutine。

看到这里,我们应该差不多确定golang的sync.Mutex阻塞的是goroutine。当获取锁时,如果抢占失败,会将当前的goroutine阻塞,挂起到锁的阻塞队列上。但是问题似乎不是这么简单,因为root对象也有锁并且有加锁解锁的行为。那我们再来看看其实现是怎样的。也就是在实现sync.Mutex过程中会遇到临界区的问题,这种情况下通常的做法是采用更底层的同步机制取解决,比如原子操作,比如操作系统的锁。

func semacquire1(addr *uint32, lifo bool, profile semaProfileFlags, skipframes int) {gp := getg()if gp != gp.m.curg {throw("semacquire not on the G stack")}// Easy case.if cansemacquire(addr) {return}// Harder case:// increment waiter count// try cansemacquire one more time, return if succeeded// enqueue itself as a waiter// sleep// (waiter descriptor is dequeued by signaler)s := acquireSudog()root := semtable.rootFor(addr)t0 := int64(0)s.releasetime = 0s.acquiretime = 0s.ticket = 0if profile&semaBlockProfile != 0 && blockprofilerate > 0 {t0 = cputicks()s.releasetime = -1}if profile&semaMutexProfile != 0 && mutexprofilerate > 0 {if t0 == 0 {t0 = cputicks()}s.acquiretime = t0}for {lockWithRank(&root.lock, lockRankRoot)// Add ourselves to nwait to disable "easy case" in semrelease.atomic.Xadd(&root.nwait, 1)// Check cansemacquire to avoid missed wakeup.if cansemacquire(addr) {atomic.Xadd(&root.nwait, -1)unlock(&root.lock)break}// Any semrelease after the cansemacquire knows we're waiting// (we set nwait above), so go to sleep.root.queue(addr, s, lifo)goparkunlock(&root.lock, waitReasonSemacquire, traceEvGoBlockSync, 4+skipframes)if s.ticket != 0 || cansemacquire(addr) {break}}if s.releasetime > 0 {blockevent(s.releasetime-t0, 3+skipframes)}releaseSudog(s)
}

接下来看下sematable相关的内容,也就是信号量相关的实现。信号量本身只是一个整数,对其操作只需要原子操作就OK,非常简单。但抢占信号量失败需要阻塞队列,同一个阻塞队列会面临并发访问,这是sematable的实现解决的问题。

semaTable是一个初始化好的长度为251的数组,数组的元素为semaRoot。

数组的实现可以认为是分片数为251的分段锁。操作时根据对应信号量的地址取模拿到对应的semaRoot,以此减少临界区的粒度。

var semtable semTable// Prime to not correlate with any user patterns.
const semTabSize = 251type semTable [semTabSize]struct {root semaRootpad  [cpu.CacheLinePadSize - unsafe.Sizeof(semaRoot{})]byte
}func (t *semTable) rootFor(addr *uint32) *semaRoot {return &t[(uintptr(unsafe.Pointer(addr))>>3)%semTabSize].root
}

semaRoot是真正的阻塞队列。每个semaRoot对应一组信号量,这组信号量的addr%251的值相等。阻塞在同一信号量上的goroutine以链表的形式组织,阻塞同一semaRoot中不同信号量的goroutine之间以平衡二叉树(红黑or二叉)的形式组织。

semaRoot就是一个临界区,golang使用rumtime2.go中的mutex进行并发保护。

// A semaRoot holds a balanced tree of sudog with distinct addresses (s.elem).
// Each of those sudog may in turn point (through s.waitlink) to a list
// of other sudogs waiting on the same address.
// The operations on the inner lists of sudogs with the same address
// are all O(1). The scanning of the top-level semaRoot list is O(log n),
// where n is the number of distinct addresses with goroutines blocked
// on them that hash to the given semaRoot.
// See golang.org/issue/17953 for a program that worked badly
// before we introduced the second level of list, and
// BenchmarkSemTable/OneAddrCollision/* for a benchmark that exercises this.
type semaRoot struct {lock  mutextreap *sudog // root of balanced tree of unique waiters.nwait uint32 // Number of waiters. Read w/o the lock.
}

看注释,rumtime2.go中的mutex在有竞争的条件下是内核级别的锁,on the contention path they sleep in the kernel,会导致内核级的阻塞。

// Mutual exclusion locks.  In the uncontended case,
// as fast as spin locks (just a few user-level instructions),
// but on the contention path they sleep in the kernel.
// A zeroed Mutex is unlocked (no need to initialize each lock).
// Initialization is helpful for static lock ranking, but not required.
type mutex struct {// Empty struct if lock ranking is disabled, otherwise includes the lock ranklockRankStruct// Futex-based impl treats it as uint32 key,// while sema-based impl as M* waitm.// Used to be a union, but unions break precise GC.key uintptr
}

mutex的实现没有采用oop的方式,runtime2.go中同时提供了lock2和unlock2两个函数来对mutex来进行加锁和解锁。

先看加锁的实现。

首先会确保当前运行的m上创建一个锁和一个condition,这两个对象都是调用c库函数实现,为线程级别的对象。然后尝试自旋获取mutex。如果获取成功,则正常返回;否则,将当前的m加入到阻塞队列的最前端,mutex的key值为阻塞队列首个m的指针,然后调用semasleep方法。

func lock2(l *mutex) {gp := getg()if gp.m.locks < 0 {throw("runtime·lock: lock count")}gp.m.locks++// Speculative grab for lock.if atomic.Casuintptr(&l.key, 0, locked) {return}semacreate(gp.m)// On uniprocessor's, no point spinning.// On multiprocessors, spin for ACTIVE_SPIN attempts.spin := 0if ncpu > 1 {spin = active_spin}
Loop:for i := 0; ; i++ {v := atomic.Loaduintptr(&l.key)if v&locked == 0 {// Unlocked. Try to lock.if atomic.Casuintptr(&l.key, v, v|locked) {return}i = 0}if i < spin {procyield(active_spin_cnt)} else if i < spin+passive_spin {osyield()} else {// Someone else has it.// l->waitm points to a linked list of M's waiting// for this lock, chained through m->nextwaitm.// Queue this M.for {gp.m.nextwaitm = muintptr(v &^ locked)if atomic.Casuintptr(&l.key, v, uintptr(unsafe.Pointer(gp.m))|locked) {break}v = atomic.Loaduintptr(&l.key)if v&locked == 0 {continue Loop}}if v&locked != 0 {// Queued. Wait.semasleep(-1)i = 0}}}
}

semasleep方法是将当前的线程阻塞的方法,其使用了condition来进行调度。当前会阻塞直至condition被唤醒,或者在传入的睡眠时间大于等于0,则只睡眠传入的时间间隔。当由mutex解锁时,会从其阻塞队列中获取m,并唤醒其condition。

func semasleep(ns int64) int32 {var start int64if ns >= 0 {start = nanotime()}mp := getg().mpthread_mutex_lock(&mp.mutex)for {if mp.count > 0 {mp.count--pthread_mutex_unlock(&mp.mutex)return 0}if ns >= 0 {spent := nanotime() - startif spent >= ns {pthread_mutex_unlock(&mp.mutex)return -1}var t timespect.setNsec(ns - spent)err := pthread_cond_timedwait_relative_np(&mp.cond, &mp.mutex, &t)if err == _ETIMEDOUT {pthread_mutex_unlock(&mp.mutex)return -1}} else {pthread_cond_wait(&mp.cond, &mp.mutex)}}
}

解锁时,如果当前的阻塞队列不为空,则唤醒头部的m。同时将当前线程持有的锁的数量减少,只有当前线程持有的锁的数量为0时,才可以对当前线程中运行的goroutine进行调度。

func unlock2(l *mutex) {gp := getg()var mp *mfor {v := atomic.Loaduintptr(&l.key)if v == locked {if atomic.Casuintptr(&l.key, locked, 0) {break}} else {// Other M's are waiting for the lock.// Dequeue an M.mp = muintptr(v &^ locked).ptr()if atomic.Casuintptr(&l.key, v, uintptr(mp.nextwaitm)) {// Dequeued an M.  Wake it.semawakeup(mp)break}}}gp.m.locks--if gp.m.locks < 0 {throw("runtime·unlock: lock count")}if gp.m.locks == 0 && gp.preempt { // restore the preemption request in case we've cleared it in newstackgp.stackguard0 = stackPreempt}
}

解锁

// Semrelease atomically increments *s and notifies a waiting goroutine
// if one is blocked in Semacquire.
// It is intended as a simple wakeup primitive for use by the synchronization
// library and should not be used directly.
// If handoff is true, pass count directly to the first waiter.
// skipframes is the number of frames to omit during tracing, counting from
// runtime_Semrelease's caller.
func runtime_Semrelease(s *uint32, handoff bool, skipframes int) {}//go:linkname sync_runtime_Semrelease sync.runtime_Semrelease
func sync_runtime_Semrelease(addr *uint32, handoff bool, skipframes int) {semrelease1(addr, handoff, skipframes)
}

解锁相对比较简单,从阻塞队列中取出sudog,并将其置为ready状态。

func semrelease1(addr *uint32, handoff bool, skipframes int) {root := semtable.rootFor(addr)atomic.Xadd(addr, 1)// Easy case: no waiters?// This check must happen after the xadd, to avoid a missed wakeup// (see loop in semacquire).if atomic.Load(&root.nwait) == 0 {return}// Harder case: search for a waiter and wake it.lockWithRank(&root.lock, lockRankRoot)if atomic.Load(&root.nwait) == 0 {// The count is already consumed by another goroutine,// so no need to wake up another goroutine.unlock(&root.lock)return}s, t0 := root.dequeue(addr)if s != nil {atomic.Xadd(&root.nwait, -1)}unlock(&root.lock)if s != nil { // May be slow or even yield, so unlock firstacquiretime := s.acquiretimeif acquiretime != 0 {mutexevent(t0-acquiretime, 3+skipframes)}if s.ticket != 0 {throw("corrupted semaphore ticket")}if handoff && cansemacquire(addr) {s.ticket = 1}readyWithTime(s, 5+skipframes)if s.ticket == 1 && getg().m.locks == 0 {// Direct G handoff// readyWithTime has added the waiter G as runnext in the// current P; we now call the scheduler so that we start running// the waiter G immediately.// Note that waiter inherits our time slice: this is desirable// to avoid having a highly contended semaphore hog the P// indefinitely. goyield is like Gosched, but it emits a// "preempted" trace event instead and, more importantly, puts// the current G on the local runq instead of the global one.// We only do this in the starving regime (handoff=true), as in// the non-starving case it is possible for a different waiter// to acquire the semaphore while we are yielding/scheduling,// and this would be wasteful. We wait instead to enter starving// regime, and then we start to do direct handoffs of ticket and// P.// See issue 33747 for discussion.goyield()}}
}

整体设计

承接上文,golang的锁可以说是goroutine级别的锁,或者runtime级别的锁。但是在涉及锁的阻塞队列时会面临更底层的临界区问题,golang使用了runtime2.go mutex来保护临界区,这时可能会涉及到线程的调度。

为什么说可能呢?因为在mutex中使用了自旋来提升性能。我们知道,如果持有锁的时间很短的话,自旋锁的性能是要高于互斥锁的。所以在一些快速操作中会选择用自旋锁,比如,中断上下文,当然,这也和中断上下文中不能阻塞有关。

回到mutex中,在mutex的操作中,对阻塞队列的读写确实是非耗时操作,那么自旋行为确实能提升整体的性能。

包括在更上层的sync.Mutex中,也有自旋的情况,当然在sync.Mutex中,自旋的条件更加苛刻。

所以在仔细了解后,会发现golang的锁还是非常有意思的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/17446.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue2面试题

1. Vue 的基本原理 当 一 个 Vue 实 例 创 建 时 &#xff0c; Vue 会 遍 历 data 中 的 属 性 &#xff0c; 用 Object.defineProperty &#xff08; vue3.0 使 用 proxy&#xff09; 将 它 们 转 为 getter/setter&#xff0c;并且在内部追踪相关依赖&#xff0c;在属性被访…

Java课题笔记~Maven基础知识

一、什么是Maven&#xff1f; Maven是专门用于管理和构建Java项目的工具。 它的主要功能有&#xff1a; 提供了一套标准化的项目结构提供了一套标准化的构建流程&#xff08;编译&#xff0c;测试&#xff0c;打包&#xff0c;发布……&#xff09;提供了一套依赖管理机制 …

子域名收集工具OneForAll的安装与使用-Win

子域名收集工具OneForAll的安装与使用-Win OneForAll是一款功能强大的子域名收集工具 GitHub地址&#xff1a;https://github.com/shmilylty/OneForAll Gitee地址&#xff1a;https://gitee.com/shmilylty/OneForAll 安装 1、python环境准备 OneForAll基于Python 3.6.0开发和…

SK5代理(socks5代理)在网络安全与爬虫应用中的优势与编写指南

一、SK5代理&#xff08;socks5代理&#xff09;的基本概念 SK5代理是一种网络代理协议&#xff0c;它允许客户端通过代理服务器与目标服务器进行通信。相较于HTTP代理&#xff0c;SK5代理在传输数据时更加高效且安全&#xff0c;它支持TCP和UDP协议&#xff0c;并且能够实现数…

Kotlin基础(九):对象和委托

前言 本文主要讲解kotlin对象和委托。 Kotlin文章列表 Kotlin文章列表: 点击此处跳转查看 目录 1.1 对象 在Kotlin中&#xff0c;对象&#xff08;Object&#xff09;是一个具有特殊用途的单例实例。它是一种创建单个实例的方式&#xff0c;确保在整个应用程序中只存在一个特…

(树) 剑指 Offer 32 - II. 从上到下打印二叉树 II ——【Leetcode每日一题】

❓剑指 Offer 32 - II. 从上到下打印二叉树 II 难度&#xff1a;简单 从上到下按层打印二叉树&#xff0c;同一层的节点按从左到右的顺序打印&#xff0c;每一层打印到一行。 例如: 给定二叉树: [3,9,20,null,null,15,7], 3/ \9 20/ \15 7返回其层次遍历结果&#xff1a…

详解顺序表功能

前言 随着我们C语言的不断深入学习&#xff0c;我们要开始学习一点数据结构来增加我们的内功了&#xff0c;虽说现在很多高级语言的顺序表&#xff0c;链表等可以不用自己实现&#xff0c;但在C语言中是需要我们自己来实现的&#xff0c;这并不能说明C语言和其他语言比C语言很…

os.signal golang中的信号处理

在程序进行重启等操作时&#xff0c;我们需要让程序完成一些重要的任务之后&#xff0c;优雅地退出&#xff0c;Golang为我们提供了signal包&#xff0c;实现信号处理机制&#xff0c;允许Go 程序与传入的信号进行交互。 Go语言标准库中signal包的核心功能主要包含以下几个方面…

使用WebMvcConfigurationSupport后导致原来返回的json数据变为了xml的解决方法

问题 未使用WebMvcConfigurationSupport拦截时返回的数据都是JSON格式&#xff0c;使用WebMvcConfigurationSupport做拦截后数据的返回变为了XML的格式。 原因 在Spring框架中&#xff0c;WebMvcConfigurationSupport 是一个类&#xff0c;它可以用于自定义Spring MVC的配置…

【模型预测控制MPC】使用离散、连续、线性或非线性模型对预测控制进行建模(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

【java】指定排序增删改的时候先过滤再重组

指定排序增删改的时候先过滤再重组 package com.bosscloud.form.main.utils;import cn.hutool.json.JSONArray; import cn.hutool.json.JSONObject;/*** 指定排序增删改的时候先过滤再重组**/ public class JsonUtils { /*** 增删改的时候*/Testpublic void sortBySpecifiedFi…

【Deepsort】C++版本Deepsort编译(依赖opencv,eigen3)

目录 下载源码安装onnxruntime安装Eigen3编译opencv 下载源码 https://github.com/shaoshengsong/DeepSORT安装onnxruntime 安装方法参考博客 安装Eigen3 当谈及线性代数计算库时&#xff0c;Eigen3是一个强大而受欢迎的选择。Eigen3是一个C模板库&#xff0c;提供了许多用…

LLM微调 | Adapter: Parameter-Efficient Transfer Learning for NLP

目的:大模型预训练+微调范式,微调成本高。adapter只只微调新增的小部分参数【但adapter增加了模型层数,引入了额外的推理延迟。】 Adapters最初来源于CV领域的《Learning multiple visual domains with residual adapters》一文,其核心思想是在神经网络模块基础上添加一些残…

《算法竞赛·快冲300题》每日一题:“平方和”

《算法竞赛快冲300题》将于2024年出版&#xff0c;是《算法竞赛》的辅助练习册。 所有题目放在自建的OJ New Online Judge。 用C/C、Java、Python三种语言给出代码&#xff0c;以中低档题为主&#xff0c;适合入门、进阶。 文章目录 题目描述题解C代码Java代码Python代码 “ 平…

【Python机器学习】实验04(1) 多分类(基于逻辑回归)实践

文章目录 多分类以及机器学习实践如何对多个类别进行分类1.1 数据的预处理1.2 训练数据的准备1.3 定义假设函数&#xff0c;代价函数&#xff0c;梯度下降算法&#xff08;从实验3复制过来&#xff09;1.4 调用梯度下降算法来学习三个分类模型的参数1.5 利用模型进行预测1.6 评…

CS162 13-17 虚拟内存

起源 为啥我们需要虚拟内存-----------需求是啥&#xff1f; 可以给程序提供一个统一的视图&#xff0c;比如多个程序运行同一个代码段的话&#xff0c;同一个kernel&#xff0c;就可以直接共享 cpu眼里的虚拟内存 无限内存的假象 设计迭代过程 为啥这样设计&#xff1f; 一…

安装vite-plugin-svg-icons

找不到合适的图标&#xff0c;如何使用其他的svg图标&#xff1f; 安装vite-plugin-svg-icons 使用svg-icon&#xff0c;即可使用iconfont等svg图标库 安装及使用过程 一、安装依赖二、在src/assets新建svg目录三、vite.config.js中进行配置四、在main.js中导入文件五、在compo…

clickhouse-安装部署

官网文档 1.采用Debian包方式安装 # 设置Debian仓库 sudo apt-get install -y apt-transport-https ca-certificates dirmngr GNUPGHOME$(mktemp -d) sudo GNUPGHOME"$GNUPGHOME" gpg --no-default-keyring --keyring /usr/share/keyrings/clickhouse-keyring.gpg …

Redis篇

文章目录 Redis-使用场景1、缓存穿透2、缓存击穿3、缓存雪崩4、双写一致5、Redis持久化6、数据过期策略7、数据淘汰策略 Redis-分布式锁1、redis分布式锁&#xff0c;是如何实现的&#xff1f;2、redisson实现的分布式锁执行流程3、redisson实现的分布式锁-可重入4、redisson实…

技术复盘(5)--git

技术复盘--git 资料地址原理图安装配置基本命令分支命令对接gitee练习:远程仓库操作 资料地址 学习地址-B站黑马&#xff1a;https://www.bilibili.com/video/BV1MU4y1Y7h5 git官方&#xff1a;https://git-scm.com/ gitee官网&#xff1a;https://gitee.com/ 原理图 说明&am…