golang map 锁_golang 并发安全Map以及分段锁的实现

涉及概念

并发安全Map

分段锁

sync.Map

CAS ( Compare And Swap )

双检查

分断锁

type SimpleCache struct {

mu sync.RWMutex

items map[interface{}]*simpleItem

}

在日常开发中, 上述这种数据结构肯定不少见,因为golang的原生map是非并发安全的,所以为了保证map的并发安全,最简单的方式就是给map加锁。

之前使用过两个本地内存缓存的开源库, gcache, cache2go,其中存储缓存对象的结构都是这样,对于轻量级的缓存库,为了设计简洁(包含清理过期对象等 ) 再加上当需要缓存大量数据时有redis,memcache等明星项目解决。 但是如果抛开这些因素遇到真正数量巨大的数据量时,直接对一个map加锁,当map中的值越来越多,访问map的请求越来越多,大家都竞争这一把锁显得并发访问控制变重。 在go1.9引入sync.Map 之前,比较流行的做法就是使用分段锁,顾名思义就是将锁分段,将锁的粒度变小,将存储的对象分散到各个分片中,每个分片由一把锁控制,这样使得当需要对在A分片上的数据进行读写时不会影响B分片的读写。

分段锁的实现

// Map 分片

type ConcurrentMap []*ConcurrentMapShared

// 每一个Map 是一个加锁的并发安全Map

type ConcurrentMapShared struct {

items map[string]interface{}

sync.RWMutex // 各个分片Map各自的锁

}

主流的分段锁,即通过hash取模的方式找到当前访问的key处于哪一个分片之上,再对该分片进行加锁之后再读写。分片定位时,常用有BKDR, FNV32等hash算法得到key的hash值。

func New() ConcurrentMap {

// SHARD_COUNT 默认32个分片

m := make(ConcurrentMap, SHARD_COUNT)

for i := 0; i < SHARD_COUNT; i++ {

m[i] = &ConcurrentMapShared{

items: make(map[string]interface{}),

}

}

return m

}

在初始化好分片后, 对分片上的数据进行读写时就需要用hash取模进行分段定位来确认即将要读写的分片。

获取段定位

func (m ConcurrentMap) GetShard(key string) *ConcurrentMapShared {

return m[uint(fnv32(key))%uint(SHARD_COUNT)]

}

// FNV hash

func fnv32(key string) uint32 {

hash := uint32(2166136261)

const prime32 = uint32(16777619)

for i := 0; i < len(key); i++ {

hash *= prime32

hash ^= uint32(key[i])

}

return hash

}

之后对于map的GET SET 就简单顺利成章的完成

Set And Get

func (m ConcurrentMap) Set(key string, value interface{}) {

shard := m.GetShard(key) // 段定位找到分片

shard.Lock() // 分片上锁

shard.items[key] = value // 分片操作

shard.Unlock() // 分片解锁

}

func (m ConcurrentMap) Get(key string) (interface{}, bool) {

shard := m.GetShard(key)

shard.RLock()

val, ok := shard.items[key]

shard.RUnlock()

return val, ok

}

由此一个分段锁Map就实现了, 但是比起普通的Map, 常用到的方法比如获取所有key, 获取所有Val 操作是要比原生Map复杂的,因为要遍历每一个分片的每一个数据, 好在golang的并发特性使得解决这类问题变得非常简单

Keys

// 统计当前分段map中item的个数

func (m ConcurrentMap) Count() int {

count := 0

for i := 0; i < SHARD_COUNT; i++ {

shard := m[i]

shard.RLock()

count += len(shard.items)

shard.RUnlock()

}

return count

}

// 获取所有的key

func (m ConcurrentMap) Keys() []string {

count := m.Count()

ch := make(chan string, count)

// 每一个分片启动一个协程 遍历key

go func() {

wg := sync.WaitGroup{}

wg.Add(SHARD_COUNT)

for _, shard := range m {

go func(shard *ConcurrentMapShared) {

defer wg.Done()

shard.RLock()

// 每个分片中的key遍历后都写入统计用的channel

for key := range shard.items {

ch

}

shard.RUnlock()

}(shard)

}

wg.Wait()

close(ch)

}()

keys := make([]string, count)

// 统计各个协程并发读取Map分片的key

for k := range ch {

keys = append(keys, k)

}

return keys

}

这里写了一个benchMark来对该分段锁Map和原生的Map加锁方式进行压测, 场景为将一万个不重复的键值对同时以100万次写和100万次读,分别进行5次压测, 如下压测代码

func BenchmarkMapShared(b *testing.B) {

num := 10000

testCase := genNoRepetTestCase(num) // 10000个不重复的键值对

m := New()

for _, v := range testCase {

m.Set(v.Key, v.Val)

}

b.ResetTimer()

for i := 0; i < 5; i++ {

b.Run(strconv.Itoa(i), func(b *testing.B) {

b.N = 1000000

wg := sync.WaitGroup{}

wg.Add(b.N * 2)

for i := 0; i < b.N; i++ {

e := testCase[rand.Intn(num)]

go func(key string, val interface{}) {

m.Set(key, val)

wg.Done()

}(e.Key, e.Val)

go func(key string) {

_, _ = m.Get(key)

wg.Done()

}(e.Key)

}

wg.Wait()

})

}

}

原生Map加锁压测结果

分段锁压测结果

可以看出在将锁的粒度细化后再面对大量需要控制并发安全的访问时,分段锁Map的耗时比原生Map加锁要快3倍有余

Sync.Map

go1.9之后加入了支持并发安全的Map sync.Map, sync.Map 通过一份只使用原子操作的数据和一份冗余了只读数据的加锁数据实现一定程度上的读写分离,使得大多数读操作和更新操作是原子操作,写入新数据才加锁的方式来提升性能。以下是 sync.Map源码剖析, 结构体中的注释都会在具体实现代码中提示相呼应

type Map struct {

// 保护dirty的锁

mu Mutex

// 只读数据(修改采用原子操作)

read atomic.Value

// 包含只读中所有数据(冗余),写入新数据时也在dirty中操作

dirty map[interface{}]*entry

// 当原子操作访问只读read时找不到数据时会去dirty中寻找,此时misses+1,dirty及作为存储新写入的数据,又冗余了只读结构中的数据,所以当misses > dirty 的长度时, 会将dirty升级为read,同时将老的dirty置nil

misses int

}

// Map struct 中的 read 就是readOnly 的指针

type readOnly struct {

// 基础Map

m map[interface{}]*entry

// 用于表示当前dirty中是否有read中不存在的数据, 在写入数据时, 如果发现dirty中没有新数据且dirty为nil时,会将read中未被删除的数据拷贝一份冗余到dirty中, 过程与Map struct中的 misses相呼应

amended bool

}

// 数据项

type entry struct {

p unsafe.Pointer

}

// 用于标记数据项已被删除(主要保证数据冗余时的并发安全)

// 上述Map结构中说到有一个将read数据拷贝冗余至dirty的过程, 因为删除数据项是将*entry置nil, 为了避免冗余过程中因并发问题导致*entry改变而影响到拷贝后的dirty正确性,所以sync.Map使用expunged来标记entry是否被删除

var expunged = unsafe.Pointer(new(interface{}))

在下面sync.Map具体实现中将会看到很多“双检查”代码,因为通过原子操作获取的值可能在进行其他非原子操作过程中已改变,所以再非原子操作后需要使用之前原子操作获取的值需要再次进行原子操作获取。

compareAndSwap 交换并比较, 用于在多线程编程中实现不被打断的数据交换操作,从而避免多线程同时改写某一数据时导致数据不一致问题。

sync.Map Write

func (m *Map) Store(key, value interface{}) {

// 先不上锁,而是从只读数据中按key读取, 如果已存在以compareAndSwap操作进行覆盖(update)

read, _ := m.read.Load().(readOnly)

if e, ok := read.m[key]; ok && e.tryStore(&value) {

return

}

m.mu.Lock()

// 双检查获取read

read, _ = m.read.Load().(readOnly)

// 如果data在read中,更新entry

if e, ok := read.m[key]; ok {

// 如果原子操作读到的数据是被标记删除的, 则视为新数据写入dirty

if e.unexpungeLocked() {

m.dirty[key] = e

}

// 原子操作写新数据

e.storeLocked(&value)

} else if e, ok := m.dirty[key]; ok {

// 原子操作写新数据

e.storeLocked(&value)

} else {

// 新数据

// 当dirty中没有新数据时,将read中数据冗余到dirty

if !read.amended {

m.dirtyLocked()

m.read.Store(readOnly{m: read.m, amended: true})

}

m.dirty[key] = newEntry(value)

}

m.mu.Unlock()

}

func (e *entry) tryStore(i *interface{}) bool {

p := atomic.LoadPointer(&e.p)

if p == expunged {

return false

}

for {

if atomic.CompareAndSwapPointer(&e.p, p, unsafe.Pointer(i)) {

return true

}

p = atomic.LoadPointer(&e.p)

if p == expunged {

return false

}

}

}

// 在dirty中没有比read多出的新数据时触发冗余

func (m *Map) dirtyLocked() {

if m.dirty != nil {

return

}

read, _ := m.read.Load().(readOnly)

m.dirty = make(map[interface{}]*entry, len(read.m))

for k, e := range read.m {

// 检查entry是否被删除, 被删除的数据不冗余

if !e.tryExpungeLocked() {

m.dirty[k] = e

}

}

}

func (e *entry) tryExpungeLocked() (isExpunged bool) {

p := atomic.LoadPointer(&e.p)

for p == nil {

// 将被删除(置nil)的数据以cas原子操作标记为expunged(防止因并发情况下其他操作导致冗余进dirty的数据不正确)

if atomic.CompareAndSwapPointer(&e.p, nil, expunged) {

return true

}

p = atomic.LoadPointer(&e.p)

}

return p == expunged

}

sync.Map Read

func (m *Map) Load(key interface{}) (value interface{}, ok bool) {

read, _ := m.read.Load().(readOnly)

e, ok := read.m[key]

// 只读数据中没有,并且dirty有比read多的数据,加锁在dirty中找

if !ok && read.amended {

m.mu.Lock()

// 双检查, 因为上锁之前的语句是非原子性的

read, _ = m.read.Load().(readOnly)

e, ok = read.m[key]

if !ok && read.amended {

// 只读中没有读取到的次数+1

e, ok = m.dirty[key]

// 检查是否达到触发dirty升级read的条件

m.missLocked()

}

m.mu.Unlock()

}

if !ok {

return nil, false

}

// atomic.Load 但被标记为删除的会返回nil

return e.load()

}

func (m *Map) missLocked() {

m.misses++

if m.misses < len(m.dirty) {

return

}

m.read.Store(readOnly{m: m.dirty})

m.dirty = nil

m.misses = 0

}

sync.Map DELETE

func (m *Map) Delete(key interface{}) {

read, _ := m.read.Load().(readOnly)

e, ok := read.m[key]

// 只读中不存在需要到dirty中去删除

if !ok && read.amended {

m.mu.Lock()

// 双检查, 因为上锁之前的语句是非原子性的

read, _ = m.read.Load().(readOnly)

e, ok = read.m[key]

if !ok && read.amended {

delete(m.dirty, key)

}

m.mu.Unlock()

}

if ok {

e.delete()

}

}

func (e *entry) delete() (hadValue bool) {

for {

p := atomic.LoadPointer(&e.p)

if p == nil || p == expunged {

return false

}

if atomic.CompareAndSwapPointer(&e.p, p, nil) {

return true

}

}

}

同样以刚刚压测原生加锁Map和分段锁的方式来压测sync.Map

压测平均下来sync.Map和分段锁差别不大,但是比起分段锁, sync.Map则将锁的粒度更加的细小到对数据的状态上,使得大多数据可以无锁化操作, 同时比分段锁拥有更好的拓展性,因为分段锁使用前总是要定一个分片数量, 在做扩容或者缩小时很麻烦, 但要达到sync.Map这种性能既好又能动态扩容的程度,代码就相对复杂很多。

还有注意在使用sync.Map时切忌不要将其拷贝, go源码中有对sync.Map注释到” A Map must not be copied after first use.”因为当sync.Map被拷贝之后, Map类型的dirty还是那个map 但是read 和 锁却不是之前的read和锁(都不在一个世界你拿什么保护我), 所以必然导致并发不安全(为了写博我把sync.Map代码复制出来一份把私有成员改成可外部访问的打印指针)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/486026.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

动态规划--Leetcode63.不同路径二

一个机器人位于一个 m x n 网格的左上角 &#xff08;起始点在下图中标记为“Start” &#xff09;。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角&#xff08;在下图中标记为“Finish”&#xff09;。 现在考虑网格中有障碍物。那么从左上角到右下角将…

IEEE:2021年的机遇、挑战以及关键的科技趋势

来源&#xff1a;笑看国际风云【导读】近日&#xff0c;一直致力于通过推动科技进步以造福全人类、全球最大的专业技术组织IEEE&#xff08;电气电子工程师学会&#xff09;&#xff0c;发布了《IEEE全球CIO、CTO访问调研&#xff1a;2021年的机遇和挑战&#xff0c;以及关键的…

MRTG在Windows平台的安装及使用

MRTG (Multi Router Traffic Grapher)是一款监控网络流量负载的免费软件&#xff0c;目前利用MRTG已经开发出了各式各样的统计系统&#xff1a; 1&#xff0e;系统资源负载统计&#xff0c;例如&#xff1a;磁盘空间、CPU负载、内存用量等等 2&#xff0e;Server流量统计&#…

计算机教室应用计划,计算机教室新学期工作计划

无论是单位还是个人&#xff0c;有了工作计划&#xff0c;工作就有了明确的目标和具体的步骤&#xff0c;就可以协调大家的行动&#xff0c;增强工作的主动性&#xff0c;使工作有条不紊地进行。下面是小编整理的计算机教室新学期工作计划&#xff0c;欢迎大家参考!计算机教室新…

语音识别中强制对齐_一种在线语音文本对齐系统及方法

专利名称&#xff1a;一种在线语音文本对齐系统及方法技术领域&#xff1a;本发明涉及电视字幕显示领域&#xff0c;特别涉及一种在线语音文本对齐系统及方法。背景技术&#xff1a;一个国家电视字幕节目的比例&#xff0c;反应了一个国家的人文水平&#xff0c;反应了社会对残…

动态规划--Leetcode121.买卖股票的最佳时机

给定一个数组&#xff0c;它的第 i 个元素是一支给定股票第 i 天的价格。 如果你最多只允许完成一笔交易&#xff08;即买入和卖出一支股票&#xff09;&#xff0c;设计一个算法来计算你所能获取的最大利润。 注意你不能在买入股票前卖出股票。 示例 1: 输入: [7,1,5,3,6,…

Gradle 下载不了

可自行下载对应的 gradle-x.x-all.zip 放在下列目录 C:\Users\penno\.gradle\wrapper\dists\gradle-4.4-all\9br9xq1tocpiv8o6njlyu5op1 转载于:https://www.cnblogs.com/ouuy/p/9057358.html

边缘AI是内存技术发展的催化剂

来源&#xff1a;北京物联网智能技术应用协会人工智能的崛起&#xff0c;对内存系统提出了一些新要求。今天的内存技术能够满足AI时代下的新应用吗&#xff1f;从长远来看&#xff0c;新兴内存技术对边缘 AI有什么前景?首先要意识到的是“边缘AI”应用没有特定标准;“边缘”在…

一级计算机B理论知识和答案,计算机一级B基础知识选择题答案.doc

计算机一级B基础知识选择题答案.doc计算机基础知识选择题(1)世界上第一台电子计算机诞生于_______年。A)1969B)1946C)1935D)1956【解析】世界上第一台电子数字计算机ENIAC于1946年4月12日诞生于美国。(2)冯诺依曼研制的存储计算机名称是_______。A)EDVAC B)ENIACC)EDSAC D)MARK…

金叉成功率_一个非常强烈的买卖信号:三金叉见顶,三死叉见底,短短10字,但是成功率却远超“金叉买,死叉卖”...

(本文由公众号越声投顾(yslcw927))整理&#xff0c;仅供参考&#xff0c;不构成操作建议。如自行操作&#xff0c;注意仓位控制和风险自负。)为什么做交易的人95%是要被市场打败出局?一、炒股最困难的不是选股&#xff0c;也不是买卖&#xff0c;而是等待;人生最困难的不是努力…

动态规划--Leetcode64.最小路径和

给定一个包含非负整数的 m x n 网格&#xff0c;请找出一条从左上角到右下角的路径&#xff0c;使得路径上的数字总和为最小。 说明&#xff1a;每次只能向下或者向右移动一步。 示例: 输入: [ [1,3,1], [1,5,1], [4,2,1] ] 输出: 7 解释: 因为路径 1→3→1→1→1 的总…

洛谷 P1824 进击的奶牛 【二分答案】(求最大的最小值)

题目链接&#xff1a;https://www.luogu.org/problemnew/show/P1824 题目描述 Farmer John建造了一个有N(2<N<100,000)个隔间的牛棚&#xff0c;这些隔间分布在一条直线上&#xff0c;坐标是x1,...,xN (0<xi<1,000,000,000)。 他的C(2<C<N)头牛不满于隔间的位…

《中国基础研究竞争力报告2020》发布,6图表速览报告核心结论

来源&#xff1a; 科学出版社持续跟踪先进国家基础研究发展态势&#xff0c;准确研判我国基础研究竞争力&#xff0c;科学筹划基础研究发展&#xff0c;对于打造科技核心竞争力、构筑先发优势、蓄积长远发展原动力&#xff0c;具有重要战略意义。为了支撑科技创新&#xff0c;中…

异步通信在生活中的例子_AJAX简单异步通信实例分析

本文实例讲述了AJAX简单异步通信的方法。分享给大家供大家参考。具体分析如下&#xff1a;客户端&#xff1a;向服务器发出一个空请求。代码如下&#xff1a;XMLHttpRequestvar xmlHttp;function createXMLHttpRequest(){if(window.ActiveXObject)xmlHttp new ActiveXObject(&…

计算机仿真在机械行业中的应用,计算机仿真技术机械行业应用

计算机仿真技术在机械行业应用计算机仿真技术在机械行业应用14级在职机械工程硕士 刘中华摘 要: 计算机仿真技术是以多种学科和理论为基础&#xff0c;以计算机及其相应的软件为工具&#xff0c;通过虚拟试验的方法来分析和解决问题的一门综合性技术。计算机仿真(模拟)早期称为…

svn 修改文件的可执行权限

设置svn可执行权限&#xff0c;svn:executable 1)svn propset svn:executable on 文件名&#xff0f;文件夹名 2)svn propset svn:executable on test.c svn ci 转载于:https://www.cnblogs.com/wangliangblog/p/9072690.html

「九章」刷屏的背后:万字长文解析,量子计算机和电子计算机各有何优劣?

来源&#xff1a;机器学习研究组订阅号近日&#xff0c;中科大校友、UC伯克利在读博士、知乎用户SIY.Z 在一篇近两万字的长文中&#xff0c;详细分析了“量子计算机和传统电子计算机在算法方面的优劣势”。以下是原文内容:这是一篇我很早以前就想写的文章。我的目的是给稍有数学…

关于计算机的网络作文,关于网络世界的作文

关于网络世界的作文在学习、工作乃至生活中&#xff0c;大家对作文都不陌生吧&#xff0c;根据写作命题的特点&#xff0c;作文可以分为命题作文和非命题作文。那么你有了解过作文吗&#xff1f;以下是小编精心整理的关于网络世界的作文&#xff0c;欢迎阅读&#xff0c;希望大…

python实现邮件客户端_利用python实现简单的邮件发送客户端示例

脚本过于简单&#xff0c;供学习和参考。主要了解一下smtplib库的使用和超时机制的实现。使用signal.alarm实现超时机制。#!/usr/bin/env python# -*- coding: utf-8 -*-import timeimport sysimport loggingimport smtplibimport socketimport signalimport ConfigParserfrom …

xml--Schema约束

<?xml version"1.0" encoding"UTF-8"?> <!-- xmlns: xml namespace&#xff1a;名称空间/ 命名空间 targeNamespace&#xff1a;目标名称空间&#xff0c;下面定义的那些元素都与这个名称空间绑定上 elementFormDefault&#xff1a; 元素的格式…