Go微服务: redis分布式锁在集群中可能遇到的问题及其解决方案

概述

  • 我们的 redis 一般都是集群来给我们程序提供服务的,单体的redis现在也不多见
  • 看到上面是主节点redis和下面是6个重节点redis,主节点和重节点的通讯都是畅通没问题的
  • 这个时候,我们有 gorouting 写我们的数据,那它就会用到我们的setNX
  • 写完数据内部是自动同步的,就是你的这个数据通过主节点同步到这些从节点了
  • 下面又有我们的 gorouting 去读我们的从节点,但是,我们是在高并发和网络不确定的情况下可能会遇到一些问题

可能会遇到的一些问题


1 )集群方面

  • 如果,我们上面是一个gorouting,在主节点上,它用setNX写数据,如果主节点挂了
  • 集群就从我们的所有子节点中抽取一个节点,当成主节点顶上去,集群又可以正常工作了
  • 这个时候,有一个gorouting在右下角,它又来读数据了,由于我们上面刚写了数据
  • 还没有来得及同步到最后一个 redis 这个节点上, 但是面临着新的gorouting读取数据或操作
  • 这个时候最后这一台redis它是拿不到那个锁的,是没有同步到的
  • 最后来的 gorouting,就认为你没有锁, 或者说我要的资源,你没锁住
  • 那其他 gorouting 就认为它是无主的, 就可以锁, 这个时候就会造成一些问题

2 )网络方面

  • 正常的时候,写数据还有下面的从节点去获取数据,获取锁,都是没问题的
  • 如果是网络抖动或不通会有一些问题,由于redis它是网络传输的
  • 如果说我们右边的这网络络不通了,相当于右边的 redis 没有和主节点通讯
  • 这个时候我们的一个gorouting就来获取锁进行数据的操作
  • 如果这个时候,我要操作的资源没有上锁,那这个gorouting就认为它是还没有被加锁,就把这个锁锁上了
  • 所以这个地方也是有可能出问题的风险

解决方案


1 )使用 redLock

  • 锁不住资源,有可能因为节点挂了或网络抖动, 我们现在尝试使用 redLock 来解决这一个问题
  • redLock它没有master节点,也没有这个slave从节点,都是独立的
  • 每一个redis,都是有一个 SetNx 这么一个锁, 现在有两个协程来申请锁
  • redis集群的一般是7个,而不是说双数的, 如果双数的那我左边的 gorouting 获得3个
  • 右边的 gorouting 获得3个,他就要重新再做选举投票之类的东西
  • 基于redLock, 当左边的 gorouting 抢到了4个,那右边的只有3个就应该释放掉
  • 为下一次再运行做准备,右边这个锁就消失了

2 ) 源码

  • redlock把原来的master,slave这种模式改成了平等的模式,最终解决了问题

2.1 ) NewMutex

  • 在源码的 NewMutex 函数中
    // NewMutex returns a new distributed mutex with given name.
    func (r *Redsync) NewMutex(name string, options ...Option) *Mutex {m := &Mutex{name:   name,expiry: 8 * time.Second,tries:  32, // 重试 32 次delayFunc: func(tries int) time.Duration {return time.Duration(rand.Intn(maxRetryDelayMilliSec-minRetryDelayMilliSec)+minRetryDelayMilliSec) * time.Millisecond},genValueFunc:  genValue,driftFactor:   0.01, // 漂移因子timeoutFactor: 0.05, // 超时因子quorum:        len(r.pools)/2 + 1, // 法定数,找一半+1,大多数pools:         r.pools,}for _, o := range options {o.Apply(m)}if m.shuffle {randomPools(m.pools)}return m
    }
    
  • 上面 driftFactor 是说我们的服务器的时钟漂移
    • 比如说我们的A服务器是中午12点,但是B服务器是中午11点59分30秒
    • C服务器是中午的12点0分30秒,相当于它们每台服务器相差30秒
    • 这就是服务器的时间漂移,它不准,那这会导致什么呢?
  • 假如说我们的这个过期时间是8秒,那你差了30秒,肯定就是有的服务器会先释放锁
  • 那先释放锁,其他人就可以拿到锁,所以他就设置了一个因子
  • 关于 quorum 就如同上面的例子,7台服务器拿到了4台就是成功的

2.2 ) Lock

  • 回到锁定的函数 Lock 中,进入其 lockContext
    // lockContext locks m. In case it returns an error on failure, you may retry to acquire the lock by calling this method again.
    func (m *Mutex) lockContext(ctx context.Context, tries int) error {if ctx == nil {ctx = context.Background()}// 获取 base64 的值value, err := m.genValueFunc()if err != nil {return err}var timer *time.Timer// 对默认32次循环的操作for i := 0; i < tries; i++ {if i != 0 {if timer == nil {timer = time.NewTimer(m.delayFunc(i))} else {timer.Reset(m.delayFunc(i))}select {// 如果 完成 状态,则返回 ErrFailedcase <-ctx.Done():timer.Stop()// Exit early if the context is done.return ErrFailed// 没有完成,则不动case <-timer.C:// Fall-through when the delay timer completes.}}start := time.Now()// 拿到计数器和错误信息n, err := func() (int, error) {ctx, cancel := context.WithTimeout(ctx, time.Duration(int64(float64(m.expiry)*m.timeoutFactor)))defer cancel()/// 注意这里,最终的函数就是执行的这里return m.actOnPoolsAsync(func(pool redis.Pool) (bool, error) {return m.acquire(ctx, pool, value)})}()now := time.Now()// 下面是核心算法: 过期时间 - 拿锁的时间 - 漂移因子可能的时间until := now.Add(m.expiry - now.Sub(start) - time.Duration(int64(float64(m.expiry)*m.driftFactor)))// 判断是否是大多数并且没有过期,则直接进行赋值if n >= m.quorum && now.Before(until) {m.value = valuem.until = untilreturn nil}// 否则 release 进行释放_, _ = func() (int, error) {ctx, cancel := context.WithTimeout(ctx, time.Duration(int64(float64(m.expiry)*m.timeoutFactor)))defer cancel()return m.actOnPoolsAsync(func(pool redis.Pool) (bool, error) {return m.release(ctx, pool, value)})}()if i == tries-1 && err != nil {return err}}return ErrFailed
    }
    
  • 进入 actOnPoolsAsync 这里参数是一个函数
    func (m *Mutex) actOnPoolsAsync(actFn func(redis.Pool) (bool, error)) (int, error) {type result struct {node     intstatusOK boolerr      error}// 创建 channelch := make(chan result, len(m.pools))// 循环 poolsfor node, pool := range m.pools {// 开协程提速go func(node int, pool redis.Pool) {r := result{node: node}r.statusOK, r.err = actFn(pool)ch <- r}(node, pool)}var (n     = 0 // 计数器taken []interr   error // 错误)// 循环 poolsfor range m.pools {// 从 channel 中拿到结果r := <-chif r.statusOK {n++ // 计数器加加} else if r.err == ErrLockAlreadyExpired {err = multierror.Append(err, ErrLockAlreadyExpired)} else if r.err != nil {err = multierror.Append(err, &RedisError{Node: r.node, Err: r.err})} else {taken = append(taken, r.node)err = multierror.Append(err, &ErrNodeTaken{Node: r.node})}if m.failFast {// fast retrunif n >= m.quorum {return n, err}// fail fastif len(taken) >= m.quorum {return n, &ErrTaken{Nodes: taken}}}}if len(taken) >= m.quorum {return n, &ErrTaken{Nodes: taken}}return n, err
    }
    
  • 以上就是 redLock 源码锁的机制,通过源代码可以更好的理解框架
  • 即使上面一些细节点看不懂,跳过即可,前期可以先看大的实现脉络帮助我们理解

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/31660.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

(Python)可变类型不可变类型;引用传递值传递;浅拷贝深拷贝

从一段代码开始说事&#xff0c;先上代码&#xff1a; a [[1],[2],[3]] b [[4,5],[6,7],[7,8]] for i,j in zip(a,b):print(i,j)i [9]#i[0] 8j[:2][1,2]print(i, j) print(a) print(b) 运行的结果&#xff1a; [1] [4, 5] [9] [1, 2] [2] [6, 7] [9] [1, 2] [3] [7, 8] …

Homebrew使用

官网&#xff1a;https://brew.sh/ 安装&#xff1a; 简介&#xff1a;https://www.jianshu.com/p/f4c9cf0733ea 比如&#xff0c;安装maven: 1、brew install maven 2、查看安装路径&#xff1a;brew list maven 具体参考&#xff1a;https://blog.csdn.net/m0_67402970/arti…

MPLS-LDP(个人学习笔记)

定义 标签分发协议LDP&#xff08;Label Distribution Protocol&#xff09;是多协议标签交换MPLS的一种控制协议&#xff0c;负责转发等价类FEC的分类、标签的分配以及标签交换路径LSP的建立和维护等操作。LDP规定了标签分发过程中的各种消息以及相关处理过程 术语 LDP会话&a…

【尚庭公寓SpringBoot + Vue 项目实战】移动端找房功能(二十一)

【尚庭公寓SpringBoot Vue 项目实战】移动端找房功能&#xff08;二十一&#xff09; 文章目录 【尚庭公寓SpringBoot Vue 项目实战】移动端找房功能&#xff08;二十一&#xff09;1、业务介绍2、接口开发2.1、地区信息2.2、获取全部支付方式列表2.3、房间信息2.2.1. 根据条…

python基础1.1-格式化输出(%用法和format用法)

目录 %用法 format用法 %用法 1、整数的输出 %o —— oct 八进制 %d —— dec 十进制 %x —— hex 十六进制 1 >>> print(%o % 20) 2 24 3 >>> print(%d % 20) 4 20 5 >>> print(%x % 20) 6 142、浮点数输出 &#xff08;1&#xff09;格式化…

鸿蒙开发系统基础能力:【@ohos.accessibility (辅助功能)】

辅助功能 说明&#xff1a; 本模块首批接口从 API version 7 开始支持。后续版本的新增接口&#xff0c;采用上角标单独标记接口的起始版本。 导入模块 import accessibility from ohos.accessibility;AbilityState 辅助应用状态类型。 系统能力&#xff1a;以下各项对应的…

智能体合集

海外版coze: 前端代码助手 后端代码助手&#xff1a; 前端代码助手&#xff1a;

添加右键菜单(以git为例)

1、打开注册表编辑器 打开系统注册表&#xff0c;使用组合键“Win R”输入“regedit”。 依次展开”HKEY_CLASSES_ROOT\Directory\Background\shell”。 2、新建右键菜单项 在[Background]下找到“shell”如果没有则新建项shell&#xff0c;接着在“shell”下右键-新建项名…

基于DPU的云原生裸金属网络解决方案

1. 方案背景和挑战 裸金属服务器是云上资源的重要部分&#xff0c;其网络需要与云上的虚拟机和容器互在同一个VPC下&#xff0c;并且能够像容器和虚拟机一样使用云的网络功能和能力。 传统的裸金属服务器使用开源的 OpenStack Ironic 组件&#xff0c;配合 OpenStack Neutron…

修改主频睡眠模式停止模式待机模式

代码示例&#xff1a; 接线图&#xff1a;修改主频 接线图&#xff1a;睡眠模式串口发送接收 CH340 USB转串口模块。GND和stm32共地。RXD接PA9&#xff0c;TXD接PA10。 接线图&#xff1a;停止模式对射式红外传感器计次 对射式红外传感器模块的VCC和GND接上供电。DO输出接S…

张大哥笔记:5种信息差赚钱模式

从古至今&#xff0c;赚钱最快的路子就一个&#xff0c;而且从未改变&#xff0c;那就是信息差&#xff01;在商业活动中&#xff0c;信息不对称现象普遍存在&#xff0c;如果你善于利用这些信息差的话&#xff0c;就可以赚到钱&#xff01; 1、价格的信息差 商品价格在不同地…

python pyautogui实现图片识别点击失败后重试

安装库 pip install Pillow pip install opencv-python confidence作用 confidence 参数是用于指定图像匹配的信度&#xff08;或置信度&#xff09;的&#xff0c;它表示图像匹配的准确程度。这个参数的值在 0 到 1 之间&#xff0c;数值越高表示匹配的要求越严格。 具体来…

ConcurrentHashMap(应对并发问题的工具类)

并发工具类 在JDK的并发包里提供了几个非常有用的并发容器和并发工具类。供我们在多线程开发中进行使用。 5.1 ConcurrentHashMap 5.1.1 概述以及基本使用 在集合类中HashMap是比较常用的集合对象&#xff0c;但是HashMap是线程不安全的(多线程环境下可能会存在问题)。为了…

可一件转化的视频生成模型:快手官方大模型“可灵”重磅来袭!

可一件转化的视频生成模型“可灵”重磅来袭&#xff01; 前言 戴墨镜的蒙娜丽莎 达芬奇的画作《蒙娜丽莎的微笑》相信大家是在熟悉不过了&#xff0c;可《戴墨镜的蒙娜丽莎》大家是不是第一次见&#xff1f;而且这还不是以照片的形式&#xff0c;而是以视频的形式展示给大家。 …

Spring AOP实战--之优雅的统一打印web请求的出参和入参

背景介绍 由于实际项目内网开发&#xff0c;项目保密&#xff0c;因此本文以笔者自己搭建的demo做演示&#xff0c;方便大家理解。 在项目开发过程中&#xff0c;团队成员为了方便调试&#xff0c;经常会在方法的出口和入口处加上log输出&#xff0c;由于每个人的log需求和输…

奔驰EQS SUV升级原厂主动式氛围灯效果展示

以下是一篇关于奔驰 EQs 升级原厂主动氛围灯案例的宣传文案&#xff1a; 在汽车科技不断演进的今天&#xff0c;我们自豪地为您呈现奔驰 EQs 升级原厂主动氛围灯的精彩案例。 奔驰 EQs&#xff0c;作为豪华电动汽车的典范&#xff0c;其卓越品质与高端性能有目共睹。而此次升…

CVPR 2024盛况空前,上海科技大学夺得最佳学生论文奖,惊艳全场

CVPR 2024盛况空前&#xff01;上海科技大学夺得最佳学生论文奖&#xff0c;惊艳全场&#xff01; 会议之眼 快讯 2024 年 CVPR &#xff08;Computer Vision and Pattern Recogntion Conference) 即国际计算机视觉与模式识别会议&#xff0c;于6月17日至21日正在美国西雅图召…

手把手教你java CPU飙升300%如何优化

背景 今天有个项目运行一段时间后&#xff0c;cpu老是不堪负载。 排查 top 命令 TOP 命令 top t 按cpu 排序 top m 按内存使用率排序 从上面看很快看出是 pid 4338 这个进程资源消耗很高。 top -Hp pid top -Hp 4338 找到对应线程消耗的资源shftp cpu占用进行排序&#xf…

【Java】已解决java.net.ProtocolException异常

文章目录 一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项 已解决java.net.ProtocolException异常 在Java的网络编程中&#xff0c;java.net.ProtocolException异常通常表示在网络通信过程中&#xff0c;客户端或服务器违反了某种协议规则。…

计算机组成原理 | 计算机系统概述

CPI:(Clockcycle Per Instruction)&#xff0c;指每条指令的时钟周期数。 时钟周期&#xff1a;对CPU来说&#xff0c;在一个时钟周期内&#xff0c;CPU仅完成一个最基本的动作。时钟脉冲是计算机的基本工作脉冲&#xff0c;控制着计算机的工作节奏。时钟周期 是一个时钟脉冲所…