一次 .NET Core 中玩锁的经历:ManualResetEventSlim, SemaphoreSlim

最近同事对  .net core memcached 缓存客户端 EnyimMemcachedCore 进行了高并发下的压力测试,发现在 linux 上高并发下使用 async 异步方法读取缓存数据会出现大量失败的情况,比如在一次测试中,100万次读取缓存,只有12次成功,999988次失败,好恐怖。如果改为同步方法,没有一次失败,100%成功。奇怪的是,同样的压力测试程序在 Windows 上异步读取却没问题,100%成功。

排查后发现是2个地方使用的锁引起的,一个是 ManualResetEventSlim ,一个是 Semaphore ,这2个锁是在同步方法中使用的,但 aync 异步方法中调用了这2个同步方法,我们来分别看一下。

使用 ManualResetEventSlim 是在创建 Socket 连接时用于控制连接超时

var args = new SocketAsyncEventArgs();
using (var mres = new ManualResetEventSlim())
{
args.Completed
+= (s, e) => mres.Set();
if (socket.ConnectAsync(args))
{
if (!mres.Wait(timeout))
{
throw new TimeoutException("Could not connect to " + endpoint);
}
}
}

使用 Semaphore 是在从 EnyimMemcachedCore 自己实现的 Socket 连接池获取 Socket 连接时

if (!this.semaphore.WaitOne(this.queueTimeout))
{
message
= "Pool is full, timeouting. " + _endPoint;
if (_isDebugEnabled) _logger.LogDebug(message);
result.Fail(message,
new TimeoutException());

// everyone is so busy
return result;
}

为了弃用这个2个锁造成的异步并发问题,采取了下面2个改进措施:

1)对于 ManualResetEventSlim ,参考 corefx 中 SqlClient 的 SNITcpHandle 的实现,改用 CancellationTokenSource 控制连接超时

var cts = new CancellationTokenSource();
cts.CancelAfter(timeout);
void Cancel()
{
if (!socket.Connected)
{
socket.Dispose();
}
}
cts.Token.Register(Cancel);

socket.Connect(endpoint);
if (socket.Connected)
{
connected
= true;
}
else
{
socket.Dispose();
}

2)对于 Semaphore ,根据同事提交的 PR ,将 Semaphore 换成 SemaphoreSlim ,用 SemaphoreSlim.WaitAsync 方法等待信号量锁

if (!await this.semaphore.WaitAsync(this.queueTimeout))
{
message
= "Pool is full, timeouting. " + _endPoint;
if (_isDebugEnabled) _logger.LogDebug(message);
result.Fail(message,
new TimeoutException());

// everyone is so busy
return result;
}

改进后,压力测试结果立马与同步方法一样,100% 成功!

为什么会这样?

我们到 github 的 coreclr 仓库(针对 .net core 2.2)中看看 ManualResetEventSlim 与 Semaphore 的实现源码,看能否找到一些线索。

(一)

先看看 ManualResetEventSlim.Wait 方法的实现代码(523开始):

1)先 SpinWait 等待

var spinner = new SpinWait();
while (spinner.Count < spinCount)
{
spinner.SpinOnce(sleep1Threshold:
-1);

if (IsSet)
{
return true;
}
}

SpinWait 等待时间比较短,不会造成长时间阻塞线程。

在高并发下大量线程在争抢锁,所以大量线程在这个阶段等不到锁。

2)然后 Monitor.Wait 等待

try
{
// ** the actual wait **
if (!Monitor.Wait(m_lock, realMillisecondsTimeout))
return false; //return immediately if the timeout has expired.
}
finally
{
// Clean up: we're done waiting.
Waiters = Waiters - 1;
}

Monitor.Wait 对应的实现代码

[MethodImplAttribute(MethodImplOptions.InternalCall)]
private static extern bool ObjWait(bool exitContext, int millisecondsTimeout, object obj);

public static bool Wait(object obj, int millisecondsTimeout, bool exitContext)
{
if (obj == null)
throw (new ArgumentNullException(nameof(obj)));
return ObjWait(exitContext, millisecondsTimeout, obj);
}

最终调用的是一个本地库的 ObjWait 方法。

查阅一下 Monitor.Wait 方法的帮助文档:

Releases the lock on an object and blocks the current thread until it reacquires the lock. If the specified time-out interval elapses, the thread enters the ready queue.

Monitor.Wait 的确会阻塞当前线程,这在异步高并发下会带来问题,详见一码阻塞,万码等待:ASP.NET Core 同步方法调用异步方法“死锁”的真相。

(二)

再看看 Semaphore 的实现代码,它继承自 WaitHandle , Semaphore.Wait 实际调用的是 WaitHandle.Wait ,后者调用的是 WaitOneNative ,这是一个本地库的方法

[MethodImplAttribute(MethodImplOptions.InternalCall)]
private static extern int WaitOneNative(SafeHandle waitableSafeHandle, uint millisecondsTimeout, bool hasThreadAffinity, bool exitContext);

.net core 3.0 中有些变化,这里调用的是 WaitOneCore 方法

[MethodImpl(MethodImplOptions.InternalCall)]
private static extern int WaitOneCore(IntPtr waitHandle, int millisecondsTimeout);

查阅一下 WaitHandle.Wait 方法的帮助文档: 

Blocks the current thread until the current WaitHandle receives a signal, using a 32-bit signed integer to specify the time interval in milliseconds.

WaitHandle.Wait 也会阻塞当前线程。

2个地方在等待锁时都会阻塞线程,难怪高并发下会出问题。

(三)

接着阅读 SemaphoreSlim 的源码学习它是如何在 WaitAsync 中实现异步等待锁的?

public Task<bool> WaitAsync(int millisecondsTimeout, CancellationToken cancellationToken)
{
//...

lock (m_lockObj!)
{
// If there are counts available, allow this waiter to succeed.
if (m_currentCount > 0)
{
--m_currentCount;
if (m_waitHandle != null && m_currentCount == 0) m_waitHandle.Reset();
return s_trueTask;
}
else if (millisecondsTimeout == 0)
{
// No counts, if timeout is zero fail fast
return s_falseTask;
}
// If there aren't, create and return a task to the caller.
// The task will be completed either when they've successfully acquired
// the semaphore or when the timeout expired or cancellation was requested.
else
{
Debug.Assert(m_currentCount
== 0, "m_currentCount should never be negative");
var asyncWaiter = CreateAndAddAsyncWaiter();
return (millisecondsTimeout == Timeout.Infinite && !cancellationToken.CanBeCanceled) ?
asyncWaiter :
WaitUntilCountOrTimeoutAsync(asyncWaiter, millisecondsTimeout, cancellationToken);
}
}
}

重点看 else 部分的代码,SemaphoreSlim.WaitAsync 造了一个专门用于等待锁的 Task —— TaskNode ,CreateAndAddAsyncWaiter 就用于创建 TaskNode 的实例

private TaskNode CreateAndAddAsyncWaiter()
{
// Create the task
var task = new TaskNode();

// Add it to the linked list
if (m_asyncHead == null)
{
m_asyncHead
= task;
m_asyncTail
= task;
}
else
{
m_asyncTail.Next
= task;
task.Prev
= m_asyncTail;
m_asyncTail
= task;
}

// Hand it back
return task;
}

从上面的代码看到 TaskNode 用到了链表,神奇的等锁专用 Task —— TaskNode 是如何实现的呢?

private sealed class TaskNode : Task<bool>
{
internal TaskNode? Prev, Next;
internal TaskNode() : base((object?)null, TaskCreationOptions.RunContinuationsAsynchronously) { }
}

好简单!

那 SemaphoreSlim.WaitAsync 如何用 TaskNode 实现指定了超时时间的锁等待?

看 WaitUntilCountOrTimeoutAsync 方法的实现源码:

private async Task<bool> WaitUntilCountOrTimeoutAsync(TaskNode asyncWaiter, int millisecondsTimeout, CancellationToken cancellationToken)
{
// Wait until either the task is completed, timeout occurs, or cancellation is requested.
// We need to ensure that the Task.Delay task is appropriately cleaned up if the await
// completes due to the asyncWaiter completing, so we use our own token that we can explicitly
// cancel, and we chain the caller's supplied token into it.
using (var cts = cancellationToken.CanBeCanceled ?
CancellationTokenSource.CreateLinkedTokenSource(cancellationToken,
default(CancellationToken)) :
new CancellationTokenSource())
{
var waitCompleted = Task.WhenAny(asyncWaiter, Task.Delay(millisecondsTimeout, cts.Token));
if (asyncWaiter == await waitCompleted.ConfigureAwait(false))
{
cts.Cancel();
// ensure that the Task.Delay task is cleaned up
return true; // successfully acquired
}
}

// If we get here, the wait has timed out or been canceled.

// If the await completed synchronously, we still hold the lock. If it didn't,
// we no longer hold the lock. As such, acquire it.
lock (m_lockObj)
{
// Remove the task from the list. If we're successful in doing so,
// we know that no one else has tried to complete this waiter yet,
// so we can safely cancel or timeout.
if (RemoveAsyncWaiter(asyncWaiter))
{
cancellationToken.ThrowIfCancellationRequested();
// cancellation occurred
return false; // timeout occurred
}
}

// The waiter had already been removed, which means it's already completed or is about to
// complete, so let it, and don't return until it does.
return await asyncWaiter.ConfigureAwait(false);
}

用 Task.WhenAny 等待 TaskNode 与 Task.Delay ,等其中任一者先完成,简单到可怕。

又一次通过 .net core 源码欣赏了高手是怎么玩转 Task 的。

【2019-5-6更新】

今天将 Task.WhenAny + Task.Delay 的招式用到了异步连接 Socket 的超时控制中

var connTask = _socket.ConnectAsync(_endpoint);
if (await Task.WhenAny(connTask, Task.Delay(_connectionTimeout)) == connTask)
{
await connTask;
}

原文地址:https://www.cnblogs.com/dudu/p/10812139.html

.NET社区新闻,深度好文,欢迎访问公众号文章汇总 http://www.csharpkit.com 
640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/315863.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis作者antirez:开源维护者的挣扎

这两天&#xff0c;一篇名为《开源维护者的挣扎》的文章被迅速顶至 Hacker News 首页&#xff0c;这是 Redis 作者 antirez 发布的最新博客。几个月前&#xff0c;一名开源项目的维护者向 antirez 发邮件&#xff0c;倾诉自己苦心维护项目多年&#xff0c;这或多或少带来了一些…

黑科技抢先尝(续) - Windows terminal中WSL Linux 终端的极简美化指南

之前&#xff0c;本人写了两篇文章 黑科技抢先尝 | Windows全新终端初体验(附代码Build全过程) 和 程会玩 | 无需自行编译也能玩转 Windows Terminal&#xff0c;介绍了玩转Windows terminal的两种方式。今天这篇文章&#xff0c;主要介绍如何美化 Windows terminal 中 WSL 的 …

P3203 [HNOI2010]弹飞绵羊

P3203 [HNOI2010]弹飞绵羊 题目描述 详见&#xff1a;P3203 [HNOI2010]弹飞绵羊 solution 这是一道LCT的裸题。 但是我并不想用LCT解决此题&#xff08;In fact 是不会LCT ~QAQ&#xff09; 于是我们开始大力分块。 考虑把弹跳装置分块&#xff0c;我们每次需要知道在一…

L - Two Ants Gym - 102823L

L - Two Ants Gym - 102823L 题意&#xff1a; 有两个线段A&#xff0c;B&#xff0c;两个线段不会超过一个公共点&#xff0c; 你站在线段B上&#xff0c;整个平面你看不到的区域的面积(如图中S所在区域) 题解&#xff1a; 计算几何&#xff0c;恶心题。调了一个小时还是…

C# 8.0 中开启默认接口实现

当你升级到 C# 8.0 和 .NET Core 3.0 之后&#xff0c;你就可以开始使用默认接口实现的功能了。从现在开始&#xff0c;你可以在接口里面添加一些默认实现的成员&#xff0c;避免在接口中添加成员导致大量对此接口的实现崩溃。要写出并且正常使用接口的默认实现&#xff0c;你需…

P4396 [AHOI2013]作业

P4396 [AHOI2013]作业 题目描述 详见&#xff1a;P4396 [AHOI2013]作业 solution 莫队树状数组的裸题&#xff08;莫队分块&#xff0c;CDQ分治都可以&#xff0c;莫队线段树大概需要卡常&#xff09;。 时间复杂度 Code #include<bits/stdc.h> using namespac…

在编写异步方法时,使用 ConfigureAwait(false) 避免使用者死锁

我在 使用 Task.Wait()&#xff1f;立刻死锁&#xff08;deadlock&#xff09; 一文中站在类库使用者的角度看 async/await 代码的死锁问题&#xff1b;而本文将站在类库设计者的角度来看死锁问题。阅读本文&#xff0c;我们将知道如何编写类库代码&#xff0c;来尽可能避免类库…

韩国政府计划从Windows 7迁移到Linux

据《韩国先驱报》的报道&#xff0c;韩国内政部于上周四表示&#xff0c;韩国政府计划将其用于办公的计算机操作系统从 Windows 迁移至 Linux。当然不是马上全面迁移 —— 内政部将会“第一个吃螃蟹”。他们准备在其 PC 上试运行 Linux&#xff0c;如果没有出现安全问题&#x…

黑科技抢先尝(续2) - Windows terminal中Powershell Tab的美化全攻略

温馨提示: 原文中含有一些外部链接&#xff0c;点击全文左下角的"阅读原文"体验会更佳喔~ 接着之前的文章 黑科技抢先尝(续) - Windows terminal中WSL Linux 终端的极简美化指南&#xff0c;依然假定你安装好了windows terminal预编译版本。这次我的目标是将PowerShe…

P1712 [NOI2016]区间

P1712 [NOI2016]区间 题目描述 P1712 [NOI2016]区间 Solution 尺取法线段树 一个显然的想法是按区间长度排序。 每一次多选取一个区间相当于区间覆盖次数加1&#xff0c;每一次少选取一个区间就有区间覆盖次数减1。 可以用线段树维护区间覆盖次数的最大值。 于是转化成…

.NET开发人员如何开始使用ML.NET

随着谷歌&#xff0c;Facebook发布他们的工具机器学习工具Tensorflow 2和PyTorch &#xff0c;微软的CNTK 2.7之后不再继续更新&#xff08;https://docs.microsoft.com/zh-cn/cognitive-toolkit/releasenotes/cntk_2_7_release_notes&#xff09;&#xff0c;Build 2019 微软也…

CF1271D Portals

CF1271D Portals 题意&#xff1a; 题意选自洛谷 题解&#xff1a; 首先要先发现性质&#xff1a;对于任何一个城堡u&#xff0c;如果要往u驻军&#xff0c;则在攻占编号最大的能向u行军的城堡后再驻军&#xff0c;答案一定不会变劣。你想想&#xff0c;如果后面有编号更大…

P2605 [ZJOI2010]基站选址

P2605 [ZJOI2010]基站选址 题目描述 详见&#xff1a;P2605 [ZJOI2010]基站选址 Solution 首先不难想到一个 的DP。 表示前个村庄选择了个基站的总费用。 考虑如何优化这个转移。 对于村庄&#xff0c;我们记录它覆盖范围内最靠前的村庄 和最靠后的村庄 。 倘若在…

CF980D Perfect Groups

CF980D Perfect Groups 题意&#xff1a; 将一个串划分为多个子集&#xff08;不要求连续&#xff09;&#xff0c;要求同一子集内两任意元素的积为平方数 定义一个串的答案为所需的最少子集个数 一个长度为 n 的串有 n(n1)2\frac{n(n1)}{2}2n(n1)​个非空子串&#xff0c;…

求斐波那契数列第n位的几种实现方式及性能对比

在每一种编程语言里&#xff0c;斐波那契数列的计算方式都是一个经典的话题。它可能有很多种计算方式&#xff0c;例如&#xff1a;递归、迭代、数学公式。哪种算法最容易理解&#xff0c;哪种算法是性能最好的呢&#xff1f;这里给大家分享一下我对它的研究和总结&#xff1a;…

P2305 [NOI2014]购票

P2305 [NOI2014]购票 题目描述 详见&#xff1a;P2305 [NOI2014]购票 Solution 写出一个朴素的DP可以看出显然是一个斜率优化&#xff0c;且是在树上求解答案。 因此用点分治维护树上斜率优化DP。 设现在的重心为&#xff0c;根为&#xff0c;我们需要先递归处理所在的连…

ASP.NET Core 3.0 自动挡换手动挡:在 Middleware 中执行 Controller Action

最近由于发现奇怪的 System.Data.SqlClient 性能问题&#xff08;详见之前的博文&#xff09;&#xff0c;被迫提前了向 .NET Core 3.0 的升级工作&#xff08;3.0 Preview 5 中问题已被修复&#xff09;。郁闷的是&#xff0c;在刚开始对部分项目进行升级的时候就遇到了一个障…

P5327 [ZJOI2019]语言

P5327 [ZJOI2019]语言 题目描述 详见&#xff1a;P5327 [ZJOI2019]语言 简要题意&#xff1a;给定一棵树和一些链&#xff0c;问树上处于同一条链的不同点对数。 Solution 对于每一个点&#xff0c;考虑以它为端点的可行路径有哪些。 我们可以发现&#xff0c;可以到达的…

EasyOffice-.NetCore一行代码导入导出Excel,生成Word

Excel和Word操作在开发过程中经常需要使用&#xff0c;这类工作不涉及到核心业务&#xff0c;但又往往不可缺少。以往的开发方式在业务代码中直接引入NPOI、Aspose或者其他第三方库&#xff0c;工作繁琐&#xff0c;耗时多&#xff0c;扩展性差——比如基础库由NPOI修改为EPPlu…

P4103 [HEOI2014]大工程

P4103 [HEOI2014]大工程 题目描述 详见&#xff1a;P4103 [HEOI2014]大工程 Solution 显然是虚树的板子题啊&#xff08;我也不造我为啥调了1h&#xff09; 直接建虚树&#xff0c;DP。 两两路径和很好求&#xff0c;只要考虑每条边的贡献&#xff0c;设为询问的关键点个…