为了避免多个线程同时操作同一资源,引起数据错误,通常我们会将这个资源加上锁,这样在同一时间只能有一个线程操作资源。在C#中我们使用lock关键字来锁定资源,那lock关键字是如何实现锁定的呢?
我们先看一段代码,非常简单的单例,相信你闭着眼睛也能写出来。代码如下:
上面的代码我就懒得解释了。我们重点关注lock(locker)这行,就是这行限制了多个线程对大括号内代码的同时访问。下面我们就来讲一个原理。不过讲原理之前,还得和大家确认一个知识点,其实lock只是语法糖,其实现其实是Monitor类,所以上面的代码和下面的代码是相等。代码如下:
没有异议的话,我们接着讲。我们还是看lock(locker)这一行,简单地想一想,lock关键字把locker对象锁住了,别的线程就进不来了,那它是怎么锁的呢?是在对象上打了什么标记吗?是把线程ID打到标记吗?我们先看一下堆中locker的对象结构。如下图:
对象在堆中除了数据区以外,还有两片区域:MethodTableRef、SyncBlockValue。其中MethodTableRef是指向MethodTable中这个类型(Type)定义,简单说就是这个对象是什么class定义的,这个不是我们今天讨论的重点,就过了。
我们重点看一下SyncBlockValue,这个值为DWORD类型,占用4个字节,也就是32位。这个值主要用来表示对象的不同功能,具体什么功能,要看这个32位如何赋值。一般将32位分为两段,前6位用以表示不同的功能,后26位用以表示对象的hash值、或者是SyncBlock的索引值。如下图:
回到lock(locker)这个主题上。其实你也应该猜到,如果想实现lock(locker),只要在locker的前六位功能位上设置一个标识位,标识这个对象已经被锁住就行。但具体被哪个线程锁住要记在哪边呢?这时就要用到后面26位了。这时后26位会指向g_pSyncTable的某一项。g_pSyncTable是CLR维护的一个包SyncBlock项的全局数组。这时的结构如下图:
我们结合上图再来回顾一下整个流程:比如有两个线程:线程A、线程B。线程A执行到lock(locker)这一行时,会先检查locker的6个功能位中有没有没锁住标识位(假如第五位表示锁),如果没有锁,则将第五位标为1(不一定是1,这里只是举例),然后到g_pSyncTable数组中申请一个SyncBlock,将当前线程ID等信息记录在里面,然后将这个SyncBlock的地址赋予locker对象的后26位值,这样资源就被线程A锁住了。这时线程B也执行到lock(locker)这一行,它检查前第五位,发现被锁住了,就会到SyncBlock检查锁住的线程ID是否和自己一致,不一致的话,它就会一直等待,直到线程A释放锁。
以上只是粗略地讲述一下锁的底层原理,可能有很多描述不准确的地方,比如哪个功能位表示锁,其实我也不太清楚,但大概原理应该没错。
最后留个问题:如果锁住的对象同时又想获取HashCode,该如何存储并得到呢?