JMM
JVM定义了一种Java内存模型来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果.在此之前,C/C++直接使用物理硬件和操作系统的内存模型,因此,会由于不同平台下的内存模型差异,有可能导致程序在一套平台上并发完全正常,而在另一套平台上并发访问经常出错.
主内存和工作内存
Java内存模型的主要目标是定义程序中各个变量的访问规则,即在JVM中将变量存储到内存和从内存中取出变量这样的底层细节. 此处的变量包括实例字段,静态字段和构成数组对象的元素,但不包括局部变量和方法参数,因为后两者是线程私有的,不会被线程共享.
Java内存模型规定了所有的变量都存储在主内存中,每条线程还有自己的工作内存,线程的工作内存中保存了被该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作(读取/赋值等)都必须在工作内存中进行,而不能直接读写主内存中的变量.不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成.线程,主内存,工作内存三者的交互关系如下所示:
内存间的交互操作
关于主内存与工作内存之间的具体交互协议,即一个变量如何从主内存拷贝到工作内存,如何从工作内存同步回主内存之类的实现细节,Java内存模型中定义了如下8种操作来完成.JVM实现时必须保证下面提及的每一种操作是原子的,不可再分的.
lock(锁定):作用于主内存的变量,它把一个变量标识为一条线程独占的状态.
unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其它线程锁定.
read(读取):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后load动作使用.
load(载入):作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中.
use(使用):作用于工作内存中的变量,它把工作内存中一个变量值传递给执行引擎.
assign(赋值):作用于工作内存中的变量,它把一个从执行引擎接收到的值赋给工作内存变量.
store(存储):作用于工作内存中的变量,它把工作内存中一个变量的值传送到主内存中,以便后续write操作的使用.
write(写入):作用于主内存中的变量,它把store操作从工作内存中得到变量的值放入主内存的变量中.
Java内存模型的三大特性:
原子性:由Java内存模型来直接保证的原子性变量操作包括read, load, assign, use, store和read.大致可以认为,基本数据类型的访问读写是具备原子性的.如果需要更大范围的原子性,需要synchronized关键字约束.(即一个操作或者多个操作要么全部执行并且执行的过程不会被任何因素打断,要么都不执行).
可见性:可见性是指当一个线程修改了共享变量的值,其它线程能够立即得知这个修改.volatile,synchronized,final三个关键字可以实现可见性.
有序性:如果在本线程内观察,所有的操作都是有序的;如果在线程中观察另一个线程,所有的操作都是无序的.前半句是指"线程内表现为串行",后半句是指"指令重排序"和"工作内存和主内存同步延迟现象".
Java内存模型具备一些先天的"有序性",即不需要通过任何手段就能够得到保证的有序性,这个通常也称为happens-before原则.如果两个操作的执行次序无法从happens-before原则推导出来,那么它们就不能够保证它们的有序性,虚拟机可以随意地对它们进行重排序.
下面就来具体介绍一下happens-before原则(现行发生原则):
程序次序规则:一个线程内,按照代码顺序,书写在前面的操作现行发生于书写在后面的操作.
锁定规则:一个unLock操作先行发生于后面对同一个锁的lock操作.
volatile变量规则:对一个变量的写操作先行发生于后面对这个变量的读操作.
传递规则:如果操作A现行发生于操作B,而操作B又现行发生于操作C,则可以得出操作A现行发生于操作C
线程启动规则:Thread对象的start()方法先行发生于此线程的每一个动作.
线程中断规则:对线程interrupt()方法的调用先行发生于被中断线程的代码.
线程终结规则:线程中所有的操作都先行发生于线程的终止检测,我们可以通过Thread.join()方法结束,Thread.isAlive()的返回值手段检测到线程已经终止运行.
对象终结规则:一个对象的初始化完成先行于它的finalize()方法(用于在对象被垃圾回收器回收之前执行一些清理操作)的开始.
也就是说,想要并发程序正确地执行,必须要保证原子性,可见性以及有序性.只要有一个没有被保证,就有可能会导致程序运行不正确.