一、CPU缓存架构与一致性协议
- 1.1 CPU缓存架构
- 1.2 缓存行与伪共享问题
- 1.3 MESI 缓存一致性协议
- 1.4 伪共享的解决办法
二、JMM Java 内存模型
- 2.1 JMM 简介
- 2.2 原子性、可见性、有序性
- 2.3 八大内存交互操作
- 2.4 happens-before 原则

一、CPU缓存架构与一致性协议

1.1 CPU缓存架构

现代 CPU 的发展非常快，内存的速度已经完全跟不上。如果将CPU完成一个基本操作所用的时间定义为时钟周期，那么 CPU 的指令处理速度要比内存的加载速度快100 倍左右。

为了解决这个性能上的鸿沟，现代 CPU 架构往往采用如下图所示的缓存架构：
在这里插入图片描述
在多核CPU和主存（Main Memory）之间引入三级高速缓存——L1、L2、L3。

越靠近CPU的缓存，成本造价越高、性能越强、存储空间越小，其中 L3 缓存是多核共享，而L1、L2 是核内私有。

1.2 缓存行与伪共享问题

缓存行 Cache Line 是高速缓存一次读取内存数据的最小单位。目前最常见的 Intel cpu 的缓存行大小是 64 Bytes。
连续的数据很有可能由于数据跨度恰好在一个缓存行内，就很有可能会被CPU加载到 L1、L2、L3 高速缓存中。

由于高速缓存的存在，引出了缓存一致性协议，它可以保证 L1、L2、L3 中的数据在多核CPU和并发场景下不会出现线程不一致问题。早期的解决方案并不是各种缓存一致性方案，而是采用总线锁的方式。

总线锁，顾名思义就是将高速缓存与主内存之间的总线上锁，只允许一个线程去获取并操作上锁数据，处理完成后释放锁，并将数据从缓存中刷回主存。这种方式虽然安全，但也牺牲了很大的性能。于是，人们又引入了诸如 MESI 的缓存一致性协议。简单的说，就是给缓存数据做标记，如果CPU发现缓存的数据失效了，就必须从主存中重新加载最新的数据。

那什么又是伪共享呢？

伪共享是缓存行加载数据时必然会存在的性能损耗问题。当对象中包含线程局部变量，且尺寸大小小于 64 字节，就有可能发生伪共享问题。

再具体点，内存地址连续的不同变量被加载到了同一个缓存行中，而同一个缓存行中的多个变量，又不一定是CPU所需的，这种情况就是伪共享。

由于伪共享的存在，CPU核心中的高速缓存加载了本不需要数据，又在“缓存一致性协议”的要求下，不得不在这些无用数据失效后重新加载缓存，导致缓存失效，或造成性能损耗：
在这里插入图片描述
如上图所示，x、y 两个变量由 Main Memory 加载到 core 1 和 core 2两个核心的 L1、L2 缓存中。如果线程A、B 跑在两个核心上，且线程 A 修改 core 1 中的 x，由于缓存一致性协议， core 2 中的 x 变量将会失效，它必须从主内存中重新加载，这样频繁的加载、访问主内存， core 2 中的 L1、L2 缓存几乎等于失效。

1.3 MESI 缓存一致性协议

MESI是缓存锁的实现方式之一，注意这是 CPU 缓存一致性，并非通常说的应用缓存。有些无法被缓存的数据或跨多个缓存行的数据依然必须使用总线锁。

MESI 的核心思想是为每个 Cache Line 标记 4 种状态：
在这里插入图片描述

若缓存数据更改过，则将 Cache Line 标记为 M
如果缓存数据是独享，则标记为 E
如果数据是被多个CPU读取，则标记为 S
如果数据被其他CPU修改过，则标记为 I

1.4 伪共享的解决办法

Java 7 之前可以采用字节填充的方式，例如针对不同操作系统和对象头的大小，补齐多个 long 类型的空数据。
但这种方式在 Java 7 的某个版本中会出现 填充失效问题，原因是该版本的虚拟机优化了未使用 field 的排布。

在 Java 8 加入 @Contended 注解会帮助增加128 字节的 padding，并且需要开启 -XX:-RestrictContended 选项才能生效。

虽然解决了伪共享的问题，但是这种填充的方式也浪费了缓存资源，而且缓存又小又贵，时间和空间的取舍要酌情考虑。

二、JMM Java 内存模型

2.1 JMM 简介

JMM 全称是 “Java Memory Model”，Java 内存模型。
因为在不同的硬件生产商和操作系统下，内存的访问方式各有所差异，这样就会造成相同的代码出现不一样的问题，而 JMM 屏蔽掉了各种操作系统的内存访问差异，以实现“Write Once，Run Anywhere”的目标。

JMM 中规定所有的变量都存储在主内存 （Main Mem）中，包括实例变量、静态变量，但是不包括局部变量和方法参数。每条线程都有自己的工作内存（Work Mem），线程私有。工作内存中保存的是线程的变量从主内存中的拷贝副本。

这种结构的基本工作方式是：线程对变量的读和写都必须在工作内存中进行，而线程之间变量值的传递均需要通过主内存来完成。如下图所示，注意与Java 内存结构（堆栈等）等概念区分开。

在这里插入图片描述

2.2 原子性、可见性、有序性

整个 JMM 实际上是围绕着三个并发特征建立起来的——原子性、可见性、有序性。

原子性：和事务的 ACID 的原子性概念一致，即表示一个操作中间不可分割，不能中断，执行过程不允许被其他线程打扰。 JMM 只能保证基本操作的原子性，如果要保证一个代码块的原子性，Java 提供了 synchronized 关键字，它对应了 monitorentrer 和 monitorexit 字节码指令。
可见性：不同的线程对数据的修改结果可以被其他线程感知到，这就是可见性。synchronized 是保证可见性的最常用的操作，除此之外，还有 volatile 关键字，它是较弱的同步机制。
有序性：字节码指令的执行顺序不可重排。可以使用 synchronized 或 volatile 保证多线程之间操作的有序性。volatile是使用内存屏障达到禁止指令重排，保证有序性。而 synchronized 则以互斥锁的形式要求上锁的资源必须按序执行。

2.3 八大内存交互操作

在这里插入图片描述
说是 8 种内存交互操作：

lock 和 unlock：锁定与解锁。作用于主内存的变量，将其设置为线程独占或解除。
Read 和 Write：发生在主内存和工作内存之间，将变量传输到工作内存，将从工作内存得到的值放入主内存中。
Load 和 Store：作用于工作内存的变量，将工作内存中的变量放入副本中，将工作内存中的变量传输到主内存中。
Use 和 Assign：将工作内存中的变量传输到执行引擎，将一个从执行引擎中接收到的值赋值给工作内存的副本。

使用规则：

不允许 read、load、store、write 操作之一单独出现，即 read 操作后必须 load，store后必须 write。
不允许线程丢弃它最近的 assign 操作，即工作内存中的变量修改之后，必须告知主存。
不允许线程将没有 assign 的数据从工作内存同步到主存。
lock 和 unlock 必须成对出现。
新的变量必须由主存中诞生。
如果对一个变量进行 lock，会清空所有工作内存中此变量的值。在执行引擎使用这个变量前，必须重新 load 或 assign 。
unlock 之前，必须将此变量同步回主内存。

2.4 happens-before 原则

happens-before是JMM提供的有序性保证。在理解它的概念之前，需要了解一下弱内存模型和强内存模型。

弱内存模型——weak memory model
弱内存模型中，loadload、loadstore、storestore、storeload 四种内存重排序都有可能发生。只要不改变单线程行为，弱内存模型可随意对代码进行重排序，这是一种近乎不存在任何保证的模型。

强内存模型
Java的内存模型属于一种叫做 “顺序一致性” 的强内存模型。在顺序一致性模型中，不再存在重排序，Java的JMM就属于这种强内存模型。

虽然 JMM 属于最高级别的强内存模型——顺序一致性内存模型，但并不是说Java 不允许重排序，而是在某些情况下，可以支持严格限制重排序的目的，如volatile。而弱内存模型是无法满足这种保证的。

happens-before 是 JMM 提供的一系列关于重排序问题的规则。可以概括为：

If one action happens-before another, then the first is visible to and ordered before the second.
如果一个动作 happens-before 另一个动作，那么前者的执行会排在后者的前面，并且（其结果）对后者可见。
《java language specification 8》

可以分为以下两种策略：

对于会改变程序执行结果的重排序，JMM要求编译器和处理器必须禁止这种重排序。
对于不会改变程序执行结果的重排序，JMM对编译器和处理器不做要求（JMM允许这种重排序）。

这两个策略概括起来，可以这样理解——只要不改变程序的执行结果，编译器和处理器想怎么优化就怎么优化。

例如，如果编译器经过细致的分析，认定一个锁只能被一个线程访问到，那么这个锁可以被消除。
又例如，编译器认定一个 volatile 变量只会被单个线程访问到，那么它可以把这个 volatile 变量当做一个普通变量对待。

happens-before 的具体规则如下：

程序顺序执行，如果x和y是同一个线程的动作，并且在程序顺序中x出现在y之前，则 x happens-before y。
如果动作 x 的结果需要同步给后面的动作 y ，那么 x happens-before y。也就是说，synchronized 修饰的情况，先获得锁的线程就是 x ，后获得锁的就是 y，前者的执行结果需要同步给 y，那么同样会有 x happens-before y。
传递性，x happens-before y，y happens-before z，那么 x happens-before z。

根据这些规则，以下这些场景都是 happens-before 的情况：

对象锁的解锁，发生在对象锁后续的上锁之前
对 volatile 变量的写操作，一定发生在后续对该 volatile 变量的读操作之前。
对线程的 start() 方法的调用，一定发生在线程内其他操作之前。
线程中的所有操作，一定发生在该线程 join() 方法结束之前。
任何对象的默认初始化一定发生在程序中其他操作之前。

总之，happens-before 定义了两个动作发生资源竞争时的时间顺序，是JMM 描述特定动作前后执行顺序的一种抽象关系。它原则上不允许重排序，但在一些不影响程序执行结果的情况下，乱序执行也是可以的。