高德面试官问我：JVM内存溢出后服务还能运行吗，我一顿操作行云流水

文章开篇问一个问题吧，一个java程序，如果其中一个线程发生了OOM，那进程中的其他线程还能运行吗？

接下来做实验，看看JVM的六种OOM之后程序还能不能访问。

在这里我用的是一个springboot程序。

/*** @author ：charon* @date ：Created in 2021/5/17 8:30* @description ： 程序启动类* @version: 1.0*/
@SpringBootApplication
public class CharonApplication {public static void main(String[] args) {SpringApplication.run(CharonApplication.class, args);}}

监测服务是否可用（http://localhost:8080/checkHealth 测试服务正常可用）：

/*** @author ：charon* @date ：Created in 2021/5/17 8:49* @description ： 测试服务是否可用* @version: 1.0*/
@RestController
public class CheckHealthController {@RequestMapping("/checkHealth")public String stackOverFlowError(){System.out.println("调用服务监测接口-----------------------");return "服务监测接口返回";}
}

1.StackOverflowError（栈溢出）

栈溢出代表的是：当栈的深度超过虚拟机分配给线程的栈大小时就会出现error。

/*** @author ：charon* @date ：Created in 2021/5/17 8:49* @description ： 测试java.lang.StackOverflowError: null的错误* @version: 1.0*/
@RestController
public class StackOverFlowErrorController {/*** 递归调用一个方法，使其超过栈的最大深度*/@RequestMapping("/stackOverFlowError")public void stackOverFlowError(){stackOverFlowError();}
}

使用浏览器调用栈溢出的接口（localhost:8080/stackOverFlowError），发现后台报了栈溢出的错误。

调用监测程序可用的接口，发现还是可以正常访问。

2.Java heap space（堆内存溢出）

当GC多次的时候新生代和老生代的堆内存几乎用满了，频繁触发Full GC (Ergonomics) ，直到没有内存空间给新生对象了。所以JVM抛出了内存溢出错误！进而导致程序崩溃。

设置虚拟机参数（-Xms10m -Xmx10m -XX:+PrintGCDetails），如果不设置的话，可能会执行很久。

@RestController
public class JavaHeapSpaceController {/*** 使用是循环创建对象，是堆内存溢出*/@RequestMapping("/javaHeapSpace")public void javaHeapSpace(){String str = "hello world";while (true){str += new Random().nextInt(1111111111) + new Random().nextInt(222222222);/***  intern()方法：* （1）当常量池中不存在这个字符串的引用，将这个对象的引用加入常量池，返回这个对象的引用。* （2）当常量池中存在这个字符串的引用，返回这个对象的引用；*/str.intern();}}
}

调用监测程序可用的接口，发现还是可以正常访问。

3.direct buffer memory

在写IO程序（如Netty）的时候，经常使用ByteBuffer来读取或者写入数据，这是一种基于通道（channel）和缓冲区（Buffer）的IO方式，他可以使用Native函数库直接分配对外内存，然后通过一个存储在java堆里面的DirectByteBuffer对象作为这块内存的引用操作，这样能在在一些场景中显著提高性能，因为避免了再java堆和Native堆中来回复制数据。

ByteBuffer.allocate(capacity) 这种方式是分配jvm堆内存，属于GC管辖的范围，由于需要拷贝所以速度较慢
ByteBuffer.allocateDirect(capacity) 这种方式是分配本地内存，不属于GC的管辖范围，由于不需要内存拷贝，所以速度较快

但是如果不断分配本地内存，堆内存很少使用，那么JVM就不需要执行GC，DirectByteBuffer对象就不会回收，
这时候堆内存充足，但本地内存可能已经使用光了，再次尝试分配本地内存，就会出现OutOfMemoryError

设置JVM参数: -Xms10m -Xmx10m -XX:+PrintGCDetails -XX:MaxDirectMemorySize=5m

@RestController
public class DirectBufferMemoryController {@RequestMapping("/directBufferMemory")public void directBufferMemory(){System.out.println("初始配置的最大本地内存为："+ (sun.misc.VM.maxDirectMemory()/1024/1024)+"MB");// 在jvm参数里设置的最大内存为5M，ByteBuffer buffer = ByteBuffer.allocateDirect(6*1024*1024);}}

访问内存溢出的接口（http://localhost:8080/directBufferMemory），报错之后再次访问服务监测接口，发现还是可以继续访问的。

4.GC overhead limit exceeded

GC回收之间过长会抛出这个错，过长的定义是：超过98%的时间用来做垃圾回收并且只回收了不到2%的堆内存，连续多次GC都只回收了不到2%的极端情况下才会抛出，加入不抛出GC overhead limit错误，就会发生下列情况：

GC清理的这么点内存很快就会再次被填满，形成恶性循环
CPU使用率一直是100%，而GC没有任何效果

设置JVM参数: -Xms10m -Xmx10m -XX:+PrintGCDetails -XX:MaxDirectMemorySize=5m

@RestController
public class GcOverHeadController {@RequestMapping("/gcOverHead")public void gcOverHead(){int i = 0;List<String> list = new ArrayList<>();try{while(true){list.add(String.valueOf(++i).intern());}}catch(Throwable e){System.out.println("i的值为：" + i);e.printStackTrace();throw e;}}
}

如下图所示，在报错这个异常之前，在频繁的Full GC，但是垃圾回收前后，新生代和老年代的内存差不多，就说明，垃圾回收效果不大。

再次访问服务监测接口，发现还是可以继续访问的。

5.Metaspace

java 8及其以后的版本中使用了MetaSpace代替了永久代，它与永久代最大的区别在于：

MetaSpace并不在虚拟机内存中，而是使用本地内存，也就是说，在java8中，Class metadata被存储在MetaSpace的native Memory中

MetaSpace中存储了一下信息：

虚拟机加载的类信息
常量池
静态变量
即时编译后的代码

参数设置：-XX:+PrintGCDetails -XX:MetaspaceSize=50m -XX:MaxMetaspaceSize=50m

@RestController
public class MetaSpaceController {static class OomTest{}/*** 模拟MetaSpace溢出，不断生成类往元空间放，类占据的空间会超过MetaSpace指定的大小*/@RequestMapping("/metaSpace")public void metaSpace(){int i = 0;try{while (true){i++;/*** Enhancer允许为非接口类型创建一个java代理。Enhancer动态创建了给定类型的子类但是拦截了所有的方法，* 和proxy不一样的是：不管是接口还是类它都能正常工作。*/Enhancer enhancer = new Enhancer();enhancer.setSuperclass(OomTest.class);enhancer.setUseCache(false);enhancer.setCallback(new MethodInterceptor() {@Overridepublic Object intercept(Object o, Method method, Object[] objects, MethodProxy methodProxy) throws Throwable {return methodProxy.invokeSuper(o,objects);}});enhancer.create();}}catch (Throwable e){System.out.println("i的值为：" + i);e.printStackTrace();}}
}

我记得之前看过一篇公众号的文章，就是使用Fastjson创建的代理类导致的Metaspace的问题，具体地址我也忘记了。。。。。

再次访问服务监测接口，发现还是可以继续访问的。

6.unable to create new thread

在高并发服务时，经常会出现如下错误，

导致原因：

1.应用程序创建了太多的线程，一个应用进程创建的线程超过了系统承载极限
2.服务器不允许应用程序创建这么多线程，linux系统默认允许单个进程可以创建的线程数为1024个（如果是普通用户小于这个值）

解决办法：

1.降低应用程序创建线程的数量，分析应用是否真的需要创建这么多线程
2.对于有的应用确实需要创建这么多的线程，可以修改linux服务器配置，扩大linux的默认限制

查看：ulimit -u

修改：vim /etc/security/limits.d/90-nproc.conf

@RestController
public class UnableCreateThreadController {/*** 友情提示:千万别在windows中运行这段代码，如果不小心和我一样试了，那就只能强制重启了*/@RequestMapping("/unableCreateThread")public void unableCreateThread(){for (int i = 0; ; i++) {System.out.println("i的值为：" + i);new Thread(()->{try{Thread.sleep(1000*1000);} catch (InterruptedException e){e.printStackTrace();}}).start();}}
}

我这里是使用的root用户测试的，创建了7409个线程。大家测试的时候最好是使用普通用户测试。