高效应用程序的7个JVM参数

在撰写本文时（2020年3月），围绕垃圾收集和内存，您可以将600多个参数传递给JVM。如果您包括其他方面，则JVM参数总数将很容易超过1000个。 😊。任何人都无法消化和理解太多的论据。在本文中，我们重点介绍了七个重要的JVM参数，您可能会发现它很有用。

1. -Xmx和-XX：MaxMetaspaceSize

-Xmx可能是最重要的JVM参数。 -Xmx定义要分配给应用程序的最大堆大小。（要了解JVM中不同的内存区域，您可以观看此短片）。您可以这样定义应用程序的堆大小：

 -Xmx2g

堆大小在确定您的

一个。应用性能

b。 Bill，您将从云提供商（AWS，Azure等）获得收益

这带来了一个问题，我的应用程序正确的堆大小是多少？我应该为应用程序分配大堆大小还是小堆大小？答案是：“取决于”。在本文中，我们分享了我们的想法，无论您需要使用大堆还是小堆。

 You might also consider reading this article: advantages of setting -Xms and -Xmx to same value.

元空间是将存储JVM的元数据定义（例如类定义，方法定义）的区域。默认情况下，可用于存储此元数据信息的内存量是无限的（即受您的容器或计算机的RAM大小的限制）。您需要使用-XX：MaxMetaspaceSize参数来指定可用于存储元数据信息的内存量的上限。

 -XX:MaxMetaspaceSize=256m

2. GC算法

截止到2020年3月，OpenJDK中有7种不同的GC算法：

一个。串行GC

b。平行气相色谱

C。并发标记和扫描GC

d。 G1 GC

e。雪兰多GC

F。 Z气相色谱

G。 Epsilon GC

如果您未明确指定GC算法，那么JVM将选择默认算法。在Java 8之前，并行GC是默认的GC算法。从Java 9开始，G1 GC是默认的GC算法。

GC算法的选择对于确定应用程序的性能起着至关重要的作用。基于我们的研究，我们正在使用Z GC算法观察到出色的性能结果。如果使用JVM 11+，则可以考虑使用Z GC算法（即-XX：+ UseZGC）。有关Z GC算法的更多详细信息，请参见此处。

下表总结了激活每种垃圾收集算法所需传递的JVM参数。

GC算法	JVM参数
串行GC	-XX：+ UseSerialGC
平行气相色谱	-XX：+ UseParallelGC
并发市场和扫描（CMS）GC	-XX：+ UseConcMarkSweepGC
G1 GC	-XX：+ UseG1GC
雪兰多GC	-XX：+使用ShenandoahGC
Z气相色谱	-XX：+使用ZGC
Epsilon GC	-XX：+ UseEpsilonGC

3.启用GC日志记录

垃圾收集日志包含有关垃圾收集事件，回收的内存，暂停时间段等信息，您可以通过传递以下JVM参数来启用垃圾收集日志：

从JDK 1到JDK 8：

GC算法

从JDK 9及更高版本开始：

GC算法

例：

GC算法

通常，GC日志用于调整垃圾回收性能。但是，GC日志包含重要的微观指标。这些指标可用于预测应用程序的可用性和性能特征。在本文中，我们将重点介绍一种这样的千分尺：“ GC吞吐量 ”（要了解其他可用千分尺的更多信息，您可以参考本文）。 GC吞吐量是您的应用程序在处理客户交易中花费的时间与它在处理GC活动中花费的时间之比。假设您的应用程序的GC吞吐量为98％，则意味着应用程序将其98％的时间用于处理客户活动，而其余2％则用于GC活动。

现在，让我们看一个健康的JVM的堆使用情况图：

图：健康JVM的堆使用情况图（由https://gceasy.io生成）

您会看到一个完美的锯齿图案。您会注意到，当运行Full GC（红色三角形）时，内存利用率会一直下降到最低。

现在，让我们看一下有问题的JVM的堆使用情况图：

图：Sick JVM的堆使用情况图（由https://gceasy.io生成）

您可以注意到，在图形的右端，即使GC重复运行，内存利用率也没有下降。这是该应用程序正遭受某种内存问题的经典征兆。

如果您仔细观察一下该图，您会发现重复的完整GC开始在上午8点左右开始。但是，该应用程序仅在上午8:45左右开始获取OutOfMemoryError。到上午8点，该应用程序的GC吞吐量约为99％。但是，在早上8点之后，GC吞吐量开始下降到60％。因为当重复的GC运行时，该应用程序将不会处理任何客户交易，而只会进行GC活动。作为一项主动措施，如果您发现GC吞吐量开始下降，则可以从负载平衡器池中取出JVM。这样，运行状况不佳的JVM将不会处理任何新的流量。它将最大程度地减少对客户的影响。

图：重复的完整GC发生在OutOfMemoryError之前

您可以使用GCeasy REST API实时监视与GC相关的微米。

4. -XX：+ HeapDumpOnOutOfMemoryError，-XX：HeapDumpPath

OutOfMemoryError是一个严重的问题，它将影响您的应用程序的可用性/性能SLA。为了诊断OutOfMemoryError或任何与内存相关的问题，必须在应用程序开始遇到OutOfMemoryError的那一刻或一瞬间捕获堆转储。由于我们不知道何时会抛出OutOfMemoryError，因此很难在抛出时左右的正确时间手动捕获堆转储。但是，可以通过传递以下JVM参数来自动化捕获堆转储：

-XX：+ HeapDumpOnOutOfMemoryError和-XX：HeapDumpPath = {HEAP-DUMP-FILE-PATH}

在“ -XX：HeapDumpPath”中，您需要指定堆转储所在的文件路径。传递这两个JVM参数时，将在抛出OutOfMemoryError时自动捕获堆转储并将其写入定义的文件路径。例：

GC算法

一旦捕获了堆转储，就可以使用HeapHero和EclipseMAT之类的工具来分析堆转储。

有关OutOfMemoryError JVM参数的更多详细信息，可以在本文中找到。

5. -Xss

每个应用程序将具有数十，数百，数千个线程。每个线程都有自己的堆栈。在每个线程的堆栈中，存储以下信息：

一个。当前执行的方法/功能

b。原始数据类型

C。变数

d。对象指针

e。返回值。

他们每个人都消耗内存。如果它们的使用量超出某个限制，则抛出StackOverflowError。有关StackOverflowError及其解决方案的更多详细信息，请参见本文。但是，可以通过传递-Xss参数来增加线程的堆栈大小限制。例：

GC算法

如果将此-Xss值设置为一个很大的数字，则内存将被阻塞并浪费。假设您将-Xss值指定为2mb，而它只需要256kb，那么您将浪费大量的内存，而不仅仅是1792kb（即2mb – 256kb）。你想知道为什么吗？

假设您的应用程序有500个线程，那么-Xss值为2mb，您的线程将消耗1000mb的内存（即500个线程x 2mb /线程）。另一方面，如果您仅将-Xss分配为256kb，那么您的线程将仅消耗125mb的内存（即500个线程x 256kb /线程）。每个JVM将节省875mb（即1000mb – 125mb）内存。是的，它将产生巨大的变化。

注意：线程是在堆（即-Xmx）外部创建的，因此这1000mb将是您已经分配的-Xmx值的补充。要了解为什么在堆外部创建线程，您可以观看此简短视频片段。

我们的建议是从一个低值（例如256kb）开始。使用此设置运行彻底的回归，性能和AB测试。仅当您遇到StackOverflowError时才增加该值，否则请考虑坚持较低的值。

6. -Dsun.net.client.defaultConnectTimeout和-Dsun.net.client.defaultReadTimeout

现代应用程序使用多种协议（即SOAP，REST，HTTP，HTTPS，JDBC，RMI…）与远程应用程序连接。有时远程应用程序可能需要很长时间才能做出响应。有时它可能根本不响应。

如果没有正确的超时设置，并且远程应用程序的响应速度不够快，则应用程序线程/资源将被卡住。远程应用程序无响应可能会影响您的应用程序的可用性。它可以使您的应用程序停止磨削。为了保护您的应用程序的高可用性，应配置适当的超时设置。

您可以在JVM级别传递这两个强大的超时网络属性，这些属性可以全局适用于所有使用java.net.URLConnection的协议处理程序：

sun.net.client.defaultConnectTimeout指定建立到主机的连接的超时（以毫秒为单位）。例如，对于HTTP连接，这是建立与HTTP服务器的连接时的超时。
当建立与资源的连接时， sun.net.client.defaultReadTimeout指定从输入流读取时的超时（以毫秒为单位）。

例如，如果要将这些属性设置为2秒：

GC算法

注意，默认情况下，这两个属性的值为-1，这表示未设置超时。有关这些属性的更多详细信息，请参见本文。

7. -Duser.timeZone

您的应用程序可能在某个时间/日期附近具有敏感的业务需求。例如，如果您正在构建交易应用程序，则不能在上午9:30之前进行交易。为了实现那些与时间/日期相关的业务需求，您可以使用java.util.Date，java.util.Calendar对象。默认情况下，这些对象从底层操作系统中获取时区信息。这将成为一个问题；如果您的应用程序在分布式环境中运行。查看以下方案：

一个。如果您的应用程序跨多个数据中心（例如，旧金山，芝加哥，新加坡）运行，则每个数据中心中的JVM最终将具有不同的时区。因此，每个数据中心中的JVM将表现出不同的行为。这将导致结果不一致。

b。如果要在云环境中部署应用程序，则可能会在您不知情的情况下将应用程序移动到其他数据中心。同样在这种情况下，您的应用程序最终将产生不同的结果。

C。您自己的运营团队还可以更改时区，而无需掌握开发团队的知识。它还会歪曲结果。

为避免这些麻烦，强烈建议使用-Duser.timezone系统属性在JVM上设置时区。例如，如果您想为应用程序设置EDT时区，则将执行以下操作：