JVM崩溃时:如何调查最严重错误的根本原因

当应用程序崩溃时,您可以学到什么?

我认为,“后见之明是20 /”是最喜欢的短语之一托马斯·罗梅尔 ,工程ZeroTurnaround的副总裁。 好吧,我实际上不确定在他的短语中占什么位置,但是我已经听过他几次说了。 鉴于这意味着回顾过去,您可以对事情进行推理比预测将来发生的事情要好得多,通常发生在我们未能正确预测事情并反映行动结果的情况下。 如果您经常听到此短语,则意味着您经常对事情进行反思,并且您知道每一次失败,每一次错误都会提供一个教训。

好吧,可能是您没有犯错误,或者您没有犯任何会传播到最终产品以及最终用户的重要错误。 我确实偶尔制作它们,不止一次,我对服务器进行了多次轰炸,并且无数次提交了损坏的代码。 有时它也会滑入最终产品。 每当我写的破损代码再次咬我时,我都会学到一些东西。 每次我必须调查造成错误的原因是什么,将其复制到我的机器上并进行修复。

在这篇文章中,我想看看可以帮助您获得有关错误的相关信息并帮助您重现和修复它们的工具和技术。

结构化日志

弄清楚某些代码中发生了什么的默认goto方法是阅读源代码。 当该来源实际上是您每天工作8-10个小时而仍然找不到罪魁祸首时,则您必须在错误发生时添加一些有关上下文的情境意识。 自然地,您可以从日志中获取该上下文。 我毫不怀疑您一直在使用日志,但这是您可以做的一个很好的技巧,可以使日志更加有用。

线程名称

如果配置线程名称以反映应用程序中发生的事情,则可以获得有关上下文的更多信息。 线程名称几乎总是包含在日志中,并且打印线程名称不会带来任何明显的性能开销。 例如,找出记录器的调用方类需要花费时间,因为您必须构造和遍历堆栈跟踪。 但是访问线程名称既快速又便宜。 另外,线程名很少用于其他任何事情,因此,在您认为合适的地方充填尽可能多的信息:系统组件名称,事务ID,发出请求的用户名等。稍后在调试问题时,您将感谢这些详细的日志,轻轻松松。

更多日志类型

另一个技巧是使JVM产生更多的日志,可以使JVM产生可以稍后分析的垃圾收集日志,JIT编译日志和堆转储。 由于性能开销,其中大多数可能不适合生产系统,但是您绝对可以在暂存阶段或在自己的开发站上对它们进行试验。

稍后,您可以调整垃圾回收的性能,并进行大量优化, 如本文所述 ,但首先,您可以使用以下JVM选项启用垃圾回收日志: -XX:+ PrintGC -XX:+ PrintGCDetails -XX:+ PrintGCTimeStamps和-XX:+ PrintGCDateStamps -Xloggc:file

手动调查JIT编译日志可能不会告诉您太多信息,但是您始终可以尝试使用JITWatch来查看JVM编译代码时发生了什么。

对于生产系统来说,打开它的一个好主意是: -XX:+ HeapDumpOnOutOfMemoryError ,这将使JVM在发生OutOfMemory错误时创建内存转储。

日志种类繁多,并非对崩溃管理都同样有用,但是它们都是必不可少的,也是您军械库中最容易使用的工具。

现代开发人员工具

等一下 您是否要告诉我,在21世纪,没有什么比找出日志并从早期石器时代采用取证技术更好的方法来弄清您的应用程序中发生了什么? 好吧,不是真的。 但是我不知道有什么通用工具可以为您提供最佳的见解,以了解代码中发生了什么以及为什么发生这种情况。

在开发环境中,情况变得更容易,您拥有大量的备用计算资源,并且可能会冒险附加不需要经过Ops批准流程的各种工具。

例如, 以Plumbr的IvoMägi的帖子为例 ,他讨论了他们的内存泄漏检测工具是否适合操作人员或开发人员。 理想情况下,该工具是有用且稳定的,因此您既可以在开发过程中享受其性能和功能,又不必担心将其附加到实时系统中。 但是这种情况很少发生,您不需要在生产环境中进行调试,也不想与JRebel即时交换类,等等。

但是,这并不意味着您根本不应该使用任何现代工具,而应该将自己限制在老式的,但已被证实的发现邪恶根源的方法上:日志。 毫无疑问,日志仍将是您将获得的最有用的取证信息来源,但是您可以做得更好。

通常,开发过程包括大量盯着代码,思考并有时在此处和此处更改功能位。 这是一项艰苦的工作,需要集中精力解决问题和系统逻辑。 如果您知道使事情变得更轻松的方法论或一些神奇的秘诀,请在Twitter上与我分享智慧: @shelajev 。 在此之前,我们将以软件工程需要集中精力为前提。 这意味着任何工具都有两个主要的非功能性要求:在功能上必须强大,并且必须具有非侵入性,因此您不必在如何实现所需的功能上费心。

重现某些条件的最有效方法是对其进行测试。 当它不可用时,下一个最好的事情就是使用一个录制调试器,例如Takipi进行生产调试或Chronon 。

使用Chronon,您可以记录代码中发生的操作,它们产生的结果,每给定时刻堆栈中的内容以及产生程序执行的事务日志的记录。 稍后,您可以将此日志提供给另一个程序运行,并来回逐步执行。

如果您要查明性能问题,则可以使用Java Mission Control的 Java Flight Recorder收集有关程序执行配置文件,垃圾收集统计数据,堆使用情况数据(例如对象分配,锁和IO详细信息)的信息。如果要运行附加到生产节点上的Java Mission Control,您必须支付许可证的费用,但是对于开发环境,则没有这样的问题。

再说一次,如果要监视生产环境,则可能需要一个错误管理解决方案,该解决方案专门为获取尽可能多的错误信息而创建。

塔基皮分析

Takipi的仪表板和本机代理使您无需使用日志文件即可调试生产中的代码。 您将获得错误分析,分布式系统中的统一堆栈跟踪以及其他可以大大减少理解和修复错误的时间的事物。

在这篇文章中,我们研究了几种工具和技术,可以使您在积极开发应用程序或将其部署到生产环境中时更加了解应用程序中正在发生的事情。 无论是通过熟练地将JMC与飞行记录器配合使用,还是通过优雅制作的日志,重现错误都是纠正任何错误的最重要步骤。

您要记住的是,尽管每次都会使用好的旧工具,但几乎每个领域都有新的发展,并且崩溃管理和错误监视也不例外。 了解其中有哪些工具,并了解如何正确使用它们。 它将使您成为更好的开发人员。

翻译自: https://www.javacodegeeks.com/2015/04/when-jvms-crash-how-to-investigate-the-root-cause-of-your-toughest-errors.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/359433.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

常用个人密码管理软件

http://www.williamlong.info/archives/3100.html转载于:https://www.cnblogs.com/svennee/p/4099358.html

查看网口命令_20个常用Linux命令

今天总结几个非常常用的Linux命令,其中有几个在面试中很可能问相关命令的原理,比如后台运行命令。希望对大家有所帮助,最好自己去尝试在Linux操作系统中实践一下。 1、查看目录以及权限 在windows中,使用dir查看当前目录中文件。在Linux中使用ls(list)查看当前目录文件。 w…

爱摘苹果的小明

描述小明家的院子里有一棵苹果树,每到秋天树上就会结出10个苹果。苹果成熟的时候,小明就会跑去摘苹果。小明有个30厘米高的板凳,当她不能直接用手摘到苹果的时候,就会踩到板凳上再试试。现在已知10个苹果到地面的高度,…

中统计字符串长度的函数_SQL Server中的字符串分割函数

您是否知道从SQL Server 2016开始,系统就内置STRING_SPLIT函数,该函数用于将字符串分隔的变量拆分为一个可用列表。 对于经常需要分割字符串的技术人员,建议您查看此功能。 STRING_SPLIT是一个表值函数,它返回由定界符分隔的字符串…

JBoss BPM Suite快速指南–将外部数据模型导入BPM项目

您正在从事一个大型项目,在企业中开发规则,事件和流程以满足关键业务需求。 部分要求指出,某个业务部门将提供您的数据模型供您利用。 不会在JBoss BPM Suite数据建模器中设计此数据模型,但是在从业务中心仪表板处理规则&#x…

Android项目笔记【项目管理统计图app】:使用github上的cardslib开源项目实现CardView(1)...

因为项目中用到第三级菜单,我们原有的界面框架已经不适用于该项目,Android L出了新的cardview设计,爬了下github发现有些高手已经把card整合为更方便调用的类库了,我这个项目就准备试用一下其中的一个开源项目cardslib &…

卸载 流程_一款适合于windows端的卸载神器 彻底清理残留软件

今天给大家介绍的是一款适合于Windows端的软件卸载神器---Uninstall,可以彻底清理残留软件。它的卸载流程是这样的,首先会使用软件本身的默认卸载程序进行卸载,卸载完成后再次扫描软件残留的一些残余文件及注册表之类的,可以完美的…

key value vue 输出_vue注意事项总结(一)

1.只有当vue实例被创建时data中存在的属性才是响应式的:如果你知道你会在晚些时候需要一个属性,但是一开始它为空或不存在,那么你仅需要设置一些初始值。2.不要在选项属性或回调上使用箭头函数:比如:created: () > …

netif_start_queue/netif_wake_queue/netif_stop_queue

在网卡驱动中,内核为发送数据包的流量控制提供了几个主要的函数,用来在驱动程序和内核之间传递流控信息。 主要有4个: 1】netif_start_queue 启动接口传输队列 2】netif_wake_queue 通知网络系统可以再次开始传输数据包;并启动接…

编写下载服务器。 第四部分:有效地实现HEAD操作

HEAD是一个经常被遗忘的HTTP方法(动词),其行为类似于GET,但不会返回正文。 您使用HEAD来检查资源的存在(如果不存在,它应该返回404),并确保您的缓存中没有陈旧的版本。 在这种情况下…

【grunt整合版】30分钟学会使用grunt打包前端代码

http://www.itnose.net/detail/6009394.html转载于:https://www.cnblogs.com/zifeiyu/p/4106585.html

十三水算法php_基于PHP+Redis令牌桶限流

一 、场景描述在开发接口服务器的过程中,为了防止客户端对于接口的滥用,保护服务器的资源, 通常来说我们会对于服务器上的各种接口进行调用次数的限制。比如对于某个 用户,他在一个时间段(interval)内&…

ECSHOP如何增加红包序列号字符

ECSHOP系统线下发放红包时系统生成的红包序列号是在10000的基础上增加四位随机数字。如果当我们要发放大额度红包的时候,这样的序列号规 则难免给人不安全的感觉,万一有无聊的人,蒙几个红包序列号出来,那就亏大了,因为…

Java REST JAX-RS 2.0 –如何处理日期,时间和时间戳记数据类型

无论是X-Form-Urlencoded还是JSON HTTP发布到REST资源端点,对于与日期或时间相关的数据都没有特定的“数据类型”。 大多数开发人员会将这些数据发布为“字符串”,或者只是将它们转换为Unix时间戳值(例如1435061152)。 但是&#…

html中给div设置的属性怎么样才能拿得到_HTML与CSS结合的三种方式:优先级比较...

所谓实践出真知,只有自己动手去做了,才能得到正确的结论。首先我们看看三种结合方式:通过link标签引入外部css文件通过style标签通过style属性很长一段时间我受这个一段话影响:在html文件中,代码的执行顺序是从外到内&…

Quartz作业调度框架及时间表达式的含义和语法

Quartz 是一个开源的作业调度框架,它完全由 Java 写成,并设计用于 J2SE 和 J2EE 应用中。它提供了巨大的灵活性而不牺牲简单性。你能够用它来为执行一个作业而创建简单的或复杂的调度。本系统结合通过 Spring 来集成 Quartz 。 Quartz 下载地址 &#x…

spring mvc mysql 实例_Spring+Mybatis+SpringMVC+Maven+MySql搭建实例

一、准备工作1. 首先创建一个表:CREATE TABLE t_user (USER_ID int(11) NOT NULL AUTO_INCREMENT,USER_NAME char(30) NOT NULL,USER_PASSWORD char(10) NOT NULL,USER_EMAIL char(30) NOT NULL,PRIMARY KEY (USER_ID),KEY IDX_NAME (USER_NAME)) ENGINEInnoDB AUTO…

LinkedHashMap 根据PUT顺序排序Map

最近工程里面报表需要合计 &#xff0c; 因为所有的项都是动态的&#xff0c;所以只能动态添加。 思路是使用Map&#xff0c;初始化所有Map&#xff0c;然后在Map中合计并且覆盖。 使用HashMap , 初始化后所有动态项的顺序都乱了。 Map<String , Double> totalMap new …

mysql 表设计 date_mysql 表 Date类型

举个例子给你吧&#xff0c;mysql的 datetime字段有表&#xff1a;CREATE TABLE u_user (id bigint(20) NOT NULL AUTO_INCREMENT,nickname varchar(32) DEFAULT NULL,addtime datetime DEFAULT NULL,PRIMARY KEY (id)) ENGINEInnoDB DEFAULT CHARSETutf8mb4;插入的话INSERT IN…

Oracle学习笔记(三)----------执行计划

查看Oracle执行计划的几种方法 一、通过PL/SQL Dev工具 1、直接File->New->Explain Plan Window&#xff0c;在窗口中执行sql可以查看计划结果。其中&#xff0c;Cost表示cpu的消耗&#xff0c;单位为n%&#xff0c;Cardinality表示执行的行数&#xff0c;等价Rows。 2、…