寻找随机的错误-一个真实的故事

几周前,我完成了RapidFTR开源项目的错误查找 ,这花了我三个晚上。 我认为可能值得分享狩猎的故事。

本文将介绍我的工作。 我将概述我的旅程,以实际找到正在发生的事情的根本原因。 我在本文中的目标是突出显示可以使用的技术示例,以实际跟踪奇怪的和随机的错误。

最后,我找到了一个非常清楚的解释,说明问题发生的原因和原因。 本文标题中存在“随机性”并非巧合。

开始–问题出在哪

问题是,在遵循使用开发虚拟机的指南时,有时启动应用程序会花费很长时间,然后失败。 两次启动应用程序后,我马上遇到了问题。 其他人也有同样的问题。

有人告诉我,没有人真正知道它为什么会以这种方式运行-但是重新启动VM可能会解决它。 它不适合我。

但是我喜欢深入研究问题-所以我想知道出了什么问题。

将档案耙到Solr

运行rake app:run 有时会发生错误。 通过使用--trace --verbose (调试选项)运行rake,我可以看到该应用程序正在等待黑子启动Apache Solr搜索服务。

所以问题是,该过程始终花在哪里? 开始的好处是,rake和sunspot用Ruby编写。 因此,我阅读了代码,并添加了一些输出语句,以查看哪个语句花费了很长时间。 原来,这是Java进程启动了Solr。

挖掘Java

Apache Solr将一些输出发送到sdtout-但黑子将其隐藏在您的面前。 但是由于调试时任何输出都非常有用,因此我想查看输出。

我使用ps -aux查找了ps -aux发出的确切命令行参数,并从命令行手动启动了该过程。 幸运的是,它仍然花费了一些时间-所以我知道问题不在Ruby代码中。

通过端口映射程序nmap,我发现启动该服务需要2秒钟到2分钟以上的时间。 但是耙任务只等待了10秒钟。

现在,有了控制台输出,我可以看到,Solr在内部使用Jetty – 在版本6.1.3中是Jetty ,这花了很多时间– 在这种情况下,它花了时间。 因此,我从源代码管理中下载了6.1.3版的代码,并查看了代码。

我发现了一个名为DEBUG的系统属性,它会增加输出。 我启用了它,并看到最后的调试输出(花了很长时间)与启动会话服务有关(不幸的是,我丢失了指向代码的指针)。

这并没有真正帮助我。 我尝试使Jetty日志与log4j一起工作以最终看到更多内容,但未成功-但我失败了,不得不放弃当晚(第二个)。

调试Java代码

因此,如果您没有从日志中获取任何信息,则仍然可以使用调试器。 但是,代码在VM(Ubuntu盒)上失败了,但在我的本地计算机上却失败了。 但是幸运的是Java有一个远程调试器 。

我使用远程调试参数启动Java进程,并使用SVN中的Jetty代码在IntelliJ中附加了一个侦听器。 我试图使执行在最后一个日志输出附近的断点处停止–但是此方法经常被调用,而我没有在正确的时机到达断点。

但是,当事情花费很长时间时,仅停止正在运行的进程并查看堆栈跟踪可能会有所帮助。 因此,我停止了执行,并从Jetty中搜索了最后一个方法框架,该框架正在调用JDK –在这里,我发现了以下注释:

//This operation may block on some systems with low entropy. See this page
//for workaround suggestions:
//http://docs.codehaus.org/display/JETTY/Connectors+slow+to+startup
Log.debug('Init SecureRandom.');
_random=new SecureRandom();


解决方案

最后–我确实转到了引用的Jetty Wiki页面 。 我发现,Java的java.util.SecureRandom使用来自操作系统的真实熵-当没有可用的熵时,它将阻塞。

仅使用普通的java.util.Random的方法,来自Wiki页面的解决方案将很困难,因为配置文件位于sunspot和Solr内部。 但是行“ NB一些解决方法报告使用/dev/./urandom而不是/ dev / urandom”给了我一个提示,那就是另找。

我用Google搜索解决方案,并在Stack Overflow上发现,可以在Java进程/dev/./urandom /dev/urandom随机替换为/dev/./urandom 。 这可以通过使用命令行参数-Djava.security.egd=file:/dev/./urandom或通过将其替换为文件/usr/lib/jvm/java-6-openjdk/jre/lib/security/java.security (在Ubuntu机器上)。

那怎么了? Java的安全随机数将不接受/dev/urandom作为随机数的源 。 /dev/urandom是无阻塞的,这意味着它将在没有可用的实际熵的情况下返回可以猜测的随机数。 因此,Java默认为/dev/random ,它将阻塞并等待,直到出现熵为止。

这就是为什么在生产或开发机器上极不可能发生阻塞的原因-但是在使用虚拟机时,它确实发生了,因为虚拟机的网络流量和IO并不多。 当您经常重启应用程序时(尤其是在某些情况下无法正常工作时),这种情况通常会发生。

解决方法有点有趣。 Java根据字符串拒绝/dev/urandom 。 它不会拒绝/dev/./urandom ,它当然指向同一个可能不安全的随机数生成器。

最后的话

该修补程序会带来潜在的安全风险–但是在开发虚拟机上,这不是问题。

如您所见,在系统中查找错误或问题涉及使用技术,这些技术使您更接近根本原因。 但是,没有黄金路。 有时,一种技术将无法为您提供更多信息。 因此,您将不得不尝试另一种技术。 有时,您的直觉也会对您有所帮助。

到达这里后,您对这个故事有何看法?

参考:在Johannes Thones博客博客上,我们的JCG合作伙伴 Johannes Thones 狩猎随机的错误-一个真实的故事 。


翻译自: https://www.javacodegeeks.com/2012/10/hunting-random-bug-true-story.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/371318.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

铃木uy125摩托车机油_UY125 新瑞梦UM125发布 济南铃木于湖南株洲吹响国IV集结号...

​4月18日,济南铃木在湖南株洲天台开元酒店举行了2019年新品发布会,并于现场发布了两款极具终端战略意义的新款国IV车型,分别为定位“实用运动”的全新个性化踏板车型UY125,以及能够进一步巩固济南铃木在国IV入门级踏板车型领域绝…

473. 核电站问题

★ 输入文件:nucle.in 输出文件:nucle.out 简单对比 时间限制:1 s 内存限制:128 MB 【问题描述】 一个核电站有 N 个放核物质的坑,坑排列在一条直线上。如果连续 M 个坑中放入核物质,则会发生爆炸&…

js判断时间是早上还是下午_牛奶早上喝好,还是晚上喝好?没想到“最佳时间”是这个点,颠覆了!...

都说喝牛奶好,要多喝。可什么时间喝牛奶最好呢?是饭前、饭后还是睡前?又或者喝酒前?确实得好好说说。传言:空腹时身体比较缺能量,牛奶里的蛋白会去提供能量,不会去构成和修复组织(比如修复皮肤)…

Java模因拒绝死亡

也有标题; 我的宠物讨厌Java编码。 有许多Java模因让我很烦,部分是因为它们总是一个坏主意,但主要是因为人们在找到更好的替代方案后的几年里仍在继续使用它们。 使用StringBuffer代替StringBuilder 从2004年开始,用于StringBuf…

Python TK编程第一部分 Hello Again

当你想写大一点的程序的时候,将你的代码封装到一个或者多个类里会是一个不错的办法。下面hello world这个例子来自Matt Conway的Tkinter Life Preserver. [python]view plain copy from Tkinter import * class App: def __init__(self, master): …

视网膜脱离oct报告图_刚刚,爱尔眼科发布关于艾芬医生诊疗过程的核查报告

刚刚,爱尔眼科医院集团发布关于艾芬女士诊疗过程的核查报告,内容如下:得悉艾芬女士对武汉爱尔眼科医院白内障诊疗存疑,爱尔眼科医院集团高度重视,第一时间成立了工作组奔赴武汉,对事件的诊疗全过程开展了核…

20145233《网络对抗》第二周 后门原理与实践

20145233《网络对抗》第二周 后门原理与实践 实验内容 windows主机与kali虚拟机实现互联互通使用netcat获取主机操作Shell,cron启动使用socat获取主机操作Shell, 任务计划启动使用MSF meterpreter生成可执行文件,利用ncat或socat传送到主机并运行获取主机…

Spring 3.1:缓存和EhCache

如果在网上查找使用Spring 3.1内置缓存的示例,那么通常会碰到Spring的SimpleCacheManager ,Spring的家伙说这对“用于测试或简单的缓存声明很有用”。 实际上,我更喜欢将SimpleCacheManager看作是轻量级的,而不是简单的。 在您希望…

mysql-表完整性约束

阅读目录 一 介绍二 not null与default三 unique四 primary key五 auto_increment六 foreign key七 总结一 介绍 回到顶部 约束条件与数据类型的宽度一样,都是可选参数 作用:用于保证数据的完整性和一致性主要分为: PRIMARY KEY (PK) 标识…

可消费消息数量_17 个方面,综合对比 主流消息队列

一、资料文档二、开发语言三、支持的协议四、消息存储五、消息事务六、负载均衡七、集群方式八、管理界面九、可用性十、消息重复十一、吞吐量TPS十二、订阅形式和消息分发十三、顺序消息十四、消息确认十五、消息回溯十六、消息重试十七、并发度本文将从,Kafka、Ra…

opencv2.4.13+python2.7学习笔记--使用 knn对手写数字OCR

阅读对象:熟悉knn、了解opencv和python。 1.knn理论介绍:算法学习笔记:knn理论介绍 2. opencv中knn函数 路径:opencv\sources\modules\ml\include\opencv2\ml\ml.hpp 3.案例 3.1数据集介绍 我们的目的是创建一个可以对手写数字进行…

如何远程管理Quartz

选项1:JMX 许多人问他们是否可以通过JMX管理Quartz,但我不确定为什么Quartz doc甚至不会提及它。 是的,您可以使用quartz.properties的以下命令启用石英中的JMX org.quartz.scheduler.jmx.export true之后,您可以使用标准的JMX客…

热启动必须联网吗_供暖结束,地暖是关闭供水阀门还是关闭回水阀门?你做对了吗?...

天气渐渐暖和起来很多城市都停止供暖了一些家庭也停止使用地暖那么今天就来聊一聊,停止供暖后地暖系统应该怎么保养地暖不用时候是关闭供水阀门还是关闭回水阀门?供暖结束 暖气阀门到底要不要关一般来说,我们供暖期结束是不用关闭总阀门的。因…

python学习(九) 网络编程学习--简易网站服务器

python 网络编程和其他语言都是一样的,服务器这块步骤为:1. 创建套接字2. 绑定地址3. 监听该描述符的所有请求4. 有新的请求到了调用accept处理请求 Python Web服务器网关接口(Python Web Server Gateway Interface,简称“WSGI”&…

concurrency 方面的books

http://joeduffyblog.com/2016/11/30/15-years-of-concurrency/转载于:https://www.cnblogs.com/WCFGROUP/p/6566150.html

Spring 3.1缓存和配置

我最近在博客中谈论有关Spring 3.1及其新的缓存注释Cacheable和CacheEvict 。 与所有Spring功能一样,您需要进行一定数量的设置,并且通常使用Spring的XML配置文件来完成。 在缓存的情况下,打开Cacheable和CacheEvict并不容易,因为…

按条件分类_保税仓储企业能否同时存储非保货物?“仓储货物安装台分类监管”如何申请?...

保税仓储企业能否同时存储非保货物呢?保税和非保货物是不是真的不能同在一个“屋檐下”呢?哪些企业可以开展“仓储货物按状态分类监管”业务?企业又该如何申请该项业务?本文就对这些问题进行一下梳理。什么是“仓储货物按状态分类…

ZooKeeper的原理(转)

一、ZooKeeper的角色 领导者(Leader),负责进行投票的发起和决议,更新系统状态。 学习者(Learner),包括跟随者(Follower)和观察者(Observer)&#…

java课堂笔记

转载于:https://www.cnblogs.com/16-C-kai/p/6567042.html

Spring– DAO和服务层

欢迎来到Spring教程的第三部分。 在这一部分中,我们将继续编写Timesheet应用程序,这次我们将实现DAO层,业务服务并编写一些测试。 在上一部分中,我们定义了GenericDao接口,该接口告诉我们需要对实体执行哪些操作。 现在…