关于性能诊断的方法,我们可以按照“问题现象—直接原因—问题根源”这样一个思路去归纳。我们先从问题的现象去入手,包括时间的分析、资源的分析和异常信息的分析。接下来再去分析产生问题现象的直接原因是什么,这里我们归纳了自上而下的资源分析法和发散的异常信息分析法。找到直接原因之后,再去从问题的根源上去分析,包括软件架构的分析、部署架构的分析和业务架构的分析。这期跟大家聊聊,自下而上的资源诊断方法和发散的异常信息诊断方法。
这两个方法是对性能问题的直接原因进行分析的方法。自下而上的诊断思路是我们先从最底层进行分析,先排除最底层的问题之后,再慢慢往上去分析。为什么要这样做呢?无论我们的行业怎么发展,技术怎么发展,在我们目前的系统架构(冯·诺依曼计算体系架构)下,所有的问题最终都会归结到处理器、内存、磁盘、网络等等这些最基本的元素。所以我们最先要分析的就是这些最底层的相关信息和异常。下图中的这些元素都是我们需要去分析的:
自下而上资源诊断分析的目标是明确资源问题由于哪个层次的问题导致。它适用于问题直接原因已确定了,需要对某个层次进行深入分析的时候。
发散的异常信息诊断方法是从中间层去发现问题。我们发现问题最多的就是中间件、数据库,因为中间件和数据库已经是非常成熟的软件产品了,在这一层获得的异常信息是非常丰富的,由此向下可以对基础软件资源、异常进行分析诊断(硬件设备、操作系统)进行进一步分析,想上可以对应用程序异常进行分析诊断。
目前大部分诊断分析工具也是采用的这种思路,很多诊断分析工具都是从中间件和数据库这个层级去安装和配置,因为它从这里面可以获得最多需要分析诊断的信息。发散的异常信息诊断的目标是明确异常信息由于自身还是哪个层次的问题导致。它适用于问题直接原因已确定,需要对某个层次进行深入分析的场景。
接下来的文章还会继续为大家介绍其他性能诊断方法,可点击到主页继续查看。