浅谈性能测试分析

性能测试工程师基本上都能够掌握利用测试工具来作负载、压力测试,但多数人对怎样去分析工具收集到的测试结果感到无从下手,下面我就把个人工作中的体会和收集到的有关资料整理出来,希望能对大家分析测试结果有所帮助。 分析原则:


1. 具体问题具体分析(这是由于不同的应用系统,不同的测试目的,不同的性能关注点)


2. 查找瓶颈时按以下顺序,由易到难。


    服务器硬件瓶颈-〉网络瓶颈(对局域网,可以不考虑)-〉服务器操作系统瓶颈(参数配置)-〉中间件瓶颈(参数配置,数据库web服务器等)-〉应用瓶颈(SQL语句、数据库设计、业务逻辑、算法等)
    注:以上过程并不是每个分析中都需要的,要根据测试目的和要求来确定分析的深度。对一些要求低的,我们分析到应用系统在将来大的负载压力(并发用户数、数据量)下,系统的硬件瓶颈在哪儿就够了。


3 分段排除法 很有效
分析的信息来源:
1 根据场景运行过程中的错误提示信息
2 根据测试结果收集到的监控指标数据


一.错误提示分析
分析实例:
1 Error: Failed to connect to server “10.10.10.30:8080″: [10060] Connection
  Error: timed out Error: Server “10.10.10.30″ has shut down the connection prematurely
分析:
 A、应用服务死掉。
(小用户时:程序上的问题。程序上处理数据库的问题)
 B、应用服务没有死
(应用服务参数设置问题)
    例:在许多客户端连接Weblogic应用服务器被拒绝,而在服务器端没有错误显示,则有可能是Weblogic中的server元素的AcceptBacklog属性值设得过低。如果连接时收到connection refused消息,说明应提高该值,每次增加25%
 C、数据库的连接
(1、在应用服务的性能参数可能太小了 2、数据库启动的最大连接数(跟硬件的内存有关))


2 Error: Page download timeout (120 seconds) has expired
分析:可能是以下原因造成
 A、应用服务参数设置太大导致服务器的瓶颈
 B、页面中图片太多
 C、在程序处理表的时候检查字段太大多


二.监控指标数据分析
1.最大并发用户数:
应用系统在当前环境(硬件环境、网络环境、软件环境(参数配置))下能承受的最大并发用户数。
    在方案运行中,如果出现了大于3个用
户的业务操作失败,或出现了服务器shutdown的情况,则说明在当前环境下,系统承受不了当前并发用户的负载压力,那么最大并发用户数就是前一个没有出现这种现象的并发用户数。
    如果测得的最大并发用户数到达了性能要求,且各服务器资源情况良好,业务操作响应时间也达到了用户要求,那么OK。否则,再根据各服务器的资源情况和业务操作响应时间进一步分析原因所在。


2.业务操作响应时间:
     分析方案运行情况应从平均事务响应时间图和事务性能摘要图开始。使用“事务性能摘要”图,可以确定在方案执行期间响应时间过长的事务。
    细分事务并分析每个页面组件的性能。查看过长的事务响应时间是由哪些页面组件引起的?问题是否与网络或服务器有关?
  如果服务器耗时过长,请使用相应的服务器图确定有问题的服务器度量并查明服务器性能下降的原因。如果网络耗时过长,请使用“网络监视器”图确定导致性能瓶颈的网络问题

3.服务器资源监控指标:

内存:
1 UNIX资源监控中指标内存页交换速率(Paging rate),如果该值偶尔走高,表明当时有线程竞争内存。如果持续很高,则内存可能是瓶颈。也可能是内存访问命中率低。
Windows资源监控中,如果Process/Private Bytes计数器和Process/Working Set计数器的值在长时间内持续升高,同时Memory/Available bytes计数器的值持续降低,则很可能存在内存泄漏。
内存资源成为系统性能的瓶颈的征兆:
很高的换页率(high pageout rate);
进程进入不活动状态;
交换区所有磁盘的活动次数可高;
可高的全局系统CPU利用率
内存不够出错(out of memory errors)


处理器:
1 UNIX资源监控(Windows操作系统同理)中指标CPU占用率(CPU utilization),如果该值持续超过95%,表明瓶颈是CPU。可以考虑增加一个处理器或换一个更快的处理器。如果服务器专用于SQL Server,可接受的最大上限是80-85% 
合理使用的范围在60%至70%。
2 Windows资源监控中,如果System/Processor Queue Length大于2,而处理器利用率(Processor Time)一直很低,则存在着处理器阻塞。
CPU资源成为系统性能的瓶颈的征兆
很慢的响应时间(slow response time) 
CPU空闲时间为零(zero percent idle CPU) 
过高的用户占用CPU时间(high percent user CPU) 
过高的系统占用CPU时间(high percent system CPU) 
长时间的有很长的运行进程队列(large run queue size sustained over time)


磁盘I/O:
1 UNIX资源监控(Windows操作系统同理)中指标磁盘交换率(Disk rate),如果该参数值一直很高,表明I/O有问题。可考虑更换更快的硬盘系统。
2 Windows资源监控中,如果 Disk Time和Avg.Disk Queue Length的值很高,而Page Reads/sec页面读取操作速率很低,则可能存在磁盘瓶径。
I/O资源成为系统性能的瓶颈的征兆 :
过高的磁盘利用率(high disk utilization) 
太长的磁盘等待队列(large disk queue length) 
等待磁盘I/O的时间所占的百分率太高(large percentage of time waiting for disk I/O) 
太高的物理I/O速率:large physical I/O rate(not sufficient in itself) 
过低的缓存命中率(low buffer cache hit ratio(not sufficient in itself)) 
太长的运行进程队列,但CPU却空闲(large run queue with idle CPU)


4.数据库服务器:
SQL Server数据库:
1 SQLServer资源监控中指标缓存点击率(Cache Hit Ratio),该值越高越好。如果持续低于80%,应考虑增加内存。
2 如果Full Scans/sec(全表扫描/秒)计数器显示的值比1或2高,则应分析你的查询以确定是否确实需要全表扫描,以及SQL查询是否可以被优化。 
3 Number of Deadlocks/sec(死锁的数量/秒):死锁对应用程序的可伸缩性非常有害,并且会导致恶劣的用户体验。该计数器的值必须为0。
4 Lock Requests/sec(锁请求/秒),通过优化查询来减少读取次数,可以减少该计数器的值。


Oracle数据库:
1 如果自由内存接近于0而且库快存或数据字典快存的命中率小于0.90,那么需要增加SHARED_POOL_SIZE的大小。
快存(共享SQL区)和数据字典快存的命中率: 
select(sum(pins-reloads))/sum(pins) from v$librarycache; 
select(sum(gets-getmisses))/sum(gets) from v$rowcache; 
自由内存: select * from v$sgastat where name=’free memory’; 


2 如果数据的缓存命中率小于0.90,那么需要加大DB_BLOCK_BUFFERS参数的值(单位:块)。
缓冲区高速缓存命中率:
select name,value from v$sysstat where name in (’db block gets’,
‘consistent gets’,'physical reads’) ;
Hit Ratio = 1-(physical reads / ( db block gets + consistent gets))


3 如果日志缓冲区申请的值较大,则应加大LOG_BUFFER参数的值。
日志缓冲区的申请情况 :
select name,value from v$sysstat where name = ‘redo log space requests’ ;


4 如果内存排序命中率小于0.95,则应加大SORT_AREA_SIZE以避免磁盘排序 。
内存排序命中率 :
select round((100*b.value)/decode((a.value+b.value), 0, 1, (a.value+b.value)), 2)from v$sysstat a, v$sysstat b where a.name=’sorts (disk)’ and b.name=’sorts (memory)’
注:上述SQL Server和Oracle数据库分析,只是一些简单、基本的分析,特别是Oracle数据库的分析和优化,是一门专门的技术,进一步的分析可查相关资料。

 

 

 性能测试的结果分析是性能测试的重中之重。在实际工作中,由于测试的结果分析比较复

杂、需要具备很多相关的专业知识,因此常常会感觉拿到数据不知从何下手。这也是我学习性能

测试过程中感觉比较尴尬和棘手的事,为此我在研读了《WEB性能测试实战》后特作了以下笔

记,这里只是书中第4章WEB应用程序性能分析的一

部分,贴出来希望和大家共同讨论:

 

一:性能分析的基础知识:

1.几个重要的性能指标:相应时间、吞吐量、吞吐率、TPS(每秒钟处理的交易数)、点

击率等。

 

2.系统的瓶颈分为两类:网络的和服务器的。服务器瓶颈主要涉及:应用程序、WEB服务

器、数据库服务器、操作系统四个方面。

 

3.常规、粗略的性能分析方法:

   当增大系统的压力(或增加并发用户数)时,吞吐率和TPS的变化曲线呈大体一致,则系统

基本稳定;若压力增大时,吞吐率的曲线增加到一定程度后出现变化缓慢,甚至平坦,很可能是

网络出现带宽瓶颈,同理若点击率/TPS曲线出现变化缓慢或者平坦,说明服务器开始出现颈。

 

4.作者提出了如下的性能分析基本原则,此原则本人十分赞同:

            ——由外而内、由表及里、层层深入

    应用此原则,分析步骤具体可以分为以下三步:

   第一步:将得到的响应时间和用户对性能的期望值比较确定是否存在瓶颈;

   第二步:比较Tn(网络响应时间)和Ts(服务器响应时间)可以确定瓶颈发生在网络还是服

务器;

   第三步:进一步分析,确定更细组件的响应时间,直到找出发生性能瓶颈的根本原因。

 

二:以WEB应用程序为例来看下具体的分析方法:

1.用户事务分析:

 

a.事务综述图(Transaction Summary ):以柱状图的形式表现了用户事务执行的成功与

失败。通过分析成功与失败的数据可以直接判断出系统是否运行正常。若失败的事务非常多,则

说明系统发生了瓶颈或者程序在执行过程中发生了问题。

 

b.事务平均响应时间分析图(Average Transaction Response Time): 该图显示在

测试场景运行期间的每一秒内事务执行所用的平均时间,还显示了测试场景运行时间内各个事务

的最大值、最小值和平均值。通过它可以分析系统的性能走向。若所有事务响应时间基本成一条

曲线,则说明系统性能基本稳定;否则如果平均事务响应时间逐渐变慢,说明性能有下降趋势,

造成性能下降的原因有可能是由于内存泄漏导致。

 

c.每秒通过事务数分析图(Transaction per Second即TPS):显示在场景运行的每一

秒中,每个事 务通过、失败以及停止的数量。通过它可以确定系统在任何给定时刻的实际事务

负载。若随着测试的进展,应用系统在单位时间内通过的事务数目在减少,则说明服务器出现瓶

颈。

 

d.每秒通过事务总数分析图(Total Transactions per Second):显示场景运行的

每一秒中,通过、失败以及停止的事务总数。若在同等压力下,曲线接近直线,则性能基本趋于

稳定;若在单位时间内通过的事务总量越来越少,即整体性能下降。原因可能是内存泄漏或者程

序中的缺陷。

 

e.事务性能摘要图(Transaction Performance Summary):显示方案中所有事务的

最小、最大平均执行时间,可以直接判断响应时间是否符合客户要求(重点关注事务平均、最大

执行时间)。

 

f.事务响应时间与负载分析图(Transaction Response Time Under load):通过

该图可以看出在任一时间点事务响应时间与用户数目的关系,从而掌握系统在用户并发方面的性

能数据。

 

g.事务响应时间(百分比)图(Transaction Response Time(percentile)):该

图是根据测试结果进行分析而得到的综合分析图。分析该图应从整体出发,若可能事务的最大响

应时间很长,但如果大多数事务具有可接受的响应时间,则系统的性能是符合。

 

h.事务响应时间分布情况图(Transaction Response Time (Distribution)):该

图显示了测试过程中不同响应时间的事务数量。若系统预先定义了相关事务可以接受的最小和最

大事务响应时间,则可以使用此图确定系统性能是否在接受范围内。

      分析到这一步,只能大概判断出瓶颈可能会出在那,要具体定位瓶颈还需要更深入

的分析。没有贴图,看起来有点费劲,如果你对这些图都比较了解,应该是比较简单的.

转载于:https://www.cnblogs.com/Darrenblog/p/winterwinner.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/268088.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Bean的生命周期回掉方法

上面三个是在bean的生命周期的初始化调用的 下面三个是在bean的生命周期的销毁调用的

【STM32 .Net MF开发板学习-18】GPRS遥控智能小车

有了Wifi间接控制智能小车的经验,很自然的想到,也可以通过GPRS远程遥控智能小车,因为从通信原理上看,二者其实没有什么本质的不同,都是基于Socket的TCP通信,其控制环节如下: 手机 > GPRS&…

大数据学习之Linux环境搭建(导航)

环境搭建过程网上有挺多,但在安装过程,难免会出现一些其他错误,所以是对自己在搭建环境过程中的一个记录。 首先是VMware软件的安装,没什么说的,一直“下一步”就好了,虚拟机下安装Linux系统也比较简单&…

在RHEL5下实现RAID5磁盘阵列

在Linux系统中做RAID,磁盘阵列的设备可以是一块磁盘中的三个以上的分区,也可以是三块或以上的磁盘。本文主要以几块磁盘为例,来实现在RAID5。实验说明:在VMware中进行,系统中有一块磁盘sda,新添加6块SCSI磁盘,分别为sd…

BeanFactoryPostProcessor实现在所有的BeanDefinition注册完之后帮我们进行扩展(调用)

实现BeanFactoryPostProcessor接口 spring会在所有的BeanDefinition注册完之后帮我们进行扩展(调用) BeanFactory的后置处理器就是BeanFactoryPostProcessor接口,该接口有一个方法postProcessBeanFactory,这个方法会在BeanFactory初始化之后调用&#…

HDU 1727 Hastiness(模拟)

Hastiness Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 1793 Accepted Submission(s): 693 Problem Description How many problems did you AC? When you read this problem, don’t hasty and careless, th…

手机支付:电信运营商会被边缘化吗?!

手机支付未来有巨大的发展机会,这点大家没有意见。手机支付运营商会在其中扮演重要角色,这可能也是大家都没有意见的说法。但是,我相信,这个说法可能会越来越有问题。有一天手机支付,电信运营商被边缘化也不是没有可能…

第七周作业

#include<stdio.h> int main(){int i,N;scanf("%d",&N);double s0;int flag-1;for(i1;i<N;i){ flag-flag; ssi*1.0/(2*i-1)*flag; } printf("%0.3f",s); return 0; } 7-3&#xff1a; 设计思路&#xff1a; &#xff08;1&#xff09;定义变量…

使用Exchange 2007的几个注意事项

http://wangchunhai.blog.51cto.com/225186/152384Exchange Server 2007是Microsoft推出的电子邮件服务器软件&#xff0c;该产品与Exchange Server 2003的改进很大&#xff0c;第一次使用该产品的用户&#xff0c;会碰到一些问题。本文将为大家介绍Exchange 2007中“比较困惑”…

exception is org.springframework.beans.factory.NoUniqueBeanDefinitionException

原因&#xff1a; Spring Boot异常org.springframework.beans.factory.NoUniqueBeanDefinitionException&#xff1a;没有可用的合格Bean类型&#xff1a;预期匹配单个Bean&#xff0c;但是匹配到了多个&#xff0c;当该bean被自动装配时与Spring Boot应用程序上下文中的两个或…

大数据平台助力核与辐射安全监管

大数据平台助力核与辐射安全监管 核能开发利用是大国发展的战略必争之地&#xff0c;也是调整能源结构、应对气候变化和建设生态文明&#xff0c;进而确保国家安全的重要手段。虽然我国核与辐射安全监管能力不断提升&#xff0c;但仍面临诸多挑战。 为适应新形势和新要求&#…

cube、rollup及exec的用法实例

cube、rollup及exec的用法实例 select sdept 系部,sno 学号,max(sage) 最大年龄, grouping(sno) s1/**goruping是一个聚合函数,其产生一个附加的列,当用cube或rollup运算符添加行时,附加的列输出值为1, 当所添加的行不是由cube或rollup产生时,附加列值为…

某近似模板题2

P3388 【模板】割点&#xff08;割顶&#xff09; 题目背景 割点 题目描述 给出一个n个点&#xff0c;m条边的无向图&#xff0c;求图的割点。 输入输出格式 输入格式&#xff1a; 第一行输入n,m 下面m行每行输入x,y表示x到y有一条边 输出格式&#xff1a; 第一行输出割点个数 …

Linux命令之hexdump

用途说明 hexdump命令一般用来查看”二进制“文件的十六进制编码&#xff0c;但实际上它的用途不止如此&#xff0c;手册页上的说法是“ascii, decimal, hexadecimal, octal dump“&#xff0c;这也就是本文标题为什么要将”十六“给引起来的原因&#xff0c;而且它能查看任何文…

流星,刹那间划过天际

此文献给那些已经经历,正在经历或者还没有经历恋爱的人们。流星&#xff0c;刹那间划过天际——佛说&#xff1a;前生一百次回眸&#xff0c;换来今生的一次邂逅一年前的一次恋爱让我疲惫不堪&#xff0c;在同学们羡慕眼光中的我们在刚刚上大学的时候就平静的分手了,一切都是那…

Tomcat 配置文件

Tomcat 站点配置1、bin目录下 1、catalina tomcat 主脚本、执行Java命令调用tomcat的启动与停止 2、cpappend 用于windows系统内部&#xff0c;将项目路径追加至tomcat的classpath 环境变量中 3、digest 生成tomcat密码的加密摘要 4、service 该脚本以windows方式安装卸载to…

SpringBoot启动项目出现Error:(3, 30) java: 程序包com.alibaba.druid.pool 程序包不存在——解决办法

运行程序报错 解决方法&#xff1a; mac电脑 Preference----->Build&#xff0c;Execution&#xff0c;Deployment——>maven—>Runner——>勾选Delegate IDE windows电脑 File—>Settings----->Build&#xff0c;Execution&#xff0c;Deployment——>…