一个令人纠结的性能缺陷
作者:网络转载 发布时间:[ 2015/9/25 14:16:48 ] 推荐标签:缺陷管理 软件测试管理
经过一段时间的连续连续加班,持续大概4个月的性能测试项目终于要结束了,现在想想,各种酸甜苦辣都有吧
本次项目我作为一个专职的性能测试人员,我比较幸运,我和其他功能测试人员同时入场了,入场之后,功能测试人员都在忙着熟悉需求、编写测试案例,而我在熟悉需求的同时编写性能测试计划、测试方案以及测试案例,顺便忙里偷闲跟着功能测试组学习informatica如何使用,ETL如何测试,毕竟这部分以前没有接触过,顺便帮功能测试组干点活,这样,一个月过去了,性能测试设备到位了,开始安装环境,一共四台机器,搭建过环境的朋友都知道,安装手册主要是提供思路,想按照安装手册一帆风顺的装下去那几乎是不可能,中间遇到了很多问题,通过百度、求助别人,大概用了8个工作日,环境搭建完成了,接着是开发测试脚本,这个过程还算顺利,不顺利的情况在测试执行的时候出现了,当测试执行多用户并发是,发现只要超过20个用户登陆,数据库CPU使用率到90%左右(当时用的可是32C 64G的机器),难道32C 64G的机器不能支持20个虚拟用户的并发,大概测试了20个功能点都这样,如果这个问题不解决,后面的混合场景、稳定性测试、浪涌测试、疲劳测试、容量测试都无法进行,此时距上线大概只有两周时间了,测试组着急,开发组在修复缺陷的同时也派人专门支持性能测试、开发组在整个过程中也检查自己是否加了索引,也针对这些功能点重建了索引,行方的质量经理也很着急,虽然大家都很着急,但是问题还没有解决,行方请来了数据中心的数据库维护人员,请来的第一位女大侠进行简单的分析以后,把SGA由之前的12G调整到16G以后忙自己的事情去了,让我们重新测试,说要是还有问题把报告打出来,我们经过测试发现此问题还在,第二天晚上加班的时候又请了一位数据中心的人进行诊断,诊断的结果是oralce启用了很多进程,和其它并发用户相同的系统比较,其他系统没有这么多的进程,至于CPU使用率为什么这么高,暂时还是没有答案,在此过程中,我在网上进行了各种资料的查询(那时候白天在客户现场不能上班,只能晚上回来查询了,记录下来,第二天去检查测试环境是否存在类似的问题),学习了oracle的共享服务器模式还是专有服务器模式,以及网上有人说的一些配置文件的查看,还是没有解决问题,那时候怀疑可能是安装问题还是配置文件出问题,因为当时的想法是请了两个数据中心的人都没诊断出问题,那指定不是一般问题,也不是小问题(现在想想,那时候太崇拜技术大拿了),后抱着试一试的心态在网上在看看,后通过这样一个sql语句解决了问题
select sql_text,spid,v$session.program,process from v$sqlarea,v$session,v$process where v$sqlarea.address=v$session.sql_address and v$sqlarea.hash_value=v$session.sql_hash_value and v$session.paddr=v$process.addr and v$process.spid in(PID);
首先使用topas查到消耗CPU比较高的进程,然后获取进程的ID,讲进程id扔在上述sql语句的PID进程处,执行该sql语句,后抓到了一个sql语句,对sql语句进行了分析,分析了sql语句的执行计划,发现执行了全表扫面,而且这个sql语句同时从4张表的查询语句,那这个语句是干嘛的,为什么测试的每个功能点都用用到呢?难道是平台框架的?也不像啊?
登陆系统,发现登陆完成以后,首页有好多种提示信息/待办事宜(类似于个贷系统提示客户贷款到期、贷款逾期的这种待办事宜)这下大家恍然大悟了,为什么每个功能点都有类似的问题,只要你登陆完成,系统会自动查询,当多用户并发时,由于sql语句不当的执行计划导致消耗了更高的CPU,这个问题终于解决了,很开心,这也是自己动手解决的第一个性能问题,以前只是协助定位,系统如期上线了,难道结束了了吗?没有
第一:为什么开发明确说加了索引后还是索引的问题呢,个人觉得主要是项目周期比较紧,开发流程控制不严格,按照开发组的说法在后面要重建索引,但是性能测试要进行性能测试,他们对大部分功能点表添加了索引,忽略了首页提醒信息/待办事宜的几张表
第二:数据中心的人为什么没有检查索引的问题呢?太相信开发了,因为这些开发大多数都有10年的工作经验,所以大家对开发的话深信不疑。
第三:数据中心的人为什么没有直接打出AWR或者statspack报告而直接调整了SGA呢?也许他们太忙了还是有别的原因,我们不得而知。
第四:为什么数据中心的第二位大拿发现oracle数据库启动了那么多进程而并发用户差不多的另一个系统却没有呢,我们系统使用了专有服务器,而另一个系统使用了共享服务器。
通过这个问题,我想说,第一大家不要过分崇拜技术大牛而藐视自己,第二不要百分之百相信开发组或者其他人的话,虽然他们经验很丰富、你可以表面上相信,但是别忘了实践时间出真理 第三、发现问题,一定要监控、拿出数据报告说话、毕竟推断和猜测还是有区别的。
相关推荐
更新发布
功能测试和接口测试的区别
2023/3/23 14:23:39如何写好测试用例文档
2023/3/22 16:17:39常用的选择回归测试的方式有哪些?
2022/6/14 16:14:27测试流程中需要重点把关几个过程?
2021/10/18 15:37:44性能测试的七种方法
2021/9/17 15:19:29全链路压测优化思路
2021/9/14 15:42:25性能测试流程浅谈
2021/5/28 17:25:47常见的APP性能测试指标
2021/5/8 17:01:11