黑盒测试进阶之后端server巧用对比测试

作者：搜狗测试发布时间：[ 2016/9/27 16:46:35 ] 推荐标签：功能测试黑盒测试对比测试

　　一、什么是对比测试
　　一般而言，对比测试是一种将两个可比较的对象、在相同的环境下、使用特定的工具或方法等进行比较后，分析两者之间的变化情况是否有潜在风险、是否符合测试预期的方法。
　　二、为何要做对比测试
　　后端server测试常遇到这样的问题：测试某些任务如server重构或业务逻辑特别复杂、引入新计算模型等任务时，小数据集的功能测试和大数据集的性能测试，并不能可靠地评估性能、效果变化是否符合预期。对比测试能在数据多样、逻辑繁多复杂的测试任务中，帮助测试人员发现更多待测对象内部问题，更全面地保证任务的测试质量、降低出现问题的风险。
　　三、对比测试适用对象
　　需要评估性能、效果变化影响的持续迭代的server或流程测试任务，以及需要验证功能是否一致但功能自动化测试覆盖率低的server或流程测试任务。
　　四、如何做对比测试
　　后端server对比测试的常规操作方法是，尽可能保持测试环境一致性前提下，通过对新旧两版server分别进行同大数据量输入，结束后统计和对比日志，得到对比结果。
　　对比测试一般有功能一致性对比、效果对比和性能对比。通常情况下，同server的版本迭代，不会引起性能、效果等的大幅度变化。
　　功能一致性对比
　　功能一致性对比指将新旧版server输出结果相关日志按字段逐一进行异同比较，预期结果是除时间、随机字段等不确定或无意义字段外，其他字段值对比一致。一致性对比对测试环境要求很高，除了新旧版本运行环境一致外，还需事先排除环境配置和数据中不可控因素如流量比例。
　　案例
　　在商业广告后端server测试中一致性对比亦发挥极其重要的作用。某测试任务的测试场景是广告server的某个id从32位升至64位，涉及到id定义、赋值、输出等升级修改，但不涉及server代码逻辑变动。由于广告server功能模块多，逻辑复杂，代码量大，若仅仅采用代码走读方法测试需要测试人员非常熟悉server全部代码且火眼金睛，同时有足够长的测试时间，否则遗漏未改处不易发现，以致导致极严重后果。而采用一致性对比测试，若某正常日志字段对比不一致，即可定位到某处id未修改或修改错误。
　　上图是server log中的查询词返回广告对比结果示意图，通过逐字段对比可见日志35字段有差异，同时本次打压发现有8%的结果数据有差异，通过该差异定位到server某功能模块代码中id修改遗漏导致数据截断，业务逻辑失效。
　　效果对比
　　服务效果有对应的效果指标，如消耗（收益）、过滤比例等。为了能尽快在比较中发现问题，设定的效果指标要全面、并逐级细化。
　　案例
　　消耗对比常用于评估商业广告后端server提升或优化效果。从总体消耗入手，细化到各个渠道或策略，再进一步细化到各个广告位，分渠道分广告位统计和对比消耗，并给出差异情况。通常情况，一定比例范围内的差异如2%属于正常情况。
　　消耗对比在商业广告后端的Xserver中统计，该server日志记录了与消耗统计相关的多个信息字段。评估后端某个server对广告消耗的影响时，可通过搭建整套的商业广告后端server测试拓扑，对比测试时仅切换待测server新旧版本。如下图所示是某次测试任务消耗对比图之一，可见新server广告效果有一定幅度提升。

　　性能对比
　　通常性能测试是获得server在某种特定条件下的性能指标数据，作为后续的参考和对比依据，其往往受硬件系统、测试环境（配置和数据）等外在因素影响，易与标准值产生偏差。性能对比不失为一种独辟蹊径的性能评估方法，其可将外在因素导致的偏差降到低，同时测试人员亦不必准确掌握服务各性能指标的标准值。
　　案例一
　　性能对比常用于评估商业广告后端server的性能影响，测试时除了采用部分通用性能测试指标外，还可根据待测server的自身特点和测试目的建立特有性能指标。在某server性能对比测试中，采用如下性能指标：CPU、虚存、实存、负载均值、句柄数、平均响应时间、总超时率、rs超时率、qs超时率、丢包率10个指标。
　　特有性能指标对比：