编程大师说:“任何一个程序,无论它多么小,总存在着错误。”

  初学者不相信大师的话,他问:“如果一个程序小得只执行一个简单的功能,那会怎样?”

  “这样的一个程序没有意义,”大师说,“但如果这样的程序存在的话,操作系统后将失效,产生一个错误。”

  但初学者不满足,他问:“如果操作系统不失效,那么会怎样?”

  “没有不失效的操作系统,”大师说,“但如果这样的操作系统存在的话,硬件后将失效,产生一个错误。”

  初学者仍不满足,再问:“如果硬件不失效,那么会怎样?”

  大师长叹一声道:“没有不失效的硬件。但如果这样的硬件存在的话,用户会想让那个程序做一件不同的事,这件事也是一个错误。”

  没有错误的程序世间难求。[James 1999]

  错误是一种严重的程序缺陷。测试的目的是为了发现尽可能多的缺陷,并期望通过改错来把缺陷统统消灭,以期提高软件的质量。但关于测试与改错实在没有什么高明的方法值得大书特书,也不能表现出程序员的聪明才智。相反地,它们带来了更多的牢骚与痛苦。因此在教学和开发实践中,测试与改错总是被当作万般无奈的工作踢到角落里。

  医生可以把他的错误埋葬在地下了事,但程序员不能。我们必须要学会测试与改错,并且把测试与改错工作做好。

  7.1 对测试的理解

  测试的道理并不深奥,计算机专业人员都应该明白。但是这么简单的事,计算机专业的博士们也未必都已经理解。

  有,一位比我聪明,编程比我快,学习能力比我强的计算机专业博士生恭恭敬敬地请我坐好,并且地削了苹果请我吃,为的是向我请教“软件工程”问题。你必定以为这位仁兄好学之极。非也,我和他同事三年来从未探讨过“软件工程”问题。只因为他明天要去应聘,参加面试,生怕被人问倒,央我当晚为他恶补一把“软件工程”。他还特地问我“什么是白盒测试和黑盒测试?应该由谁来执行?”(有公司曾经这样面试应聘者)当我解释完测试的道理时,他叹了一口气说:“这些玩意儿我读大学十年来都没搞过,怎么能讲得出道理来。唉,去碰碰运气吧。”我有“兔死狐悲”的感觉。我们这一群博士生三年来尽干些自欺欺人的事,到毕业时学问既不深也不博。个个意志消沉,老气横秋。长此以往,总有招聘会的大门前将贴出标语“博士与狗不得入内”。

  以下是关于测试的几个重要观念。

  7.1.1 测试的目的

  测试的目的是为了发现尽可能多的缺陷。

  这里缺陷是一种泛称,它可以指功能的错误,也可以指性能低下,易用性差等等。测试总是先假设程序中存在缺陷,再通过执行程序来发现并终改正缺陷。理解测试的目的是个很重要的意识问题。如果说测试的目的是为了说明程序中没有缺陷,那么测试人员会向这个目标靠拢,因而下意识地选用一些不易暴露错误的测试示例。这样的测试是虚假的。

  目前高校的科技成果鉴定会普遍存在类似的虚假现象。我在读硕士时亲身经历过这样的事。我们的项目是研究集成电路制造过程中的成品率问题。当时国内大多数工厂的集成电路成品率只有百分之几,我编写的示例程序可以将集成电路的成品率优化到98%。示例效果是如此的好,以致一位评委(某厂的总工程师)不无讽刺地说:“采用你们的成果,我们可要发大财了。”这个项目轻易地通过了鉴定,并且不久后获得了电子工业部科技进步二等奖。这象在考试时通过作弊取得了好成绩而被表扬。我那时尚且纯真,羞愧之余,不禁对高校科研成果的水平和真实性大失所望(现在我已不再失望,因为很少抱希望)。

  一个成功的测试示例在于发现了至今尚未发现的缺陷。

  测试并不仅是个技术问题,更是个职业道德问题。

  7.1.2 测试的心理要求

  测试主要是由人而不是由机器执行,这不免与心理因素相关。为了测试的真实性,对测试的心理要求是“无情”。这似乎太残酷了。开发人员不能很好地测试自己的程序是因为做不到无情。而测试人员如果做到了无情却会引起开发人员的愤怒,遭人白眼。
  尽管已经明白了测试的目的是为了发现尽可能多的缺陷,但当测试人员真的发现了一堆缺陷时,却不可乐颠颠地跑去恭喜那个倒霉的开发者,否则会打架的。

  7.1.3 测试的真理

  测试只能证明缺陷存在,而不能证明缺陷不存在。

  这个真理告诉我们,对于一个复杂的系统而言,无论采取什么样的测试手段都不能证明缺陷已经不复存在。“彻底地测试”只是一种理想。在实践中,测试要考虑时间、费用等限制,不允许无休止地测试。

  7.1.4 测试与质量的关系

  测试有助于提高软件的质量,但是提高软件的质量不能依赖于测试。测试与质量的关系很象在考试中“检查”与“成绩”的关系。

  学习好的学生,在考试时通过认真检查能减少因疏忽而造成的答题错误,从而“提高”了考试成绩(取得他本来该得的好成绩)。

  而学习差的学生,他原本不会做题目,无论检查多么细心,也不能提高成绩。

  所以说,软件的高质量是设计出来的,而不是靠测试修补出来的。

  7.2 测试人员的选择

  测试需要开发人员参与吗?

  测试需要独立的测试小组吗?

  测试需要用户参与吗?

  让我们先看一看Microsoft公司关于测试的经验教训,再回答上述问题。

  7.2.1 Microsoft公司的经验教训

  在80年代初期,Microsoft公司的许多软件产品出现了“Bug”。比如,在1981年与IBM PC机一起推出的BASIC软件,用户在用“.1”(或者其他数字)除以10时,会出错。在FORTRAN软件中也存在破坏数据的“Bug”。由此激起了许多采用Microsoft操作系统的PC厂商的极大不满,而且很多个人用户也纷纷投诉。

  Microsoft公司的经理们发觉很有必要引进更好的内部测试与质量控制方法。但是遭到很多程序设计师甚至一些高级经理的坚决反对,他们固执地认为在高校学生、秘书或者外界合作人士的协助下,开发人员可以自己测试产品。在1984年推出Mac机的Multiplan(电子表格软件)之前,Microsoft曾特地请Arthur Anderson咨询公司进行测试。但是外界公司一般没有能力执行全面的软件测试。结果,一种相当厉害的破环数据的“Bug”迫使Microsoft公司为它的2万多名用户免费提供更新版本,代价是每个版本10美元,一共化了20万美元,可谓损失惨重。