如果你够严谨,你一定可以问出更多的类似的问题。我不认为这样的问题是吹毛求疵,看起来都相当的重要和合理,毕竟是人命关天的事情。

  我想他们没有选取那么多的场景和参数来测试,一个很重要的原因是这样的测试是破坏性的,每辆车都是在市场上按市价买的,花费也不少。要是从时速50 -100, 按5为步长,重叠从10% - 90%按10%为步长逐级测下去,该需要很多的车吧,显然成本太高。测试的覆盖率有所提高,但是一样是很不完备的。幸运的是,在软件测试中,我们的性能测试很多时候还不是破坏性,而且由于测试工具或者framework的支持,我们可以将性能测试自动化来覆盖很大的一个配置范围,从而得到很多不同情况下的结果。即便是这样的情况,实际做的时候我们还是要做些取舍,因为很多因素摆在一起,做正交的话数量一样大得惊人。比如一个邮件系统的测试可能包括这些参数:邮件的sample大小;policy的条数; 采取的action;核心处理进程的数目;所用机器的配置等等。

  既然如此,从可行性的角度,会引伸出另外一个问题,既然测不完,那么我们在有限的测试中,该如何选取配置或者参数?

  我想了很久,觉得一个合适的词是: Reasonable

  什么样的值大家觉得比较合理,在实际中比较会遇到,或者会概率比较高,或者大家想知道在这样的情况下的结果是什么。那么我们应该去测这样的场景。以谁的标准来觉得合理呢?这要看你做测试的上下文环境,通常还包括组织结构,提出这样的标准的可能是你的客户、产品经理、领域专家或者是有经验的测试人员。在实际中,一个好的 practice是邀请相应的stakeholder来review,听取大家的意见。

  正是基于以上的思考。过了一段时间,觉得其实这样的测试结果也是很有帮助的,当然前提是你理性的看待这样的参考。

  意义何在?

  对买车的人:得分高的车(通常)比得分低的车安全。

  对厂商:如果更进一步,可以看看它在哪一方面得分低,需要改进的是什么?

  对整个行业或者社会而言: 由于有了这样的评价标准,使得汽车安全的标准在不断提高,安全性的关注和投入更高,更多人的生命安全得到保障。

  正是因为看到这些意义,人们可以接受各种碰撞标准的不完美,而另一个方面,这样标准也在改进自己的方法。

  还有附录中的新闻提到的。

  在写这篇文章的时候还顺便引发了两个小的思考。

  关于工程

  更侧重实际的效果,而不是理论上的完美。

  测试的意义

  测试本身隐含的前提是”模拟“。

  by Ricky Q.