4)对于大过程建模,影响因子太多,每个因子相关性都不大

  如果是对于大的过程建模,则可能存在如下的问题:

  ● 影响因子多,每个因子的相关性都不是很大;

  ● 影响因子多,采集数据有难度,对每个数据都要求很准确;

  ● 影响因子之间彼此有交互叠加的作用,有相关性,建模困难。

  5)样本量太少

  样本量太少,增加或删除一个样本对回归的结果影响很明显,则规律不具有典型性。比如,在下图中如果删除右上角的一个点,则两个变量之间没有相关性了,如果删除了右下的2个点则两个变量之间是相关的。之所以出现这种现象是样本点太少而导致的。

  6)样本不随机

  比如有2个变量X1,X2与Y都应该是正相关的,但是在实际中存在的数据却是:

   正相关   正相关
Y   x1   x2
中   大   小
中   小   大

  此时如果对这些类型的数据进行分析,则表现出来Y与X1,X2是不相关的。

  以测试过程为例,我们的经验与常识:

  假设或常识1:高水平的测试人员找出的BUG多, 低水平的测试人员找出的BUG少。

  假设或常识2:高水平的开发人员犯的错误应该少,低水平的开发人员犯的错误应该多。

  我们的实际数据:

  在实践中常常采用的策略:

  策略1:关键的模块应该由高水平的开发人员进行开发,非关键的模块由低水平的开发人员进行开发。

  策略2:高水平的测试人员要测关键的模块,低水平的测试人员测试非关键的模块。

  如果是这样,对于测试过程做了度量以后,数据无法证明假设1和2的成立。

  以上六个原因是常见的原因,这些原因在实际中克服起来并非那么容易,这也是为什么4-5级需要比较长的实施周期的原因。