由一道试题引发的一点思考

2008年统计学考研真题第四题“食品厂家说：净含量是每袋不低于250g。但有消费者向消协反映不是250g，消协据此要求厂家自检，同时消协也从中随机抽取20袋检验”

（1）如果厂家自己检验，你认为提出什么样的原假设和备则假设？并说明理由。

（2）如果从消费者利益出发，你认为应该提出什么样的原假设和备则假设？并说明理由。

……

作为统计专业的学生来说，熟悉得不能再熟悉了。但是，通过做上面的题目，我发现自己在理解假设检验的问题上犯了一个十分严重的错误。这个问题主要是由于我们学的教材上面写着：“假设检验要么P-value小于a拒绝原假设，P-value大于a接受原假设……”。后来再看看其他教材，发现绝大多数都是这样写的。其实“P-value大于a接受原假设”这种说法是错误的。

P-value大于a的时候，结论到底是什么呢？最早提出这个问题的是：

E·皮尔逊问耶日·奈曼，在检验一组数据是否为正态分布时，如果没能得到一个显著性的 P值，那么怎样才能看这组数据是正态分布的呢？

费歇尔其实已经间接地回答了这个问题。费歇尔把比较大的 P 值（代表没有找到显著性证据）解释为：根据该组数据不能做出充分的判断。依据费歇尔的解释，我们绝对不会得出这样的推理，即没有找到显著性的证据，就意味着待检验的假设为真。这里

引用费歇尔的原话：

“相信一个假设已经被证明是真的，仅仅是由于该假设与已知的事实没有发生相互矛盾，这种逻辑上的误解，在统计推断上是缺乏坚实根基的，在其它类型的科学推理中也是如此。当显著性检验被准确使用时，只要显著性检验与数据相矛盾，这个显著性检验就能够拒绝或否定这些假设，但该显著性检验永远不能确认这些假设一定是真的，……”

所以假设检验的目的在于试图找到证据拒绝原假设，而不在于证明什么是正确的。当没有足够证据拒绝原假设时，不采用“接受原假设”的表述，而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论，我们没有说原假设正确，也没有说它不正确。

举个例子来说：比如原假设为H0: m =10，从该总体中抽出一个随机样本，得到`x=9.8，在a=0.05的水平上，样本提供的证据没有推翻这一假设，我们说“接受”原假设，这意味着样本提供的证据已经证明m=10是正确的。如果我们将原假设改为H0: m =10.5，同样，在a=0.05的水平上，样本提供的证据也没有推翻这一假设，我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢？我们不知道。

总之，假设检验的主要目的是为了拒绝而不是接受。

由一道试题引发的另一道试题

这让我想到2007年统计学考研真题第一题问：“正态分布的假定能不能用数据证明？”

其实也是关于假设检验的问题，具体内容可以参看：

统计学博文导读：统计分布的检验（谢益辉博客）

不拒绝零假设意味着什么

郑冰

由一道试题引发的一点思考

由一道试题引发的另一道试题