不拒绝零假设意味着什么

由一道试题引发的一点思考

2008年统计学考研真题第四题“食品厂家说:净含量是每袋不低于250g。但有消费者向消协反映不是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验”

(1)如果厂家自己检验,你认为提出什么样的原假设和备则假设?并说明理由。
(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备则假设?并说明理由。

……

作为统计专业的学生来说,熟悉得不能再熟悉了。但是,通过做上面的题目,我发现自己在理解假设检验的问题上犯了一个十分严重的错误。这个问题主要是由于我们学的教材上面写着:“假设检验要么P-value小于a拒绝原假设,P-value大于a接受原假设……”。后来再看看其他教材,发现绝大多数都是这样写的。其实“P-value大于a接受原假设”这种说法是错误的。

P-value大于a的时候,结论到底是什么呢?最早提出这个问题的是:

E·皮尔逊问耶日·奈曼,在检验一组数据是否为正态分布时,如果没能得到一个显著性的 P值,那么怎样才能看这组数据是正态分布的呢?

费歇尔其实已经间接地回答了这个问题。费歇尔把比较大的 P 值(代表没有找到显著性证据)解释为:根据该组数据不能做出充分的判断。依据费歇尔的解释,我们绝对不会得出这样的推理,即没有找到显著性的证据,就意味着待检验的假设为真。这里
引用费歇尔的原话:

“相信一个假设已经被证明是真的,仅仅是由于该假设与已知的事实没有发生相互矛盾,这种逻辑上的误解,在统计推断上是缺乏坚实根基的,在其它类型的科学推理中也是如此。当显著性检验被准确使用时,只要显著性检验与数据相矛盾,这个显著性检验就能够拒绝或否定这些假设,但该显著性检验永远不能确认这些假设一定是真的,……”

所以假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的。当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确。

举个例子来说:比如原假设为H0: m =10,从该总体中抽出一个随机样本,得到`x=9.8,在a=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意味着样本提供的证据已经证明m=10是正确的。如果我们将原假设改为H0: m =10.5,同样,在a=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道。

总之,假设检验的主要目的是为了拒绝而不是接受。

由一道试题引发的另一道试题

这让我想到2007年统计学考研真题第一题问:“正态分布的假定能不能用数据证明?”

其实也是关于假设检验的问题,具体内容可以参看:



不拒绝零假设意味着什么》有22个想法

  1. 不拒绝并不意味着接受,这是吴老扯着嗓子强调了多年的问题:)

    另:为什么你每次用li标签的时候总是没有ul标签呢?……引用可以放在blockquote环境中。

  2. 我不是统计专业的,但只是对此感兴趣。老实说我对统计检验结果只能是“拒绝”和“无法拒绝”非常清楚,但对于楼主举例的这道考研题目倒不知如何下手,google了一把,也没找到答案,不知能否指点一二。谢谢!

  3. 不能拒绝零假设的话,大家都没话说,要是能够拒绝,那有一方就惨了。厂家当然希望消费者找不到证据,消费者当然希望告倒“奸商”。

  4. 前几篇都错了,忘记<>用全角符号了。请删除!不好意思麻烦管理员了!

    是否这样做
    厂家基于自己的利益提出:
    Ho:weight ≥ 250g;
    Ha:weight < 250g;

    消费者基于自己的利益提出:
    Ho:weight < 250g;
    Ha:weight ≥ 250g;

    这样对吗?

    但平时利用SPSS、Minitab做计算,Ho只能选择=形式,Ha倒是可以选择>、<、≠三种形式。
    我的第二个问题就是Ho是否只能选择=形式?

    请不吝指教,谢谢!

  5. 假设检验的主要目的是为了拒绝,所以厂家要说明自己的产品合格得拒绝原假设H0:weight < 250g;,所以上面反了。
    Ho不是只能选择=形式。

  6. [latex]H_0[/latex]是否是=其实无所谓,只是形式而已(但形式对于外行来说很重要),统计量的计算都是基于=的情况做的。关键是备择假设选取什么方向,这才是P值计算的根据。

  7. 感谢益辉的回答,我也发觉真正影响p值的,其实是Ha,而不是Ho,但始终不敢肯定,现在终于得到了肯定。

    但对郑冰的回复我还是存在疑问。在我的印象中,要拒绝Ho是不容易的,因为p必须<α。所以厂家基于自己的利益因该提出:
    Ho:weight ≥ 250g;
    Ha:weight < 250g。
    这样的话,即使实际测量得到的Weight<250,如果短斤少两不是很厉害的话,也无法拒绝Ho。

    不知我的考虑如何?敬请指教!谢谢!

  8. 说实话我觉得这道题出得有些无聊。按照郑冰的选择,如果拒绝,那么厂家高兴,如果不拒绝,那么厂家会说,不拒绝又不表示接受;按你的选择,如果拒绝,厂家就惨了,如果不拒绝,厂家也没有很强的理由占到便宜。但从是否容易拒绝零假设的角度来看,你说的也是有道理的。看来赶明儿我得上朝进谏取消这种诡辩题了……

  9. 呵呵,干脆把这道题目放上首页的竞赛,看看其他人有没有什么高招。

  10. 仔细想想应该这样说:
    食品厂家对于计量是否准确,心里是有数的。

    如果确实不短斤少两,食品厂家则按郑冰的做法,提出以下假设:
    Ho:weight = 250g;
    Ha:weight > 250g。
    这样可以非常有力的消除消费者的怀疑。

    如果确实少上一点,食品厂家则按我的做法,提出以下假设:
    Ho:weight = 250g;
    Ha:weight < 250g。

    如果少得比较厉害,食品厂家还是及早承认错误吧。

    不知这样解决如何?

    1. > Ho:weight = 250g;
      > Ha:weight > 250g。
      > 这样可以非常有力的消除消费者的怀疑。

      这种假设消费者能接受?除非都是傻子…直接把weight<250g剔除在决策空间之外了…

  11. 俺家同意miniwhale (#406)

    厂家基于自己的利益提出:
    Ho:weight ≥ 250g;
    Ha:weight < 250g;

    消费者基于自己的利益提出:
    Ho:weight < 250g;
    Ha:weight ≥ 250g;

    统计推断是倾向于保护零假设的。按厂家的方案:对厂家来说,不拒绝零假设(Ho:weight ≥ 250g)意味着用户没有充分证据支持
    Ha:weight < 250g。证据不足,当庭释放!

      1. 好像有问题,
        厂商不希望>=250g被拒绝,
        所以H0应该是<250g,应为H0可以被拒绝,但是不会是被接受。

  12. 建议大家看看这篇文章:《对假设检验中几个问题的思考》。《统计与决策》2006年6期。

  13. 同意郑冰 (#409).揣度出题本意,是消费者希望否认weight ≥ 250g,从而对消费者有:
    Ho:weight ≥ 250g;
    Ha:weight < 250g;
    这样如果p值显著,那商家就倒霉了;即使不显著也不代表商家给的weight就足量250g,消费者仍然可以不信的。

    有个几乎一模一样的例子,在Statistical Inference(Casella and Berger, second edition)第373页:As another example, a consumer might be interested in the proportino of defective items produced by a supplier. If theta denotes the proportion of the defective items, the consumer might wish to test H0: theta ≥ theta_0 versus H1:theta < theta_0. The value theta_0 is the maximum acceptable proportion of defective items …

  14. 对于H0是否accept,我觉得有必要考虑H0的形式,要是H0=的形式,we donot reject;
    要是Ho 属于一个范围,比如,H0>=的形式,我觉得可以说成accept.

    比如如果test theta的指,要是theta的真实值为3,

    Ho:theta=2.9,we donot reject Ho;

    要是Ho: theta>2, then we can say we accept Ho.

    不知道这个想法是否正确,望不吝赐教

发表评论

电子邮件地址不会被公开。 必填项已用*标注