不拒绝零假设意味着什么
由一道试题引发的一点思考
2008年统计学考研真题第四题“食品厂家说:净含量是每袋不低于250g。但有消费者向消协反映不是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验”
(1)如果厂家自己检验,你认为提出什么样的原假设和备则假设?并说明理由。
(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备则假设?并说明理由。
……
作为统计专业的学生来说,熟悉得不能再熟悉了。但是,通过做上面的题目,我发现自己在理解假设检验的问题上犯了一个十分严重的错误。这个问题主要是由于我们学的教材上面写着:“假设检验要么P-value小于a拒绝原假设,P-value大于a接受原假设……”。后来再看看其他教材,发现绝大多数都是这样写的。其实“P-value大于a接受原假设”这种说法是错误的。
P-value大于a的时候,结论到底是什么呢?最早提出这个问题的是:
E·皮尔逊问耶日·奈曼,在检验一组数据是否为正态分布时,如果没能得到一个显著性的 P值,那么怎样才能看这组数据是正态分布的呢?
费歇尔其实已经间接地回答了这个问题。费歇尔把比较大的 P 值(代表没有找到显著性证据)解释为:根据该组数据不能做出充分的判断。依据费歇尔的解释,我们绝对不会得出这样的推理,即没有找到显著性的证据,就意味着待检验的假设为真。这里
引用费歇尔的原话:
“相信一个假设已经被证明是真的,仅仅是由于该假设与已知的事实没有发生相互矛盾,这种逻辑上的误解,在统计推断上是缺乏坚实根基的,在其它类型的科学推理中也是如此。当显著性检验被准确使用时,只要显著性检验与数据相矛盾,这个显著性检验就能够拒绝或否定这些假设,但该显著性检验永远不能确认这些假设一定是真的,……”
所以假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的。当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确。
举个例子来说:比如原假设为H0: m =10,从该总体中抽出一个随机样本,得到`x=9.8,在a=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意味着样本提供的证据已经证明m=10是正确的。如果我们将原假设改为H0: m =10.5,同样,在a=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道。
总之,假设检验的主要目的是为了拒绝而不是接受。
由一道试题引发的另一道试题
这让我想到2007年统计学考研真题第一题问:“正态分布的假定能不能用数据证明?”
其实也是关于假设检验的问题,具体内容可以参看:
- 统计学博文导读:统计分布的检验(谢益辉博客)

不拒绝并不意味着接受,这是吴老扯着嗓子强调了多年的问题:)
另:为什么你每次用li标签的时候总是没有ul标签呢?……引用可以放在blockquote环境中。
我不是统计专业的,但只是对此感兴趣。老实说我对统计检验结果只能是“拒绝”和“无法拒绝”非常清楚,但对于楼主举例的这道考研题目倒不知如何下手,google了一把,也没找到答案,不知能否指点一二。谢谢!
不能拒绝零假设的话,大家都没话说,要是能够拒绝,那有一方就惨了。厂家当然希望消费者找不到证据,消费者当然希望告倒“奸商”。
前几篇都错了,忘记<>用全角符号了。请删除!不好意思麻烦管理员了!
是否这样做
厂家基于自己的利益提出:
Ho:weight ≥ 250g;
Ha:weight < 250g;
消费者基于自己的利益提出:
Ho:weight < 250g;
Ha:weight ≥ 250g;
这样对吗?
但平时利用SPSS、Minitab做计算,Ho只能选择=形式,Ha倒是可以选择>、<、≠三种形式。
我的第二个问题就是Ho是否只能选择=形式?
请不吝指教,谢谢!
你可以用<和>分别表示<和>,如果你懂一点HTML的话。
假设检验的主要目的是为了拒绝,所以厂家要说明自己的产品合格得拒绝原假设H0:weight < 250g;,所以上面反了。
Ho不是只能选择=形式。
感谢益辉的回答,我也发觉真正影响p值的,其实是Ha,而不是Ho,但始终不敢肯定,现在终于得到了肯定。
但对郑冰的回复我还是存在疑问。在我的印象中,要拒绝Ho是不容易的,因为p必须<α。所以厂家基于自己的利益因该提出:
Ho:weight ≥ 250g;
Ha:weight < 250g。
这样的话,即使实际测量得到的Weight<250,如果短斤少两不是很厉害的话,也无法拒绝Ho。
不知我的考虑如何?敬请指教!谢谢!
说实话我觉得这道题出得有些无聊。按照郑冰的选择,如果拒绝,那么厂家高兴,如果不拒绝,那么厂家会说,不拒绝又不表示接受;按你的选择,如果拒绝,厂家就惨了,如果不拒绝,厂家也没有很强的理由占到便宜。但从是否容易拒绝零假设的角度来看,你说的也是有道理的。看来赶明儿我得上朝进谏取消这种诡辩题了……
呵呵,干脆把这道题目放上首页的竞赛,看看其他人有没有什么高招。
这个主要是讲道理,我怕到最后变成了口水战,公说公有理,婆说婆有理
仔细想想应该这样说:
食品厂家对于计量是否准确,心里是有数的。
如果确实不短斤少两,食品厂家则按郑冰的做法,提出以下假设:
Ho:weight = 250g;
Ha:weight > 250g。
这样可以非常有力的消除消费者的怀疑。
如果确实少上一点,食品厂家则按我的做法,提出以下假设:
Ho:weight = 250g;
Ha:weight < 250g。
如果少得比较厉害,食品厂家还是及早承认错误吧。
不知这样解决如何?
问题就在于俺们不知道厂家心里的谱到底是啥样的……
> Ho:weight = 250g;
> Ha:weight > 250g。
> 这样可以非常有力的消除消费者的怀疑。
这种假设消费者能接受?除非都是傻子…直接把weight<250g剔除在决策空间之外了…
所以说这道题其实挺无聊的……
[...] 不拒绝零假设意味着什么 郑冰作品:P-value大于a为什么不能说接受原假设; [...]
俺家同意miniwhale (#406)
厂家基于自己的利益提出:
Ho:weight ≥ 250g;
Ha:weight < 250g;
消费者基于自己的利益提出:
Ho:weight < 250g;
Ha:weight ≥ 250g;
统计推断是倾向于保护零假设的。按厂家的方案:对厂家来说,不拒绝零假设(Ho:weight ≥ 250g)意味着用户没有充分证据支持
Ha:weight < 250g。证据不足,当庭释放!
认同这个答案。
好像有问题,
厂商不希望>=250g被拒绝,
所以H0应该是<250g,应为H0可以被拒绝,但是不会是被接受。
建议大家看看这篇文章:《对假设检验中几个问题的思考》。《统计与决策》2006年6期。
同意郑冰 (#409).揣度出题本意,是消费者希望否认weight ≥ 250g,从而对消费者有:
Ho:weight ≥ 250g;
Ha:weight < 250g;
这样如果p值显著,那商家就倒霉了;即使不显著也不代表商家给的weight就足量250g,消费者仍然可以不信的。
有个几乎一模一样的例子,在Statistical Inference(Casella and Berger, second edition)第373页:As another example, a consumer might be interested in the proportino of defective items produced by a supplier. If theta denotes the proportion of the defective items, the consumer might wish to test H0: theta ≥ theta_0 versus H1:theta < theta_0. The value theta_0 is the maximum acceptable proportion of defective items …