假设检验:什么是原假设和备择假设
为什么要有原假设和备择假设?为什么有的检验没有备择假设?如何确定一个实际问题的原假设和备择假设?
用贝叶斯公式解释原假设和备择假设
一味地抠字眼是不能深入理解这两个定义的,假设检验本质上是一个“由结果推原因”,用样本的观测值去推断样本的相关信息。很多书上是这么解释的:
因为
很小,弃真的概率很小。如果原假设成立,样本是不太可能落入拒绝域的,但是这个反常的事情发生了,那我们就有理由认为原假设不成立。
其实我们只需要说明:当检验统计量落入拒绝域的时候原假设成立的概率很小,这个可以用贝叶斯公式来解释:
设命题A:
则
有
同理
但是
如何由实际问题确定原假设和备择假设
因此,如果我们想要以十足的把握验证某个东西(记为A),应该把它的反面放在原假设,把他放在备择假设
,进行验证,我们希望出现的结果是检验统计量落入拒绝域,那么我们就有十足的把握认为原假设不能成立,即
反之,如果检验统计量落在接受域,就说明“我们没有充分的理由拒绝原假设”,往往认为原假设成立,但是这种认为成立的强度和拒绝原假设后认为原假设不成立的强度是不一样的。
另外如果需要验证“A B均值有显著区别”,“A 明显大于B"则对应的假设为
注意到,上面两个要验证的东西都有“显著”这层意思,因此要把要验证的东西的反面放在原命题。
为什么有的检验没有备择假设
陈书里说,备择假设就是“抛弃原假设之后可供选择的假设”。
但是为什么有的检验问题没有备择假设呢?
(比如验证统计量分布的检验),因为我们要验证的只是某统计量是否可以被认为服从某种分布,如果拒绝原假设,说明原假设不太可能发生,如果接受原假设,就表明我们没有充分的理由拒绝原假设,也就是说可以勉强认为随机变量服从这个分布。
我们如果拒绝了原假设,只能说这个统计量很有可能不服从原假设说的这个分布,具体服从什么分布我们是完全不知道的,如果有备择假设的话也只能是“
但是对于一般的参数检验问题,我们有的时候想验证的是原假设、有的时候想要验证原假设的反面(判断题目中是否有“显著”二字),这个时候备择假设就有意义了,他是我们拒绝原假设之后的选择,对于第二种情况,是我们想验证的东西。
为什么有的时候备择假设不是原假设的补
书上有这种题:
验证某某某变量的均值有没有显著提高
这个时候我们的原假设和备择假设往往是
但是我猜测是为了符合 “有没有显著提高”这个语境
,为了和这个对应起来,往往才把原假设写成