统计学 卡方检验 吐槽

卡方检验是什么?

Publish Time:2018/04/16 22:31:19

Update Time:2018/04/19 13:47:55

统计学里有很多统计方法,有的名字听起来很能唬人。比如ANOVA,线性回归,卡方检验等。

但这些统计方法本质上都是为了描述数据或推断假设而存在的,并无稀奇之处。很多人故意搞的高深莫测,让人望而却步,以彰显自己功力的高深,实则是内心自卑,生怕露陷。

近两天读文献,发现两篇奇葩论文,还发表在外语类核心刊物上。

奇葩之处有二:一、蜜汁相似。2016年的一篇文章跟2012年的有很多句子一模一样。二、都用到了卡方检验,而且错得离谱。

首先,我们来看什么是卡方检验?

卡方检验(χ2 test / chi-square test)可以从名字上看出来,这是一种靠计算平方来进行的检验。“卡”是希腊字母 χ的音译。

我们通过举例来理解什么是卡方检验?

例一:

研究问题:喵星人更喜欢吃鱼还是肉?

提出零假设:喵星人喜欢吃鱼跟喜欢吃肉一样多。 所谓零假设就是不偏向任何一种选择可能的假设。

实验设计:找10只喵主子,同时给它们呈现一条鱼和一块肉,看其选择哪个。记录两种选择的数量。


结果1:假如我们发现有6只喵选择了鱼,4只喵选择了肉。我们能否得出结论说喵星人更喜欢吃鱼?

结果2: 假如我们发现有7只喵选择了鱼,3只喵选择了肉。我们能否得出结论说喵星人更喜欢吃鱼?

结果3: 假如我们发现有8只喵选择了鱼,2只喵选择了肉。我们能否得出结论说喵星人更喜欢吃鱼?

结果4: 假如我们发现有9只喵选择了鱼,1只喵选择了肉。我们能否得出结论说喵星人更喜欢吃鱼?

结果5: 假如我们发现有10只喵选择了鱼,0只喵选择了肉。我们能否得出结论说喵星人更喜欢吃鱼?


如果你脑袋正常,你会感觉结果1的结论有些勉强,而结果5的结论就很令人信服。

卡方检验就是把你这种感觉用一个统计数字量化出来。

下面我们用卡方检验来对上面的结果进行验证:

结果1:

 

 实际上喵的选择数量 6 4
 零假设中喵的选择数量 5 5


上述表格中,6和4称为观察频数(observed frequency),5称为期望频数(expected frequency)。5是怎么来的呢?从零假设得出的,零假设说喵星人对鱼和肉没有偏爱,那么选择鱼和肉的数量应当一致。

卡方公式:


fo即观察频数,fe即期望频数。

所以结果1的卡方计算过程为:

chi-square = (6-5)^2/5+(4-5)^2/5 = 0.4

同理:结果2的卡方计算过程为:

chi-square = (7-5)^2/5+(3-5)^2/5 = 1.6

同理:结果3的卡方计算过程为:

chi-square = (8-5)^2/5+(2-5)^2/5 = 3.6

同理:结果4的卡方计算过程为:

chi-square = (9-5)^2/5+(1-5)^2/5 = 6.4

同理:结果5的卡方计算过程为:

chi-square = (10-5)^2/5+(0-5)^2/5 = 10


可以看到观察频数与期望频数相差越大,卡方值越大。卡方值越大,我们越得出的结论越有信心。

那怎么确定卡方值多大时才能有把握说喵星人更喜欢鱼呢?

这时候需要查询卡方分布表:



第一列df是自由度(degrees of freedom):

对于拟合优度卡方检验来说,df = C-1。C是类别数量,这里就是鱼和肉两种。那么这个实验的df = 2-1= 1

卡方检验可以分为拟合优度检验和独立性检验两种。

拟合优度检验(test for goodness of fit)是对一个变量的检验。也就是看观察数值跟期望数值的拟合度。如果观察数值跟期望数值一致,卡方为0,拟合度最好,反之,卡方值越大,说明拟合度越差。

独立性检验(test for independence)是对两个变量的检验,看两个变量是否是独立的。如:内外向性格和颜色喜好之间是否存在联系。

观察卡方分布表:

对于df = 1,p=0.05对应的卡方值是3.84。也就是说,只要卡方值大于3.84,我们就有95%的把握说喵星人更喜欢吃鱼。

这样我们就可以用数据来说话,不是靠直觉了。

总的来说统计学就是让数字来代替直觉的。


待续。。。