SPSS学习系列24.-卡方检验

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS学习系列24.-卡方检验

24. 卡方检验

卡方检验,是针对无序分类变量的一种非参数检验,其理论依据是:实际观察频数f 0与理论频数f e (又称期望频数)之差的平方再除以理论频数所得的统计量,近似服从2χ分布,即

(n f f f e

e 2

202

~)(χχ∑-= 卡方检验的一般是用来检验无序分类变量的实际观察频数和理论频数分布之间是否存在显著差异,二者差异越小,2χ值越小。

卡方检验要求:

(1)分类相互排斥,互不包容; (2)观察值相互独立;

(3) 样本容量不宜太小,理论频数≥5,否则需要进行校正(合并单元格、增加样本数、去除样本法、使用校正公式校正卡方值)。

卡方校正公式为:

--=e

e f f f 2

02

)5.0(χ

卡方检验的原假设H 0: 2χ= 0; 备择假设H 1: 2χ≠0; 卡方检验的用途:

(1)检验某连续变量的数据是否服从某种分布(拟合优度检验); (2)检验某分类变量各类的出现概率是否等于指定概率; (3)检验两个分类变量是否相互独立(关联性检验); (4)检验控制某几个分类因素之后,其余两个分类变量是否相

互独立;

(5)检验两种方法的结果是否一致,例如两种方法对同一批人进行诊断,其结果是否一致。

(一)检验单样本某水平概率是否等于某指定概率

一、单样本案例

例如,检验彩票中奖号码的分布是否服从均匀分布(概率=某常值);检验某产品市场份额是否比以前更大;检验某疾病的发病率是否比以前降低。

有数据文件:

检验“性别”的男女比例是否相同(各占1/2)。

1. 【分析】——【非参数检验】——【单样本】,打开“单样本非参数检验”窗口,【目标】界面勾选“自动比较观察数据和假设数据”

2.【字段】界面,勾选“使用定制字段分配”,将变量“性别”选入【检验字段】框;

注意:变量“性别”的度量标准必须改为“名义”类型。

3. 【设置】界面,选择“自定义检验”,勾选“比较观察可能性和假设可能性(卡方检验)”;

4. 点【选项】,打开“卡方检验选项”子窗口,本例要检验男女概率都=0.5,勾选“所有类别概率相等”;

注:若有类别概率不等,需要勾选“自定义期望概率”,在其表中设置各类别水平及相应概率。

点【确定】回到原窗口,点【运行】得到

双击上表,得到更多的描述:

结果说明:

(1)男生的观察频数为28,理论频数为25,残差=3;女生的观察频数为22,理论频数为25,残差=-3;可以计算

卡方值=[32+(-3)2]/25=0.72

(2)卡方检验的P值=0.396>0.05, 故接受原假设H0,即认为男女性别人数无差异。

注:卡方检验的P值是近似P值,若用“二项分布检验”计算出精确P值=0.480. 另外,上述卡方检验也可以用:【分析】——【非参数检验】——【旧对话框】——【卡方】

得到的结果是一致的。

二、两样本或多样本案例——比较不同类的构成比或发生率的差异

问题:两组收入不同的受访家庭其轿车拥有率的比较。

使用【交叉表】的卡方检验来实现,需要注意:若交叉表中存在有序分类变量,则适合用秩和检验而不是卡方检验。

有数据文件:

变量O1表示是否拥有轿车:“1=有,2=没有”;

变量Ts9表示收入级别:“1=4.8万以上,2=4.8万以上”。

1. 【分析】——【描述统计】——【交叉表】,打开“交叉表”窗口,将变量“Ts9收入级别”选入【行】框,将变量“O1是否拥有轿车”选入【列】框,根据需要勾选“显示复式条形图”;

2. 点【统计量】,打开“统计量”子窗口,勾选“卡方”表示进行卡方检验;

3. 点【继续】回到原窗口,点【单元格】打开“单元显示”窗口,【计数】输出观察频数和理论频数,默认勾选“观察值”;【百分比】勾选“行”;【非整数权重】设置小数权重问题,保持默认;

注:“残差”设置残差的输出方式;“z-检验”对多于两组的数据做两两组间比较;

点【继续】回到原窗口,点【确定】得到

案例处理摘要

案例

有效的缺失合计

N 百分比N 百分比N 百分比

家庭收入2级 * O1. 是否拥有家用轿

989 86.2% 158 13.8% 1147 100.0%

家庭收入2级* O1. 是否拥有家用轿车交叉制表

O1. 是否拥有家用轿车合计

有没有

家庭收入2级Below 48,000

计数32 303 335

家庭收入2级中的 % 9.6% 90.4% 100.0% Over 48,000

计数225 429 654

家庭收入2级中的 % 34.4% 65.6% 100.0%

合计

计数257 732 989

家庭收入2级中的 % 26.0% 74.0% 100.0% 低收入家庭有9.6%拥有轿车;高收入家庭34.4%拥有轿车。

卡方检验

值df 渐进 Sig. (双侧) 精确 Sig.(双侧) 精确 Sig.(单侧) Pearson 卡方71.134a 1 .000

连续校正b69.848 1 .000

似然比80.146 1 .000

Fisher 的精确检验.000 .000 线性和线性组合71.062 1 .000

有效案例中的 N 989

a. 0 单元格(0.0%) 的期望计数少于 5。最小期望计数为 87.05。

b. 仅对 2x2 表计算

脚注a说明没有单元格的期望频数<5, 满足Pearson卡方检验要求,故看Pearson卡方检验结果即可:P值=0<0.05, 拒绝原假设H0,即高低收入不同的家庭轿车拥有上的差异有统计学意义。

注:(1)“Pearson卡方”:最标准最常用;

相关文档
最新文档