spss之统计挖掘第7章 定性资料统计推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
n(
A2 nR nC
1)
上式中,A为第R行第C列对应的实际频数,nR为第R行的 行合计,nC为第C列的列合计,n为总样本含量。
7.3 成组设计行乘列表资料的卡方检验
▪ 2、多个构成比之间的比较 对多个构成比检验的目的是推断各样本分别代表的总体构
成比是否相同,用2检验,基本思想同前。首先假设各 样本所代表的总体构成比相同,均等于合计的构成比, 据此,可算得每个格子的理论频数。
由于甲乙两法一致阳性数a和一致阴性数d相同,如果要比 较甲乙两法何者为优,只要比较b和c即可,采用配对2检 验(或McNemanr检验);如果要了解甲乙两法测定结果 之间有无相关关系,则要考虑a、b、c、d,采用普通四格 表2检验。
配对2检验专用公式为:
2 (b c)2
bc
若b+c<40,应该对式(7-4)进行校正,则校正公式为:
IBM-SPSS
第7章 定性资料统计推断
目录
7.1 成组设计四格表资料卡方检验 7.2 配对设计四格表资料卡方检验 7.3 成组设计行乘列表资料的卡方检验 7.4 似然比检验和确切概率法 7.5 卡方检验的多重比较
7.1 成组设计四格表资料卡方检验
▪ 原理
2检验就是一种用来检验给定的样本数据是否来自特定 分布的办法。它主要运用于定性资料的统计推断。 2检验的零假设假定比较样本来自总体率相等的总体,它 是实际频数与理论频数吻合程度的指标,差值越小,吻 合程度越高。
3)单击“统计量”命令,弹出下图所示的“统计量”对话 框,单击“卡方”和“McNemar”按钮。
7.3 成组设计行乘列表资料的卡方检验
▪ 原理
▪ 1、多个样本率比较
如果是多个率的比较,其基本数据有R行2列,构成R×2 表,用以表述R个率的基本数据,如图7-17所示。R×2 表的2检验用于推断R个样本率各自所代表的总体率是 否相等,其基本解题思想同前,2值的计算可按公式71,但用公式7-6计算更为方便,两式等价。
3)单击“统计量”,弹出下图所示的“统计量”对话框, 勾选“卡方”,单击“确定”按钮。
▪ 卡方:此对话框是对资料用于卡方检验,对于四格表资 料会自动校正卡方检验的结果。
▪ 相关性:用于计算行列变量的Pearson相关系数和 Spearman等级相关系数。
▪ 名义复选框组:用于分类变量的相关性,无论是有序分 类还是无序分类变量均可使用。
行了抽样调查,资料如图7-26所示试考察该地城、乡儿 童体重状况的构成比有无差别?
模块解析
1、建立数据库
2、分析步骤
1)单击“数据”|“加权个案”命令,弹出加权个案对话 框,如下图所示。“加权个案”框中放入本次需要加权的 变量“频数”。
2)单击“分析”|“描述统计”|“交叉表”命令,弹出交 叉表对话框,如下图所示。“行”框中放入本次需要比较 的变量“地区”,“列”框中放入本次需要比较的变量“ 营养类型”。
1、建立数据库
2、分析步骤
1)单击“数据”|“加权个案”命令,弹出加权个案对话 框,如下图所示。“加权个案”框中放入本次需要加权的 变量“频数”。
2)单击“分析”|“描述统计”|“交叉表”命令,弹出交 叉表对话框,如下图所示。“行”框中放入本次需要比较 的变量“处理方法”,“列”框中放入本次需要比较的变 量“治疗结局”。
2 (| b c | 1)2
bc
模块解读
1、建立数据库
2、分析步骤
1)单击“数据”|“加权个案”命令,弹出加权个案对话 框,如下图所示。“加权个案”框中放入本次需要加权的 变量“频数”。
2)单击“分析”|“描述统计”|“交叉表”命令,弹出交 叉表对话框,如下图所示。“行”框中放入本次需要比较 的变量“甲法”,“列”框中放入本次需要比较的变量“ 乙法”。
2、分析步骤
3)单击“分析”|“描述统计”|“交叉表”命令,弹出交 叉表对话框,如下图所示。“行”框中放入本次需要比较 的变量“聘任制看法”,“列”框中放入本次需要比较的 变量“地区”。
2、分析步骤
4)单击“统计量”按钮,弹出下图所示的“统计量”对话 框,单击“卡方”。
▪THE END
如果检验假设是真实的,则每一格子的理论频数与实际频 数一般均不会相差很大,即2值一般不会很大;若根据 样本信息算得一个很大的2值,则有理由怀疑H0的成立, 进而拒绝它。
7.3 成组设计行乘列表资料的卡方检验
▪ 例题
1、多个样本率之间的比较 例7-3:某地调查了2000~2003四个年度中小学女生的贫
3)单击“统计量”按钮,弹出下图所示的“统计量”对话 框,单击“卡方”按钮。
4)单击“单元格”,弹出下图所示的“单元格”对话框, 单击“观察值”、“期望值”、“行”和“列”按钮。
7.3 成组设计行乘列表资料的卡方检验
▪ 例题
1、多个构成比之间的比较 例7-4:某市对城市和农村小学三~四年级学生体重状况进
网络上很多人讨论,但均没有简便可行的办法,有人提出 用卡方分割法(partitions of 2 method),或者用 Scheffe'可信区间法和SNK法等等,比较复杂。现将一 种比较简单的,可直接在SPSS中进行两两比较的方法 举例如下。
模块解读
▪ 例题
例7-7:某高校为了了解乡镇,县城和城市中不同教师对于 教师聘任制的看法,进行调查,具体数据如图7-53所示 。
▪ 有序复选框组:用于反映分量变量一致性的指标。
▪ Kappa:表示内部一致性,它的值位于0-1之间,高于 0.75表示一致性高,低于0.4表示一致性差。
▪ 风险:用于计算比值比OR值和相对危险度RR值。
▪ Mcnemar:主要用于配对卡房检验时使用。
7.2 配对设计四格表资料卡方检验
▪ 原理
如果在定性资料的统计分析中,如两组率之间的比较,设 计类型如果是按配对设计,则要按配对设计的卡方检验 来完成。不能采用成组设计的卡方检验,否则会降低统 计学的检验效能。
血状况,如图7-17所示,问各年度间学生贫血率有无差 别?
模块解读
1、建立数据库
2、分析步骤
1)单击“数据”|“加权个案”命令,弹出加权个案对话 框,如下图所示。“加权个案”框中放入本次需要加权的 变量“频数”。
2)单击“分析”|“描述统计”|“交叉表”命令,弹出交 叉表对话框,如下图所示。“行”框中放入本次需要比较 的变量“年份”,“列”框中放入本次需要比较的变量 “贫血情况”。
7.2 配对设计四格表资料卡方检验
▪ 例题
例7-2:某医院采用甲乙两种方法测定60例恶性肿瘤患者 体内ck20基因表达阳性率,甲法测定阳性率为70.0%, 乙法测定阳性率为38.3%,两种方法一致测定阳性率为 26.7%。为比较甲乙两种方法的测定阳性率是否有差异 ?,如图7-9所示。
现将资料整理为配对计数资料的四格表,见上表。该实验 结果表明:甲+乙+为a,甲+乙-为b,甲-乙+为c, 甲-乙-为d。
2检验的统计量为:
上面的统计量最先由英国统计学家K.Pearson提出。其中 A表示实际频数,T表示理论频数,k表示组数, i=1,2……k。
7.1 成组设计四格表资料卡方检验
理论频数T的计算可用公式7-2:
TRC
nR nC n
公式中TRC表示第R行(row)第C列(column)的理论频数 ,nR为相应行的合计,nC为相应列的合计,n为总例数。
▪ 3)单击“统计量”按钮,弹出下图所示的“统计量”对 话框,单击“卡方”按钮。
4)单击“单元格”按钮,弹出下图所示的“单元格”对话 框,选择“观察值”、“期望值”、“行”和“列”。
7.4 似然比检验和确切概率法
1、似然比检验 例7-5:某医院检测了郊区430名5~7岁儿童的血红蛋白 (mg/ml),如图7-35所示。问该地儿童血红蛋白含量的 构成比在不同年龄间有无差别?
行×列表的自由度: =(行数-1) ×(列数-1)
当n足够大时,2的统计量近似的服从自由度为k-1的2分 布。
7.1 成组设计四格表资料卡方检验
▪ 例题
例7-1:将食道癌患者随机分成两组,分别做联合化疗和单 纯化疗,治疗5年后,两组的存活率见图7-1,问两种疗 法的总体存活率是否不同?
模块解读
模块解读
1、建立数据库
2、分析步骤
1)单击“数据”|“加权个案”命令,弹出加权个案对话 框,如下图所示。“加权个案”框中放入本次需要加权的Fra Baidu bibliotek变量“频数”。
2)单击“分析”|“描述统计”|“交叉表”命令,弹出交 叉表对话框,如下图所示。“行”框中放入本次需要比较 的变量“年龄”,“列”框中放入本次需要比较的变量 “血红蛋白含量”。
3)单击“统计量”按钮,弹出下图所示的“统计量”对话 框,单击“卡方”按钮。
4)单击“单元格”按钮,弹出下图所示的“单元格”对话 框,选择“观察值”、“期望值”、“行”和“列”。
2、 确切概率法
例7-6:某高校调查一批高血压患者的血压控制情况和肥 胖度,数据见下表,问患者血压控制情况与肥胖度是否有 关?如图7-44所示。
模块解读
1、建立数据库
2、分析步骤
1)单击“数据”|“加权个案”命令,弹出加权个案对话 框,如下图所示。“加权个案”框中放入本次需要加权的 变量“频数”。
2)单击“分析”|“描述统计”|“交叉表”命令,弹出交 叉表对话框,如下图所示。“行”框中放入本次需要比较 的变量“肥胖程度”,“列”框中放入本次需要比较的变 量“血压控制情况”。
由公式7-1可看出,2值的大小除取决于|A(-A TTT|)的2 差值外,
还与基本数据的格子数有关(因为每格的
都≥0 ,且
一般都>0,故2值一般随着格子数的增多而加大),严格
地说是与自由度有关。
7.1 成组设计四格表资料卡方检验
四格表及行×列表的自由度,是指在表中周边合计数不 变的前提下,基本数据可以自由变动的格子数,其中任 何一个数据发生变化,其余三个数据由于受周边合计数 的限制,只能随之相应变动,故其自由度为1;若基本数 据大于4个,则自由度也必大于1。
1、建立数据库
2、分析步骤
1)单击“数据”|“加权个案”命令,弹出加权个案对话 框,如下图所示。“加权个案”框中放入本次需要加权的 变量“频数”。
2、分析步骤
2)单击“数据”|“选择个案”命令,弹出选择个案对话 框,单击“如果条件满足”,编辑语句“列变量名=1 or 列 变量名=3”,如下图所示。
▪ 3)单击“统计量”按钮,弹出下图所示的“统计量”对 话框,单击 “卡方”。
4)单击“精确”按钮,弹出下图所示的“精确”对话框, 单击“Monte Carlo”。
7.5 卡方检验的多重比较
▪ 原理
用SPSS 19.0进行不同变量的卡方检验中,如果检验后多 组间有显著性差异,说明观察指标在各组之间不完全相 同,这时要知道到底是哪两组或哪几组有差异,就需要 进行两两比较,但遗憾的是,SPSS未提供卡方检验的 多组之间的两两检验的直接方案。