列联表检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 2,2 (| Oij Eij | 0.5)2 N (| O11O22 O12O21 | 0.5N )2
i, j1
Eij
O1O2O1O2
df=1
(3) N<40或理论频数小于1,不能使用卡方检验,应使用Fisher精确 检验, 称为四格表确切概率法。
列联表的原假设是两个变量X和Y相互独立,计算卡方统 计量,当此统计量很大时否定原假设。
Eij
Oi. O. j N
2
N
R,C i, j1
Oi2j OiO
j
1
df (R 1)(C 1)
若 2 2 (df ) 拒绝 H0
注意:上述 检验适用于双向无序的 表(df≠1) 分组标志无数量大小和先后顺序之分。 分析的目的是考察两个属性之间是否独立。
疗法
中医 西医
痊愈
68 737
(1)
6.6349
H0 ()
统计结论:“疗法”与“疗效”不独立(即两组治愈率不 同专)业结论:加人工牛黄组疗效高于不加人工牛黄组的疗效。
4.2 Crosstabs 过程
例: 调查339名50岁以上的人的吸烟习惯与患慢性气管 炎病的数据而建立如下列联表,试探讨吸烟与患慢性气 管炎之间的关系。
组别 患病组 健康组
疗法
疗效
治愈
未愈
不加牛黄 32
46
加牛黄 76
50
合计 108
96
合计
78 126 204
“疗法”与“疗效”独立(即两组治愈率相同
) N=204>40
2
N (O11O22 O12O21 )2 O1O2O1O2
204(32 50 46 76)2 78126108 96
7.1969
2
2 0.01
疗法
不加牛黄 加牛黄 合计
疗效
治愈
未愈
32
46
76
50
108
96
合计
78 126 204
双向无序四格表
(1) N≥40,理论频数≥5
2 2,2 (Oij Eij )2
i, j1
Eij
2 N (O11O22 O12O21 )2
O1O2O1O2
(2)N≥40,理论频数小于5(但≥1),用校正卡方统计量
第四章 列联表分析
4.1 列联表原理 4.2 Crosstabs 过程
4.1 列联表原理
例1:某医院收得乙型脑炎重症病人204例,随机分成两 组,分别用同样的中草药方剂治疗,但其中一组加一定 量的人工牛黄,每个病人根据治疗方法和治疗效果进 行分类,得出如下表格:
疗法
不加牛黄 加牛黄 合计
疗效
治愈
未愈
32
46
76
50
108
96
合计
78 126 204
列联表:观测数据按两个或更多属性(定性变量)分类 时所列出的频数表。
R×C列联表:分类频数排成R行C列的列联表。 2×2表:二行二列的列联表,又称四格表 。 列联表分析:使用列联表进行分类资料的检验。
※双向无序
列联表
单向有序 双向有序且属性不同
双向有序且属性相同
疗效 显效 好转
26
15
388
25
无效
3 5
合计
112 1155
注:1.双向无序列联表计算卡方统计量常用单侧检验。
2.若R×C列联表中理论频数出现小于1,或理论频数 出现小于5的格数超过总格数1/5时,必须增大样本例数; 或把理论频数太小的行,列与性质相近的邻行,列合并; 或删去理论频数太小的行,列。
不吸烟 13
121
吸烟 43
162
目的:检验 H0 : 变量X与Y是独立的
输入数据
个案加权 列联表分析 结果分析
(weight by cases过程)(Crosstabs过程)
实现步骤:
(1).将数据录入SPSS并整理加工
定义变量
输入数据
保存
smoke:吸烟情况; result:结果; count:频数; 保存为:“吸烟与慢性支气管炎的关系.sav”
最小理论频数=最小行合计频数﹒最小列合计频数/总频数
3.多个总体率比较的卡方检验,若结论为拒绝原假设, 只能认为总体率之间不全等,不能说明任意两个总体率 有无差别,需做多重比较。
例: 判断患鼻咽癌与血型有无关系
分类 A型血 B型血 O型血 AB型血
患癌者 64
86
130
20
健康人 125 138 210
26
合计 189 224 340
46
合计 300 499 799
第一行合计数,第四列合计数最小,最小理论频数
E14
300 46 799
பைடு நூலகம்
17.27
5
H0:“患癌”与“血型”独立,H1:“患癌”与“血型”
不独立 R,C
2 N(
Oi2j
O O i, j1 i j
1)
799
642 300 189
(3)列联表分析 菜单 “Analyze”|“Descriptive Statistics”|“Crosstabs ”命令
将“结果[result]” 点入“Row(s)” 框,将“吸烟情 况[smoke]”点 入“Cloumn(s)” 框。
点击“Statistics” 钮。
精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编 辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。 精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编 辑文档。精选可编辑文档。复习参考题普通高中课程标准实验教科书。在本模块中,学生将学习算法初步、统计、概率的基础知识。 1.算法是数学及其应用的重要组成部分,是计算科学的重要基础。随着现代信息技术飞速发展,算法在科学技术、社会发展中发挥着越 来越大的作用,并日益融入社会生活的许多方面,算法思想已经成为现代人应具备的一种数学素养。中学数学中的算法内容和其他内容是 密切联系在一起的,比如线性方程组的求解、数列的求和等。具体来说,需要通过模仿、操作、探索,学习设计程序框图表达解决问题的 过程,体会算法的基本思想和含义,理解算法的基本结构和基本算法语句,并了解中国古代数学中的算法。在本教科书中,首先通过实例 明确了算法的含义,然后结合具体算法介绍了算法的三种基本结构:顺序、条件和循环,以及基本的算法语句,最后集中介绍了辗转相除 法与更相减损术、秦九韶算法、排序、进位制等典型的几个算法问题,力求表现算法的思想,培养学生的算法意识。2.现代社会是信息 化的社会,人们面临形形色色的问题,把问题用数量化的形式表示,是利用数学工具解决问题的基础。对于数量化表示的问题,需要收集 数据、分析数据、解答问题。统计学是研究如何合理收集、整理、分析数据的学科,它可以为人们制定决策提供依据。本教科书主要介绍 最基本的获取样本数据的方法,以及几种从样本数据中提取信息的统计方法,其中包括用样本估计总体分布及数字特征和线性回归等内容。 本教科书介绍的统计内容是在义务教育阶段有关抽样调查知识的基础上展开的,侧重点放在了介绍获得高质量样本的方法、方便样本的缺 点以及随机样本的简单性质上。教科书首先通过大量的日常生活中的统计数据,通过边框的问题和探究栏目引导学生思考用样本估计总体 的必要性,以及样本的代表性问题。为强化样本代表性的重要性,教科书通过一个著名的预测结果出错的案例,使学生体会抽样不是简单 的从总体中取出几个个体的问题,它关系到最后的统计分析结果是否可靠。然后,通过生动有趣的实例引进了随机样本的概念。通过实际 问题情景引入系统抽样、分层抽样方法,介绍了简单随机抽样方法。最后,通过探究的方式,引导学生总结三种随机抽样方法的优缺点。 3.随机现象在日常生活中随处可见,概率是研究随机现象规律的学科,它为人们认识客观世界提供了重要的思维模式和解决问题的模型, 同时为统计学的发展提供了理论基础。因此,统计与概率的基础知识已经成为一个未来公民的必备常识。在本模块中,学生将在义务教育 阶段学习统计与概率的基础上,结合具体实例,学习概率的某些基本性质和简单的概率模型,加深对随机现象的理解,能通过实验、计算 器(机)模拟估计简单随机事件发生的概率。教科书首先通过具体实例给出了随机事件的定义,通过抛掷硬币的试验,观察正面朝上的次 数和比例,引出了随机事件出现的频数和频率的定义,并且利用计算机模拟掷硬币试验,给出试验结果的统计表和直观的折线图,使学生 观察到随着试验次数的增加,随机事件发生的频率稳定在某个常数附近,从而给出概率的统计定义。概率的意义是本章的重点内容。教科 书从几方面解释概率的意义,并通过掷硬币和掷骰子的试验,引入古典概型,通过转盘游戏引入几何概型。分别介绍了用计算器和计算机 中的Excel软件产生(取整数值的)随机数的方法,以及利用随机模拟的方法估计随机事件的概率、估计圆周率的值、近似计算不规则图 形的面积等。教科书首先通过具体实例给出了随机事件的定义,通过抛掷硬币的试验,观察正面朝上的次数和比例,引出了随机事件出现 的频数和频率的定义,并且利用计算机模拟掷硬币试验,给出试验结果的统计表和直观的折线图,使学生观察到随着试验次数的增加,随 机事件发生的频率稳定在某个常数附近,从而给出概率的统计定义。概率的意义是本章的重点内容。教科书从几方面解释概率的意义,并 通过掷硬币和掷骰子的试验,引入古典概型,通过转盘游戏引入几何概型。分别介绍了用计算器和计算机中的Excel软件产生(取整数值 的)随机数的方法,以及利用随机模拟的方法估计随机事件的概率、估计圆周率的值、近似计算不规则图形的面积等。精选可编辑文档。 精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编 辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。 精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编 辑文档。
(2).个案加权 在SPSS系统中,列联表的输入多采用频数表格的方式, 如果要对此类数据进行卡方分析等,必须采用个案加权 (weight by cases)进行数据处理后才能使用相关的统 计方法。
菜单 “Data” | “Weight Cases”命令
点击“Weight Cases by单选框”,选中“Freqency ”: 选入“频数[count]”。单击OK钮
1.双向无序表独立性检验
双向无序列联表:两个分类变量分类标志无数值大小 与先后顺序之分。
疗法
不加牛黄 加牛黄 合计
疗效
治愈
未愈
32
46
76
50
108
96
合计
78 126 204
设不加牛黄组治愈总体率为 ,加牛黄组治愈总体率为
检验
即 “疗法”与“疗效”独立
H0:X与Y独立(即两组总体率相同)
实际频数Oij与理论频数Eij的差异是随机误差, 用 Pearson卡方统计量反映实际Oij与理论Eij吻合程度
862 300 224
2102 499 340
262 499 46
1
1.921
2 0.05
(3)
7.815
df=(2-1)(4-1)=3,单侧概率P>0.05,
不能以α=0.05水准的单侧检验拒绝H0,
总体率的差异无统计意义,不能认为患鼻咽癌与血型不独立。
2 . 四格表独立性检验
例1:某医院收得乙型脑炎重症病人204例,随机分成两 组,分别用同样的中草药方剂治疗,但其中一组加一定 量的人工牛黄,每个病人根据治疗方法和治疗效果进 行分类,得出如下表格:
精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编 辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。复习参考题普通高中课程标准实验教科书。在本模块中,学生将学习算法初步、统计、概率的基础知识。1.算法是数学及其应 用的重要组成部分,是计算科学的重要基础。随着现代信息技术飞速发展,算法在科学技术、社会发展中发挥着越来越大的作用,并日益融入社会生活的许多方面,算法思想已经成为现代人应具备的一种数学素养。中学数学中的算法内容和其他内容是密切联系在一起的,比如线性方 程组的求解、数列的求和等。具体来说,需要通过模仿、操作、探索,学习设计程序框图表达解决问题的过程,体会算法的基本思想和含义,理解算法的基本结构和基本算法语句,并了解中国古代数学中的算法。在本教科书中,首先通过实例明确了算法的含义,然后结合具体算法介 绍了算法的三种基本结构:顺序、条件和循环,以及基本的算法语句,最后集中介绍了辗转相除法与更相减损术、秦九韶算法、排序、进位制等典型的几个算法问题,力求表现算法的思想,培养学生的算法意识。2.现代社会是信息化的社会,人们面临形形色色的问题,把问题用数 量化的形式表示,是利用数学工具解决问题的基础。对于数量化表示的问题,需要收集数据、分析数据、解答问题。统计学是研究如何合理收集、整理、分析数据的学科,它可以为人们制定决策提供依据。本教科书主要介绍最基本的获取样本数据的方法,以及几种从样本数据中提取 信息的统计方法,其中包括用样本估计总体分布及数字特征和线性回归等内容。本教科书介绍的统计内容是在义务教育阶段有关抽样调查知识的基础上展开的,侧重点放在了介绍获得高质量样本的方法、方便样本的缺点以及随机样本的简单性质上。教科书首先通过大量的日常生活中 的统计数据,通过边框的问题和探究栏目引导学生思考用样本估计总体的必要性,以及样本的代表性问题。为强化样本代表性的重要性,教科书通过一个著名的预测结果出错的案例,使学生体会抽样不是简单的从总体中取出几个个体的问题,它关系到最后的统计分析结果是否可靠。 然后,通过生动有趣的实例引进了随机样本的概念。通过实际问题情景引入系统抽样、分层抽样方法,介绍了简单随机抽样方法。最后,通过探究的方式,引导学生总结三种随机抽样方法的优缺点。3.随机现象在日常生活中随处可见,概率是研究随机现象规律的学科,它为人们认 识客观世界提供了重要的思维模式和解决问题的模型,同时为统计学的发展提供了理论基础。因此,统计与概率的基础知识已经成为一个未来公民的必备常识。在本模块中,学生将在义务教育阶段学习统计与概率的基础上,结合具体实例,学习概率的某些基本性质和简单的概率模型, 加深对随机现象的理解,能通过实验、计算器(机)模拟估计简单随机事件发生的概率。教科书首先通过具体实例给出了随机事件的定义,通过抛掷硬币的试验,观察正面朝上的次数和比例,引出了随机事件出现的频数和频率的定义,并且利用计算机模拟掷硬币试验,给出试验结果 的统计表和直观的折线图,使学生观察到随着试验次数的增加,随机事件发生的频率稳定在某个常数附近,从而给出概率的统计定义。概率的意义是本章的重点内容。教科书从几方面解释概率的意义,并通过掷硬币和掷骰子的试验,引入古典概型,通过转盘游戏引入几何概型。分别 介绍了用计算器和计算机中的Excel软件产生(取整数值的)随机数的方法,以及利用随机模拟的方法估计随机事件的概率、估计圆周率的值、近似计算不规则图形的面积等。教科书首先通过具体实例给出了随机事件的定义,通过抛掷硬币的试验,观察正面朝上的次数和比例,引出 了随机事件出现的频数和频率的定义,并且利用计算机模拟掷硬币试验,给出试验结果的统计表和直观的折线图,使学生观察到随着试验次数的增加,随机事件发生的频率稳定在某个常数附近,从而给出概率的统计定义。概率的意义是本章的重点内容。教科书从几方面解释概率的意 义,并通过掷硬币和掷骰子的试验,引入古典概型,通过转盘游戏引入几何概型。分别介绍了用计算器和计算机中的Excel软件产生(取整数值的)随机数的方法,以及利用随机模拟的方法估计随机事件的概率、估计圆周率的值、近似计算不规则图形的面积等。精选可编辑文档。精 选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑 文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。精选可编辑文档。