第7章卡方检验
国开作业实用卫生统计学-第七章 四格表 自测练习10参考(含答案)
题目:四个表资料的卡方检验,其校正条件是()选项A:总例数大于40选项B:实际数为0选项C:有一个理论上小于5大于1,且n40选项D:有实际数小于1答案:有一个理论上小于5大于1,且n40题目:四个表资料的卡方检验无需校正,应满足的条件是()选项A:总例数大于40,且理论数均大于或等于5选项B:理论数大于5选项C:实际数均大于1选项D:总例数大于40答案:总例数大于40,且理论数均大于或等于5题目:四格表中的一个实际频数为1时,下面哪项成立()选项A:作χ2检验不必校正选项B:就不能作χ2检验选项C:还不能确定是否可做χ2检验选项D:必须用校正的χ2检验答案:还不能确定是否可做χ2检验题目:作两样本率的假设检验,其检验假设是?()选项A:P1=P2选项B:/uploads/01337/images/unit5/zsd_11.png=http://openmedia/uploads/01337/images/unit5/zsd_11.png0选项C:π1=π2选项D:/uploads/01337/images/unit7/x.png1=http://openmedia.ouc /uploads/01337/images/unit7/x.png2答案:π1=π2题目:两个四格表一个χ2χ20.01,1,另一个χ2χ20.05,1,可认为以下哪项正确?()选项A:后者两个百分数相差较大选项B:前者两个百分数相差较大选项C:前者更有理由认为两总体率不同选项D:后者者更有理由认为两总体率不同答案:前者更有理由认为两总体率不同题目:若n≤40,或1T≤5时,需用确切概率计算法选项A:对选项B:错答案:错。
卡方检验解释
第一步:输入数据(略)
第二步:指定频数变量:weight cases—人数
第三步:crosstabs过程(略)
(三)结果解释:(P265)
1、value:检验统计量值
2、asymp.sig.2-sided:双侧近似概率
3、exact sig.2-sided:双侧精确概率
4、exact sig.1-sided:单侧精确概率
1、tables模块:即custom tables菜单
可以为多选题生成各种复杂的频数表和交叉表,并计算表中各种比例指标。
2、optimal scaling过程:
用于非线性典型相关法(OVERALS)对多选题数据进行最优尺度分析(多重对应分析)。
3、multiple response菜单:
专门为多选题数据的描述而设计,用于生成频数表和交叉表。
(2)列(columns):用于选择行*列表中的列变量
(3)层(layer):用于设置分层分析变量
(4)显示分组条形图(display clustered bar charts):可以直观反映各单元格内频数的多少。
(5)压缩表(suppress table):禁止在结果中输出行*列表
2、exact对话框(略):
用于设定针对2*2以上行*列表是否进行确切概率的计算,以及具体的计算方法。
(1)Asymptotic only:只计算近似的概率值,不计算确切概率
(2)montecarlo:采用蒙特卡罗 模拟方法计算确切概率值。
即进行10000次抽样,给出确切概率以及99%可信区间。(默认值可以更改)
(3)exact:计算出确切的概率值
如:要了解病人采用了那些非药物方法来控制高血压,问题如下:
第7章-X2检验与U-检验
(a + b)(c + d)(a + c)(b + d)
当:T < 1,或 n < 40 时,需用确切概率法计算。
=1
例:
某地中学生就餐方式与乙肝病毒感染情况调查
就餐方式 调查人数 感染人数 感染率(%)
常在外就餐(A) 89
6
6.74
不在外就餐(B) 111
5
4.50
合计
200
11
5.50
试比较不同就餐方式的乙肝病毒感染率是否不同?
2 0.01( )
0.01
接受H0 差异无统计学意义 拒绝H0 差异有统计学意义 拒绝H0 差异有高度统计学意义
四格表 2值的校正 当:1< T < 5,而 n > 40 时,需计算校正 2值
2 = —(—| A—-—T —| - —0.5—)—2 , T
或
2
=
( | ad - bc | - n/2 ) 2 n ————————————
= 0.0725(1-0.0725)(1/988+1/682)
= 3.76 P < 0.01
结论:BMI 25者糖尿病患病率高于BMI <25者 BMI与糖尿病有关
第八章 2检验
当观察例数不够大或拟对多个率进行比较时u检验就不适宜了, 此时可用卡方检验(chi-square test)。
卡方检验是一种用途广泛的假设检验。 可用于:1、推断两个或多个总体率(或总体构成比)之间有无差别;
甲疗法的病死人数 T1.2 : 46×47/104=20.79 乙疗法的病死人数 T2.2 : 58×47/104=26.21
TRC =
nR nC n
《医学统计概论》第7章卡方检验Chi-square test
(3) 当n<40或有T<1时,用Fisher’s exact probability。
7.2 配对四格表资料的χ2检验
配对设计包括:(1)同一批样品用两种不同的处理方法;(2)观察 对象根据配对条件配成对子,同一对子内不同的个体分别接受不同的处理; (3)在病因和危险因素的研究中,将病人和对照按配对条件配成对子, 研究是否存在某种病因或危险因素。
表7-1 两组降低颅内压有效率的比较(P137)
组别
试验组 对照组 合计
有效
99 75 174
无效
5 21 26
合计
104 96 200
有效率(%)
95.20 (p1) 78.13 (p2) 87.00 (pc)
实际频数A (actual frequency) 理论频数T (theoretical frequency)
,
1
因为有一格1<T<5,且n>40时,所以应用连续性校
正χ2检验。
四、精确概率法(Fisher’s exact probability)
在无效假设成立的前提下且周边合计固定时,产生任意 一个四格表(i)的概率Pi 服从于超几何分布,其计算式为:
a b!c d !a c!b d !
Pi
a!b!c!d !n!
药物治疗组 164
18
182
外用膏药组 118
26
144
4.59
>0.0125 (NS)
合计
282
44
326
二、各实验组与同一对照组比 关键是检验水平的校正
'
2k 1
自学
7.6 双向有序分组资料的线性趋势检验
第七章假设检验
引言
结论:企图肯定什么事情很难, 结论:企图肯定什么事情很难,而否定就容 易得多。 还记得上次那个例子吗? 易得多。 (还记得上次那个例子吗?两个人 住一起,其中有一个人病了, 住一起,其中有一个人病了,另一个人天天 给他熬药还端到他床前,三个月过去了, 给他熬药还端到他床前,三个月过去了,突 然有一天那个人忙得很, 然有一天那个人忙得很,把药熬好了就对卧 病在床的人说,你自己去喝吧, 病在床的人说,你自己去喝吧,卧病的人心 里想: 这个人怎么这么坏呢? 里想:“这个人怎么这么坏呢?”,他倒忘 了这个人对他的好, 了这个人对他的好,记住一个人的好总比记 住一个人的坏好,有时候想想, 住一个人的坏好,有时候想想,老师就像端 药的人,学生就是喝药的人,良药苦口, 药的人,学生就是喝药的人,良药苦口,我 也许一直是你们背后说你们的那个烂人, 也许一直是你们背后说你们的那个烂人,老 师也是弱势群体啊!!) 师也是弱势群体啊!!)
α
H 0 : µ ≤ 2% ↔ H 1 : µ > 2%
5-10
二、两种类型的错误
两类错误发生的概率 α与β之间是此消彼长的关系 接受
H0
拒绝
H0
H0
真实
判断正确 (1-α) ) 取伪错误( 取伪错误(第二类 错误或β 错误或 错误)
弃真错误( 弃真错误(第一 类错误或α 类错误或 错误 ) 判断正确 (1-β) )
第七章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 卡方检验
参数估计是利用样本信息推断未知的总体参数, 参数估计是利用样本信息推断未知的总体参数, 而假设检验是先对总体参数提出一个假设, 而假设检验是先对总体参数提出一个假设,然后利 用样本信息判断这一假设是否成立。 用样本信息判断这一假设是否成立。
第七章 调查法及其应用
第七章调查法及其应用第一节调查法及其特点一、调查法的概念教育调查法是指研究者有目的、有计划地通过观察、访谈、问卷等手段,搜集研究对象的客观材料,并对搜集的数据材料进行定量、定性分析,从而了解被调查对象的现状,发现教育现象之间的关系,探索教育规律的一种研究方法。
调查的作用体现在三个方面,即描述状况,解释原因,预测趋势。
通过调查,可以把握教育现象的状况,发现教育现象之间的联系和存在的问题,认识并预测教育现象的发展趋势。
二、调查法的特点调查法是常用的研究方法之一。
它是在不改变任何条件的自然状态下研究教育对象或教育现象,不受时间、空间的限制,研究涉及范围广,可以在短时间内收集大量信息。
三、常用的调查类型(一)根据调查的内容可分为现状调查、相关调查、原因调查和发展调查现状调查:对教育现象或教育对象目前状况的调查。
如:中学生学习负担的现状调查、教师环境意识的调查等。
相关调查:通过对某类教育现象的两种或两种以上的特征的调查,确定它们之间是否存在关联,且关联的性质和程度如何。
如:研究学生的知识掌握程度与学习能力水平之间的关系时进行的调查,研究教师环境意识与环境教育行为之间的关系时进行的调查都属于相关调查。
原因调查:对教育现象或教育对象某一特征形成的原因的调查。
如:中学生厌学原因的调查等。
发展调查:对教育对象的某一特征是怎样随着时间的推移而发生变化所进行的调查。
如:研究不同年龄学生自我控制能力发展的调查,研究小学生交往能力发展的调查等。
(二)根据调查的对象范围可分为普遍调查、抽样调查和典型调查普遍调查是对研究对象的全体进行调查,调查的结果反映了要研究对象总体本身的情况,比较可靠。
如:对“某某中学初一学生身体状况”进行普遍调查,需要了解初一每一名学生的身体状况。
抽样调查是从研究对象的总体中抽取一部分有代表性的对象,组成一个样本,然后对样本进行调查,并根据样本调查的结果推测、估计相应的总体。
如:对“某某中学初一学生身体状况”的抽样调查,我们可以按一定的取样方法(例如:每班按学号末位是0或5)抽取一定数量的学生组成样本,只调查这一样本的学生身体状况。
医学统计学--卡方检验
笃 学
精 业
修 德
厚 生
6
2 ( A T ) 2值的大小还取决于 个数的多少(严 T 2 ( A T ) 格地说是自由度 的大小)。由于各 皆是 T 2
正值,故自由度 愈大, 值也会愈大;所以只 2 值才能正确地反映 有考虑了自由度 的影响,
实际频数 A和理论频数 T 的吻合程度。检验时, 要根据自由度 查 2 界值表。当 2≥ 2时, P , ,
2 中,若拒绝无效假设
H0只能做出总的结论,但还不知道哪两
个率之间有差别。若想知道哪两个率之间
有差别,还要进行两两比较,本节介绍两
两比较的方法之一:行×列表的分割。
笃 学
精 业
修 德
厚 生
30
4.行×列表的分割 (一)多个实验组间的两两比较 由于要做重复多次的假设检验,需对第Ⅰ 类错误作校正,新的校正检验水准为:
第七章 掌握内容:
2 检 验
1.检验的基本思想和用途 2.成组设计四格表资料检验的计算及应用条件
3.配对设计四格表资料检验 4.行列表资料检验及应用时应注意的问题 5.频数分布拟合优度的检验 了解内容 1.四格表资料的Fisher精确概率法的基本思想 与检验步骤
笃 学 精 业 修 德 厚 生
2 检验是一种用途很广的假设检验方
处理组 1 2 属性 阳性 阴性 合计
合计
a (T11) c (T21) m1
b (T12) d (T22) m2
n1(固定值) n2(固定值) n
要想知道处理组1,2之间差别是否有统计学意义, 常用 2 检验统计量来作假设检验。
笃 学 精 业 修 德 厚 生
5
第七章 卡方检验
第七章1下列不能用X2检验的是。
A. 成组设计的两样本频率的比较B. 配对设计的两样本频率的比较C. 多个样本频率的比较D. 频率发布的比较E. 等级资料实验效应的比较2.通常分析四格表在情况下需用Fisher精确概率计算法。
A.T<5B.T<1或n<40C.T<1且n<40D.1≤T<5且n<40E.T<5或n<403.三个样本频率比较,X2>X2,可以认为。
0.01(2)A.各总体频率不等或不全相等 B.各总体频率均不相等 C.各样本频率均不相等 D.各样本频率不等或不全相等 E.各总体频率相等4.当四格表的周边合计数不变时,如果某格的实际数有变化,则其理论频数。
A.增大 B.减小 C.不变 D.不确定 E.随该格实际频数的增减而增减5.对于总合计数 n为500的5个样本率的资料做X2检验,其自由度为。
A.499 B.496 C.1 D.4 E.9 6.从甲、乙两篇论文中,查到同类研究的两个率比较的四格表资料以及χ2检验结果,甲论文χ2>χ20.01(1),乙论文χ2>χ20.05(1)。
若甲、乙两论文的样本量相同,则可认为。
A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信D.甲论文结果不可信 E.甲论文说明两总体的差别大7.用两种方法检查已确诊的乳腺癌患者120名,甲法检出率为60%,乙法检出率为50%,甲乙两法的一致检出率为35%,则整理成四格表后表中的d(即两法均未检出者)为。
A.30 B.18 C.24 D.48 E.428.用甲乙两种方法检查已确诊的鼻咽癌患者100名,甲法阳性者80名,乙法阳性者60名,两法均为阳性者50名,欲检验两法结果有无差别,宜选用。
A .普通四格表χ2检验B .配对四格表χ2检验C . u 检验D .t 检验E .秩和检验9. 两组二分类资料发生率比较,样本总例数100,则2χ检验自由度为 。
A. 1B. 4C. 95D. 99E. 10010.设两定性因素为A 和B ,每因素的两水平用+和-表示,则配对四格表的因素和水平搭配为:A .A+,A -,B+,B - B .A+A -,A -A+,B+B -,B -B+C .A+A+,A -A -,B+B+,B -B -D .A+B+,A+B -,A -B+,A -B -E .以上都不是11.三行四列表作2χ检验当有4个格子的1<T<5时, 。
卫生统计学第七章卡方检验
做答人数:0
做对人数:0
所占比例: 0
题号: 15 本题分数: 2
χ2检验应用范围不包括
A. 两个或多个率的差别
B. 两个或多个构成比的差别
C. 小样本配对设计计量资料均数的比较
D. 两种属性间的相关分析
E. 检验频数分布的似合优度
正确答案: C
A. 三个总体率不同或不全相同
B. 三个总体率都不相同
C. 三个样本率都不相同
D. 三个样本率不同或不全相同
E. 三个总体率中有两个不同
正确答案: A
答案解析:三个率比较的假设检验中,H0:三个总体率全相等,H1:三个总体率不全相等,包括三个总体率全不同或不全相同,当χ2>χ20.01(2),P<0.01,拒绝H0,接受H1,可认为三个总体率不同或不全相同,故答案为A。
做答人数:0
做对人数:0
所占比例: 0
题号: 12 本题分数: 2
对于总合计数n为400的4个样本率的资料做χ2检验,其自由度为
A. 399
B. 396
C. 1
D. 4
E. 3
正确答案: E
答案解析:4个样本率的比较,资料可整理为4×2的行×列表,χ2统计量所对应的自由度为(4-1)×(2-1)=3。
次数资料分析---卡方检验
第七章 次数资料分析---χ2检验第一节 χ2检验的原理与方法1.χ2分布χ2分布是从正态分布派生出来的一种分布。
⏹[定义]设X 1,X 2,X 3,…,X n 相互独立同分布,且X i ~N(0,1),则随机变量χ2= x i 2n i=1的分布称为具有n 个自由度的χ2分布。
记作: χ2 = x i 2n i=1 ~χ2(n ) 即:n 个标准正态分布的随机变量的平方和,服从自由度为n 的χ2分布。
⏹[推论]若随机变量X 1,X 2,X 3,…,X n 相互独立,且X i ~N(μ, σ2),则χ2= (x i −μ)2σ2n i=1~χ2(n)⏹[自由度]在计算χ2的过程中,如果有一个统计量代替了其中的一个参数,则其自由度为(n-1);如果有两个统计量代替了其中的两个参数,则其自由度为(n-2)。
χ2= ~χ2(n-1)22212)1()(σσS n x x ni i -=-∑=2.χ2分布的性质⏹χ2分布的“可加性”—在进行χ2统计分析时,可将相邻的数据合并在一起统计⏹χ2分布为非对称的连续性分布,分布区间为[0,+∞]⏹χ2分布曲线因自由度不同而异不同自由度的概率分布密度曲线 2χ 3.χ2检验的基本原理与方法χ2检验是与计数数据相关联的,因而用于计数资料或间断性数据的检验。
⏹[基本原理] 用于实际观测值(O )与理论推算值(E )之间的偏离程度来计算χ2值的大小,根据χ2的概率来检验观测值与理论值的差异程度和符合程度的大小。
⏹[检验方法]按照假设检验的一般步骤,对计数资料进行右尾检验。
如果有k 组资料,则检验统计量的值按下式计算:χ2=(A i −T i )2T iki=1【k:类别;A i :实际观测值;T i :理论推算值】⏹[连续性矫正] 当自由度df ≧2时,一般不作连续性矫正。
但在自由度df =1时,需进行连续性矫正,统计量计算公式:x c2= (∣A i −T i ∣−0.5)2T iki=1第二节 适合性检验1.适合性检验的定义所谓适合性检验,就是检验某一试验结果类别频数的划分是否符合某一理论比例。
统计分析与SPSS课后习题课后习题答案汇总(第五版)
《统计分析与SPSS的应用(第五版)》课后练习答案第一章练习题答案1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案)英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。
●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据;●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。
3、SPSS的数据集:●SPSS运行时可同时打开多个数据编辑器窗口。
每个数据编辑器窗口分别显示不同的数据集合(简称数据集)。
●活动数据集:其中只有一个数据集为当前数据集。
SPSS只对某时刻的当前数据集中的数据进行分析。
4、SPSS的三种基本运行方式:●完全窗口菜单方式、程序运行方式、混合运行方式。
●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简洁和直观。
●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。
该方式适用于大规模的统计分析工作。
●混合运行方式:是前两者的综合。
5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名.spv是结果查看器窗口中的SPSS分析结果文件的扩展名.sps是语法窗口中的SPSS程序6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。
7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。
第七章-拟合优度检验 (1)
教学目的要求
掌握:拟优合度检验的基本原理和步骤,不 同资料类型分布的拟合度检验,独立性测验 方法。 熟悉:拟合优度检验和独立性检验的应用。 了解:拟合优度检验在遗传学及其他生物学 科中上的应用。
讲授内容
一、拟合优度检验的一般原理 二、拟合优度检验 三、独立性检验
(O i Ti) Ti i 1
2 k
2
4、确定自由度: 2×2列联表的自由度df=(r-1)(c-1),r是 列联表的行数, c 是列联表的列数,若自由度 =1,则 应做连续性校正,校正后的统计量为:
2 df i 1
k
(O i Ti 0.5) Ti
2
1.061
每皿发芽种子数Xi 观察频数(Oi) OiXi
0 1 0 0 0 0
理论频率(P) 理论频数(Ti)
0.0001 0.0019
卡方值
2
3 4 5 6 7 8 9 10 总计
0
4 14 22 27 19 9 5 0 100
0
12 56 110 162 133 72 45 0 590
0.0125
0.0480 0.1209 0.2087 0.2503 0.2058 0.1111 0.0355 0.0051 1
6.25
0.81
12.09 20.87 25.03 20.58 15.71 100
0.302 0.061 0.155 0.121 0.09 1.539
题解
1、提出假设 H0:O-T=0;HA: O-T≠0 2、总体参数未知,需要由样本比例估计P=590/1000=0.59 3、计算理论值和卡方值,理论频率Pi按照二项分布公式计 算——n=10,0≤k ≤10,理论数Ti=NPi
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
A为实际数 T为理论数
X2值是一个反映假设的理论数(T)和观察 的实际数(A)符合程度的指标。
卡方检验的基本原理
若检验假设H0:π1=π2成立,四个格子的实际
频数 A 与理论频数 T 相差不应该很大,即统
计量 X2 不应该很大。 如果 A 和 T 差距大, X2值就会很大,即相对 应的 P 值很小,若 P
0.2 0.1 0.0 0 3 6 9 12 ¿ ¨· ½ Ö µ
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
15
18
四格表卡方检验基本步骤
建立检验假设:H0
,
H1
确定显著性水准:α= 0.05
计算各格子的理论数 T
计算统计量(X2 值)
( P-uα Sp, P+uα Sp)
uα为概率为α的u界限值
u0.05=1.96
u0.01=2.58
查表法 当n 较小时( n≤ 50),需查附 表(百分率的可信区间表),得到总 体率的可信区间。
第二节
率的u检验
一、样本率与总体率的比较
Z u p 0 0 (10 ) n
P324/例10-7
二、两个样本率的比较 设:两样本率分别为p1和p2,当n1与n2均较大, 且 p1 、 1-p1 及 p2 、 1-p2 均 不 太 小 , 如 n1p1 、
n1(1-p1) 及 n2p2 、 n2(1-p2) 均大于 5 时,可采用
正态近似法对两总体率作统计推断。
p1 p 2 Zu S p1 p 2
0.3
0.2
0.1
0.0
0
2
4
6
2
8
2 0 . 0 5 / 2
10
2 0 . 0 5 ( 1 ) 2 0 . 0 1 ( 1 )
3 . 8 4 ( 1 . 9 6 ) Z
2 2 6 . 6 3 ( 2 . 5 7 5 8 ) Z 0 . 0 1 / 2
χ2分布(chi-square distribution)
P325/例10-8
Zu
p1 p 2 S p1 p 2
两个率之差的合并标准误Sp1-p2
1 1 S p ( 1 p )( ) p p c c 1 2 n n 1 2
合并发生率PC
pc
X1 X 2 n 1 n 2
第三节
卡方检验
(chi-square test)
X 2检验是现代统计学的创始人之一,英国
人K . Pearson(1857-1936)于1900年提出 的一种具有广泛用途的统计方法。可用于两
个或多个率或构成比间的比较、配对计数资
料及两种属性或特征之间是否有关系等等。
卡方检验
四格表资料的卡方检验 配对资料的卡方检验 行×列表卡方检验
一、四格表资料的X2检验 适用于两个样本率的比较
率的标准误 用“σp”表示。
p
( 1 )
n
π为总体率; n为样本含量
由于实际工作中,总体率π往往未知, 常常用样本率P来近似代替总体率π,则:
Sp
p 1 p n
Sp为样本率的标准误; P 为样本率;n 为样本含量
例如:抽取居民300人的粪便,检出蛔虫
阳性60人,求其抽样误差的大小。
两个样本率的比较既可以选用u 检验,
也可用四格表的X2检验。 • • • • 基本公式法 专用公式法 连续性校正公式 确切概率法(直接概率法)
自由度为 1 的 分布
2
若 Z ~ N ( 0,1), 则 Z 2 的分布称为自由度为 1 的 2 分布. (chi-square distribution),记为 (21) 或 2 (1) . 图形:从纵轴某个点开始单调下降,先凸后凹.
Sp
p 1 p n
Sp
60 240 300 300 300
=0.0231=2.31%
率的标准误的应用
表示样本率的抽样误差大小。
估计总体率的可信区间。
进行率的差别的假设检验。
二、总体率的置信区间估计
正态近似法
当n 足够大,且np和n(1-p)均大于
5时,P 的分布接近正态分布,可用:
基本公式法:
2 2 2 A T ( A T ) ( A T ) ( A T ) 1 1 1 1 2 12 12 21 21 22 22 2
T 1 1
T 1 2
T 2 1
T 2 2
(AT ) , ( 行 数 1 ) ( 列 数 1 ) T
= 4.13
P325/例10-9
(三)四格表资料的连续性校正公式
适用条件:n≥40,1≤T<5 P327/例10-10
2 c
(A T 0 . 5 ) T
n2 2
2
( |a d b c |- ) n = ( a + b ) ( c + d ) ( a + c ) ( b + d )
1、建立假设:H0: π1= π 2、确定检验水准:α=0.05
2
H1: π1 ≠ π 3、计算各格子理论数 T
2
T11=100×44/220=20;
T21=120×44/220=24
4、计算统计量X2值: X2=(14-20)2/20+(86 -80)2/80
+(30 - 24)2/24+(90 - 96)2/96 = 4.13
式中,A为实际频数(actual frequency) T为理论频数(theoretical frequency)
2
用药组和对照组流感发病率比较
组别 用药组 发病人数 14(20) 未发病人数 86(80) 合计 发病率(%) 100 14
对照组
合
30(24)
90(96)
176
120
220
25
—
计 44
n≥40,T≥5 ,专用公式或基本公式 n≥40,1≤T<5,连续性校正公式
n<40 ,或T<1,确切概率法直接计算概率
( Fisher确切概率)
注意: X2 连续性校正仅用于 1 的四
格表资料,当
2
时,一般不作校正。
二、配对资料的卡方检验
P327/例10-11
配对资料数据表 甲种属性 乙种属性 + - 合计
(二)
2
专用公式法
2
( a d b c )n ( a b ) ( a c ) ( b d ) ( c d )
发生数 样本 1 样本 2 合 计 未发生数 合计 a+b c+d n
a c a+c
b d b+d
前例: 用药组和对照组流感发病率比较 组别 发病人数 未发病人数 合计 发病率(%)
用药组
对照组 合 计
14(a)
30(c) 44 a+c
86(b)
90(d) 176 b+d
100 a+b
120 c+d 220 n
14
25
—
检验步骤同前
( a d b c )n ( a b ) ( a c ) ( b d ) ( c d )
2
2
X
2
=
(14×90—86×30)2×220 100×120×44×176
发病人数
14(20) 30(24)
未发病人数
86(80) 90(96) 176
合计 发病率(%)
100 120 220 14 25 —
计 44
表中:
Байду номын сангаас14
86
30
90
是整个表的基本数字。
19世纪末Pearson 提出卡方检验统计量X2
值的基本公式(也称为Pearson X2值)
(AT) 2 T
行×列表资料卡方检验的注意事项
1、R×C表X2检验中,不需要进行连续性校正, 但如果有1/5以上格子的T<5 ,或有一格T
<1,应设法增加理论数,否则可能产生偏
性。处理方法有三种:
增大样本含量
合并(并组需注意合理性)
根据专业知识删去其所在行或所在列
2、R×C表X2检验,得到P≤0.05有统计学
+ -
合 计
a c
a+c
b d
b+d
a+b c+d
n
式中,a、d 为两法观察结果一致的两种情况,
b、c为两法观察结果不一致的两种情况。
检验统计量X2为:
(b c) b+c>40, , bc
2 2
1
2
b+c≤40,
2 c
( b c 1) bc
,
=1
2 结果比较 两 种 血 清 学 检 验
0.5 0.4 0.3
1 f( ) 2 2 ( /2 )
2 2
( /2 1 )
e
2 /2
ß ×¸ Ý
× Ô Ó É ¶ È £ ½ 1
0.2 0.1 0.0 0 3
3.84 7.81
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
确定概率 P
统计推断结论
TRC
n R nC n
TRC
式中:
n R nC n
TRC—R行C列格子的理论数