第9章.卡方检验
医学统计学第七版课后答案及解析知识分享
医学统计学第七版课后答案及解析医学统计学第七版课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A二、计算与分析12 [参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
卫生统计学-第九章 卡方检验
11
2检验的基本思想
• 如果H0成立,则男女生感染率的差异仅是抽样误
差引起的,相差不会太大,由此而计算出来的T与 A也不会相差很大,即2值不会相差很大
• 如果两样本率相差过大,即T与A相差较大,2值
也会相差较大,相应的P值也就越小。
• 因此,由实际样本资料求得一个较小的P,而且
P≤,就有理由怀疑H0的真实性,因而拒绝H0,
18.55
66.45
(3)确定自由度和P值
四格表的自由度=1,卡方界值为3.84 卡方值>卡方界值,所以 P<0.05
(4)作出推断性的结论
按α =0.05水准,拒绝H0,接受H1,可认为该小学男女生 蛔虫感染率不同,男生的感染率高于女生.
18
四格表除了可用基本公式外,更多用四格表专用公 式计算卡方值.
假设四格的数字分别为a,b,c,d,如图,
则用下式来计算卡方值:
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
23 57 a 13 72
此式不必计算理论数,比较方便,结果也更为准确.
19
某小学男女生蛔虫感染率的比较
• 实际工作常用于检验两个或多个样本率及构成比
之间差别有无统计学意义,两种属性或特征之间 是否有关系以及拟合优度检验等。
5资料的2检验 • RC表的2检验 • 配对四格表的2检验 • 精确概率法
6
§1 2检验的基本思想
例:某小学男女生蛔虫的感染率如下表,试判断男女 蛔虫感染率是否有差别?
从而作出接受H1的统计推断;如果P>,则没有
理由拒绝H0。
12
性别 男 女 合计
虫卵阳性人数 阴性人数 合计 感染率(%)
卡方检验解释
第一步:输入数据(略)
第二步:指定频数变量:weight cases—人数
第三步:crosstabs过程(略)
(三)结果解释:(P265)
1、value:检验统计量值
2、asymp.sig.2-sided:双侧近似概率
3、exact sig.2-sided:双侧精确概率
4、exact sig.1-sided:单侧精确概率
1、tables模块:即custom tables菜单
可以为多选题生成各种复杂的频数表和交叉表,并计算表中各种比例指标。
2、optimal scaling过程:
用于非线性典型相关法(OVERALS)对多选题数据进行最优尺度分析(多重对应分析)。
3、multiple response菜单:
专门为多选题数据的描述而设计,用于生成频数表和交叉表。
(2)列(columns):用于选择行*列表中的列变量
(3)层(layer):用于设置分层分析变量
(4)显示分组条形图(display clustered bar charts):可以直观反映各单元格内频数的多少。
(5)压缩表(suppress table):禁止在结果中输出行*列表
2、exact对话框(略):
用于设定针对2*2以上行*列表是否进行确切概率的计算,以及具体的计算方法。
(1)Asymptotic only:只计算近似的概率值,不计算确切概率
(2)montecarlo:采用蒙特卡罗 模拟方法计算确切概率值。
即进行10000次抽样,给出确切概率以及99%可信区间。(默认值可以更改)
(3)exact:计算出确切的概率值
如:要了解病人采用了那些非药物方法来控制高血压,问题如下:
《医学统计学》医统-第九章卡方检验
卡方值
当自由度ν确定后,χ2分布曲线下右侧尾部的面积 为α时,编辑课横件 轴上相应的χ2值记作χ2α,ν
查χ2界值表,得χ20.05,1=3.84,按α=0.05 水 准, 拒绝H0 , 接受H1 , P<0.05,可 以认为两组治疗原发性高血压的总体有 效率不同,即可认为吲达帕胺片治疗原 发性高血压是有效的。
医学统计学
第九章 2检验
公共卫生系 流行病与卫生统计学教研室
祝晓明
一、率
率(rate):率表示在一定空间或时间范围内 某现象的发生数与可能发生的总数之比,说明 某现象出现的强度或频度,通常以百分率 (%)、千分率(‰)、万分率(/万)、或 十万分率(/10万)等来表示。
你们班级的及格率,挂科率怎么算?
❖自由度ν愈大,χ2 值也会愈大;所以 只有考虑了自由度ν的影响,χ2 值才
能正确地反映实际频数A和理论频数T 的吻合程度。
检验的自由度取决于可以自由取值的格子数目,
而不是样本含量n。四格表资料只有两行两 列,ν=1,即在周边合计数固定的情况下,4个基
本数据当中只有一个可以自由取值。
编辑课件
检验步骤: 1.建立检验假设并确定检验水准 H0:π1=π2 即试验组与对照组的总体有效率相等 H1:π1≠π2 即试验组与对照组的总体有效率不等
2
(20 25.77)2
(24 18.23)2
(21 15.23)2
(5 10.77)2
8.40
25.77
18.23
15.23
10.77
(2 1)(2 1) 1
编辑课件
纵高
3.确定P 值,作出推断结论
0.5
0.4
0.3
自由度=1
医学统计学 -第09章 卡方检验
0.4 f(x)
v=1
0.3
2分布
0.2
v=4
v=6 v=9
0.1
0.0
0
3
6
9
12
15 x
(2)计算检验统计量
2 (A T )2
T
(41 36.5625)2 (4 8.4375)2 (24 28.4375)2 (11 6.5625)2
36.5625
8.4375
28.4375
6.5625
理论基础:超几何分布,不属于卡方检验
谢谢
表 慢性咽炎两种药物疗效资料
分组
兰芩口服液 银黄口服液
合计
有效
41 24 65
无效
4 11 15
有效率 (%) 91.11
68.57 81.25
合计
45 35 80
问题: 两个总体有效率是否相等?
(1)建立检验假设 H0:π1=2 两药的总体有效率相同 H1:π1≠π2 两药的总体有效率不同 检验水准=0.05
bc
= 1
若b+c<40,采用以下校正公式
2 (| b c | 1)2
= 1
bc
第三节 行×列表资料的2检验
(一)R×C表 最常见的形式是
2×C列联表(一般为2个构成比的比较) R ×2列联表(一般为多个样本率的比较)
R×C列联表2检验的原理与2×2列联表2 检验的原理完全一样
统计量计算公式
合计 40 30 32 102
有效率(%) 87.50 66.67 21.88 60.78
(1)建立检验假设,确定检验水准
H0 :1 2 3
H1
:
1
,
第九章 卡方检验
2
T
离散用连续近似
2 ( ad bc n / 2)2 n
(a b)(c d )(a c)(b d )
注:(1)这种校正称为连续性校正。 (2)如检验所得P值近于检验水准α时, 最 好改用四格表确切概率法。
例 9-3 将病情相似的淋巴系肿瘤患 者随机分布两组,分别做单纯化疗与复 合化疗,两组的缓解率见表9-4,问两疗 法的总体缓解率是否不同?
2分布
如果Z服从标准正态分布,那么Z2服从自 由度为1的 2 分布,其分布图见156。
如果Z1,Z2,…,Zv是v个独立的标准正
态分布随机变量,
z12
Z
2 2
Zv2
的分布
服从自由度为v的 2 分布。
1.962=3.84
例9-2 具体步骤
建立检验假设
H0:1=2 假设两药的愈合率相同 H1:12 假设两药的愈合率不同
第二节 独立样本2×2 列联
表资料的2检验
提出问题
研究目的:比较洛赛克与雷尼替丁疗效有无差 别?
能否说明洛赛克比雷尼替丁效果好?
已知
≠ P1=75.29%
P2=60.71%
推断
π1
?
π2
2 检验的基本思想
假设: 洛赛克与雷尼替丁治疗消化道溃疡的效果相同。
1 2
计算两组合计的愈合率为68.05%(即115/169) 作为 总体率的估计
3 确定P值,做出结论
查附表,
2 0.1(1)
2.71
2.64 2.71, P 0.1
按 0.05 的水准下,不能拒绝H0,即差别无 统计学意义。还不能认为两种方案的总体缓概率
第9章卡方检验
当n较小时,则可以利用校正的u检验:
| p1 p2 | (1 / n1 1 / n2 ) / 2 uc Nov 24,2009 S p1 p2
例9-3 考察某市2000年城乡居民的卫生服 务需求,以近两周病患病情况作为调查指 标。分别在城区和农村进行了抽样调查, 其中城区调查了660人,有90人近两周患病, 农村调查了640人,有140人近两周患病, 问两组人群的两周患病率是否相同?
二、正态近似法 当n较大,总体率 既不接近0也不 接近1,n和n (1-)均大于5,二 项分布近似正态分布,利用正态分 布的原理,计算检验统计量u值作假 设检验。
u
Nov 24,2009
p 0
p
p 0
0 (1 0 ) / n
例9-2 已知一般人群中慢性支气 管炎患病率为9.7% ,现调查了500 名吸烟者,其中有95人患慢性支气 管炎,试推断吸烟人群中慢性支气 管炎患病率是否比一般人群高?
Nov 24,2009
一、四格表资料的2检验
2检验的基本思想
组别 阳性数 阴性数 合计
I组
II组 合计
a
c a+c=n.1
b
d b+d=n.2
a+b=n1.
c+d=n2. a+b+c+d=n
Nov 24,2009
基本步骤
1、建立假设 H0:城乡居民的两周总体患病率相同 即1=2= H1:城乡居民的两周总体患病率不同 即1≠2, α=0.05
b
d b+d=n.2
a+b=n1.
c+d=n2. a+b+c+d=n
(ad bc) n (a b)(c d )(a c)(b d )
第9章 非参数检验
9.7多个独立样本比较秩和检验
1.多组计量资料的非参数检验
对于多组计量资料不服从正态性、方差齐性条件或 经转换后也不满足,则采用H检验法
例9-8研究白血病时,测定四组鼠脾DNA的含量,结 果如下表,分析各组DNA含量有无差别?(α=0.05)
正常脾
12.3
患自发性白血病的脾 10.8
患移植白血病的脾(甲组) 9.3
列联表(二维列联表按两个属性分类的表)分类: 1)双向无序表(检验法:Pearson卡方检验) 2)双向有序表(检验法:McNemar检验、Kappa检验) 3)单向有序表(等级资料,检验法:非参数检验)
Guiyang College of Traditional Chinese Medicine
例9-7《成都中医药大学学报》2004年第2期《益 心钦口服液治疗冠心病心率失常的疗效》一文, 调查数据如下表,判断其疗效与对照组是否相同? (α=0.05)
Guiyang College of Traditional Chinese Medicine
2.等级资料两样本比较秩和检验
医药学研究中的等级资料: 1)疗 效: 痊愈、显效、有效、无效、恶化 2)化验结果: - ++ +++ 3)体格发育: 下等、中下、中等、中上、上等 4)心功能分级:I、II、III… 5)营养水平: 差、一般、好
1959 30.5 1969 11.8
1960 24.5 1970 12.4
Guiyang College of Traditional Chinese Medicine
SPSS操作步骤
1)建立数据文件:变量名为x 2)Analyze→Nonparametric Tests→Runs,
第九章 卡方检验
H0 :π1=π2= π3,即三种疗法的有效率相等 H1 :三种疗法的有效率不全相等 α=0.05
χ2 =532(1992/206×481+72/206×51+…+262/144×51-1)
=21.04
υ= ( 3-1)( 2-1) = 2
查χ2界值表:得P<0.005.按 α=0.05 拒绝 H0,接受H1,可 以认为三种疗法治疗周围性面神经麻痹的有效率有差别。
χ2 =∑
(︱A-T︱-0.5)2
T
χ2
=
(︱ad-bc︱-n/2)2 n (a+b)(c+d)(a+c)(b+d)
医学统计学 · 第九章 χ2 检验
例2 某医师用两种疗法治疗心绞痛,结果如表2,问
两种疗法的疗效有无差别?
表2
组 别 甲疗法 乙疗法 合 计
两种疗法治疗心绞痛的效果率
有效 23 27 50 无效 6 (4.42) 3 9 合计 29 30 59 有效率(%) 79.31 90.00 84.75
医学统计学 · 第九章 χ2 检验
H0: H1:
π1= π2 即两种疗法的疗效相等 π1≠ π2 即两种疗法的疗效不等
α=0.05 T=29×9/59=4.42(计算行合计和列合计均为最小的理论数)
2×59 ( 23 × 3 - 6 × 27 - 59/2) χc2 = =0.61 29×30×50×9
(三)、双向无序分类资料的关联性检验
例7 测得某地5801人的ABO血型和MN血型结果如表
7,问两种血型系统之间是否有关联?
表7 某地5801人的血型
ABO 血型 M O A B AB 合计 431 388 495 137 1451 MN血型 N 490 410 587 179 1666 合计 MN 902 800 950 32 2684 1823 1598 2032 348 5801
卡方检验
注意:
本法一般用于样本含量不太大的资料。因
为它仅考虑了两法结果不一致的两种情况(b, c),
而未考虑样本含量n和两法结果一致的两种情 况(a, d)。所以,当n很大且a与d的数值很大 (即两法的一致率较高),b与c的数值相对较 小时,即便是检验结果有统计学意义,其实际
意义往往也不大。
第三节
(ad bc) n (a b)(a c)(b d )(c d )
2
2
2 186 (33 104 10 39) 72 43 143 114
34.10
(四)四格表资料检验的校正公式
2 c
( A T 0.5) T
2
n 2 (| ad - bc | - ) n 2 2 c = (a +b)(c+ d )(a +c )(b+ d )
反对依据是:经连续性校正后,P值有过分 保守之嫌。此外,Fisher确切概率法建立在 四格表双边固定的假定下,而实际资料则 是单边固定的四格表,连续性校正卡方检 验的P值与Fisher确切概率法的P值没有可 比性。
• 就应用而言,无论是否经过连续性校 正,若两种检验的结果一致,无须在 此问题上纠缠。但是,当两种检验结 果相互矛盾时,如例7-2,就需要谨 慎解释结果了。 • 为客观起见,建议将两种结论同时报 告出来,以便他人判断。当然,如果 两种结论一致,如均为或,则只报道 非连续性检验的结果即可。
Ѫù½ÃñíЬ Ò Ö Ñ ±Ë · ±Ö £ b=12£ c=3£ Ò b+c=15£ ¸ ¼ Æ ´ È ¸ Ê 9-13£ Ó ¬ ¬î ¬Ê«äú뫼 ¬Ð
2 ( 12 3 1) 2 4.27 c 12 3
医学统计学第七版课后答案及解析
医学统计学第七版课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C8. E 9. B 10. A二、计算与分析12[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
四格表卡方检验
三、R*C表独立性检验
基本方法与四格表的独立性检验相同。
四、多重列联表分析
如果有三个自变量,可 以将其中一个人口学变 量看作控制变量,对于 控制变量的不同水平进 行单个列联表分析。
第 十 章
卡
方 检
教科所 张念成
验
教学目标
了解卡方检验的一般原理;
掌握卡方检验的具体方法,例如配合度检验、 独立性检验和同质性检验。
卡方检验适用情况
对计数数据进行统计分析,应该用卡方检验。
如果测量数据的总体分布形态不清楚,也可以用卡方检验等非参 数检验的方法进行分析。
主要内容
01
第一节 卡方检 验的原理
06
例题p.333
三、连续变量分布的吻合性检验
01
对于连续随机变量的计量数据,有时在实际研究中预先不知
道其总体分布,而是要根据对样本的次数分布来判断是否服
从某种指定的具有明确表达式的理论次数分布。
02
关于分布的假设检验方法有很多,运用卡方值所做的配合度
检验是最常用的一种。
举例:正态分布吻合性检验
若多个列联表呈现的结 果一致,可以将数据合 并;若不一致,则需要 各自进行分别的解释。
主要内容
01
第一节 卡方检验的原理
03
第三节 独立性检验
02
第二节 配合度检验
04
第四节 同质性检验
同质性检验
同质性检验目的在于检验不同人群母 总体在某一个变量的反应是否具有显 著差异。
同质性检验与独立性检验的方法基本相同,
统计方法的选择(不同情况有简便公式) 结果及解释
医学统计学-第九章计数资料的参数估计与卡方检验
率的标准误的计算公式:
p
(1-)
n
式中,δp 为率的标准误,π为总体率,n为样本含量
在实际工作中,由于总体率π很难知道,常用样本率P来代 替,故公式变为:
sp
Sp为率的标准误的估计值
p(1 p)
n
p为样本率
n为样本含量
方法: 1.查表法:当样本含量较小(如n≤50),特别是np或n(1-p)较小时,p呈偏态 分布, 可根据样本含量n和阳性数x,查相关统计学教材“百分率的可信区间” 表,求得总体率可信区间。 2.正态近似法:当样本含量足够大(如n﹥50),且样本率p或1-p均不太小, 如np和n(1-p)均≥5时,样本率的分布近似正态分布,可按下列公式计算 :
第二步:计算检验统计量
2 ( A T )2
T
式中: A 为实际频数(actual frequency)T 为理论频数(theoretical frequency)
第三步:确定 P 值,得出结论
x2=9.32
ν=(R-1)(C-1)=(2-1)(2-1) 由 2界值表查得 20.05,1 = 3.84 ,
组别 有效 无效 合计
H0成立下的有效率(%)
中药
T11
T12
160
西药
T21
T22
140
72.7% 72.7%
合计 218
82
300
72.7%
T11 =160 ×72.7%= 160×(218/300)=116.3 T12 =160 ×(1-72.7%)= 160×(82/300)=43.7 T21 =140 ×72.7%= 140×(218/300)=101.8 T22 =140×(1-72.7%)= 140×(82/300)=38.2
卡方检验
结果出现了 4 种表现型:长灰(1477)、长黑
(493)、残灰(446)、残黑(143),现假定 控制翅膀长度和身体颜色的两对基因是相互独立
的,且都是显隐性关系,则四种类型的果蝇其比
例应当是 9:3:3:1
现需验证这次试验的结果是否符合这一分离比例
长翅灰身(LLGG)× 残翅黑檀体(llgg) 长翅灰身(L_G_) 长灰 (1477) 长黑 (493) 残灰 (446) 残黑 (143)
• 为了度量实际观察次数与理论次数偏离的程度,最简单的
办法是求出实际观察次数与理论次数的差数。
• 当将这两个差值相加,(705-696.75)+(224-232.25)= 0。可以说, 任何类似的问题其结果都是 0。 为了避免正、负抵消,可将两个差数平方后再相加,即计算∑(O-E)2,且 由于平方,使得原来较大的差变得更大了,因而增大了分析问题的灵
算的理论频数是否相符等问题。早
在1875年,F. Helmet即得出来自正
态总体的样本方差的分布服从卡方
分布。1900年,K. Pearson也独立
地从检验分布的拟合优度发现这一
Karl Pearson (1857-1936)
相同的卡方分布。
■ χ2分布
χ2分布的概率密度函数:
■ χ2分布
χ2分布的概率密度函数:
②理论频数不少于 5
若某组的理论次数小于5,则应把它与其相邻 的一组或几组合并,直到理论次数大于5为止。
• 当自由度为 1时, • Yates(1934)提出了一个矫正公式,矫正后 的2值记为 c2
2 c
| O E | 0.5
E
2
例2 正常情况下,中国婴儿的性别比为:♂51:♀49
第9章 卡方检验
表9-2 两种药物治疗消化道溃疡4周后疗效
处理
愈合
未愈合
合计
愈合率 (%)
洛赛克 64(57.84) 21(27.16)
85
75.29
雷尼替丁 51(57.16) 33(26.84)
84
60.71
合计
115
54
169
68.05
(一)2×2列联表2检验的基本思想
表9-3 独立样本资料的四格表
组别
属性
= 0.05
2、计算统计量
2 ( A T 0.5)2
T
(| 2 4.8 | 0.5)2 (|10 7.2 | 0.5)2 (|14 11.2 | 0.5)2 (|14 16.8 | 0.5)2
4.8
7.2
11.2
16.8
2.624
3、确定P值,做出推断
为拒绝H0时,仅表示多组之间有差别。 要明确哪两组间不同,还需进一步作多组间的两
两比较,需要分割R×C列联表,并对每两个率 之间有无统计学意义做出结论。
在进行多组频率的两两比较的时候,根据比较的 次数修正检验水准。
例9-4 用三种不同治疗方法治疗慢性支气管炎的疗 效如表9-6所示,试比较三种治疗方法治疗慢性支气 管炎的疗效。
n
n1 a b
(固定值)
n2 c d
(固定值)
合计 m1 a c m2 b d
n abcd
(二)2×2列联表2检验的基本步骤
1、建立检验假设,确定检验水准
H0:1 2 H1:1 2
= 0.05
2、计算统计量
2
T11
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
理论 实际 比率 比率
r:s
a:b
2 (ra sb)2
rs(a b)
捷算公式
自由度
2
(a b)2 (a b)
(当r : s
1:1时)
2-1=1
r:s:t a:b:c
2 (r s t)(sta2 rtb2 rsc 2 )
rst(a b c) (a b c)
2)数学模型的拟合:
例:青虫菌液对菜青虫防治效果试验,观察喷药后天数与死亡的菜 青虫个数的关系:
喷药后天数(t) 1 2 3 4 5 6 7 8 9 10 11
菜青虫头数(y) 28 32 40 48 57 68 81 98 191 142 116
理论值
28.6 34.1 40.7 48.6 57.9 69.1 82.4 98.4 117.3 139.9 167.0
差异性检验,其作用与t-检验、F-检验 等相似。
9.2 2 -分布
2 -分布由Helmert(1875)发表,Karl
Pearson(1898)重新发现。
2 的定义:标准正态分布中那些相互独立
的随机变量的平方和。
n
N(, 2)
n
n
_
_
( x x)2
(x x)2
2
2
0.05 0.01
[3] 2 的计算:
1)基本公式
2
(n
1)S 2
2
2-检验的初衷是检验样本方差与总体方差是否有差异。
例:某厂生产的某种细纱支数的标准差为1.2,从某日生产 的一批产品中,随机抽16缕进行支数测量,求得标准差为 2.1,设细纱支数服从正态分布,问细纱的均匀度有无显 著变化(α=0.05)?
y 23.9691.193t
y 200
150
100
50
0
0
5
10
t 15
3)理论比率模型的检验
例如在华南农大的学生中抽取100名,其中 男生60名,是否符合1:1这个理论比率模 型?
[2]独立性检验:一种列联表检验方法。通 过求取理论频数,然后由实际频数与理论
频数求取 2 值,进行两组或多组数据的
第九章 2 --检验
9.1 问题的提出
9.2 2 -分布 9.3 2-检验
9.4 适合性检验 9.5 独立性检验
9.6 Yates’ 2值的连续性校正
9.1 问题的提出
2 -检验是把统计量
2
-分布的知识运用
于离散型随机变量(次数资料)的一项分析
方法
[1]适合性检验
1)概率分布的理论拟合:如第4章章中的实际 频数配合二项分布、Poisson分布、正态分 布理论频数的拟合。
2
_
(n
1)S 2
2
, (因:
S
2
(x x)2 )
n 1
x1 x2 xn
zi
xi
, zi2
( xi )2 ,,
2
zi2
( xi )2
统计量 2的定义
_
以 x 估计
2
(n
1)S
2
2
2 2 -分布的概率密度函数和累积分布函数:
f (2)
e k 1 22
2 2
2
k 2
(
k
)
,(0
2
)
2
F ( 2 )
P( 2)
2
n 2
(
1 n
1)!
j
(
2
)
(
n 2
1)
2
e 2
d 2
2
2 -分布的形状
0.6 df 2
0.5
df 3
0.4
0.3
df 4
0.2
df 5
3-1=2
r:s: a:b: t:u c:d
2 (r s t u)(stua2 rtub2 rtuc2 rstd 2 )
rstu(a b c d) (a b c d)
[1]理论比率模型检验(外因模型)
H 0 : Oi Ei
2
(Oi Ei )2 Ei
df k 1
k : 属性的个数
例:在华南农大的学生中抽取100名,其中男生60名, 是否符合1:1这个理论比率模型?
解:H0 : Oi Ei
尽管df 1,但由于n 100,所以不用连续性校正
2
(Oi Ei )2 (60 50)2 (40 50)2 4
Ei
50
50
2 0.05
(df
1) 3.841, 2
2 0.05
,
学生不符合
Oi Ei 60 50 40 50
1:1的理论比率模型(P 0.05)
例:P138-139例9.2
常见比率模型及 2 值捷算公式
0.1
0
0
5
10
15
9.3 2 -检验
[1]原假设H0视具体情况而定 [2]临介值:(表C3,P223)
p( 2 2 )
2
f ( 2 )d 2
2
2 0.05
: 差异不显著;
2 0.05
2
2 0.01
:
差异显著;
2
2 0.01
: 差异极显著
实际值与理论值之间的偏差的判据,这时:
2
(实际值 理论值)2 理论值
k i 1
(Oi
Ei )2 Ei
当df>1时,上式的 2 值才与 2 -分布较为接近,如df=1, 与 2 -分布相去甚远,需作连续性校正,校正公式为(
yates’ correction for continuity):[n<30时,才需校正]
2 k ( Oi Ei 0.5)2
i 1
Ei
9.4 适合性检验(test of goodness of fit)
2 适合性检验的统计假设
H0 : Oi Ei , H1 : Oi Ei
2 适合性检验有两种类型:外因模型和内因
模型。外因模型的检验是没有总体参数需估计的 情况,其自由度的个数df=k-1。而内因模型至少 有一个参数未知需要估计,其自由度的个数df=k1-j,其中j为总体参数的个数。
H0 : 2 1.22
2 (n 1)S 2 (16 1) 2.12 45.9
2
1.22
2 0.05
(d
f
n
1 15)
ቤተ መጻሕፍቲ ባይዱ
24.996
2
2 0.05
,
否定H
0
,
细纱的均匀度发生了显著的变化(
p
0.05)
2)Pearson(1899)发现, 2 值可作为离散型随机变量的