第9章卡方检验等
医学统计学第七版课后答案及解析知识分享
医学统计学第七版课后答案及解析医学统计学第七版课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A二、计算与分析12 [参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
spss统计分析和应用教程_第9章_结构方程模型
模型识别
确定所设定的模型是否能够对其估计求解.,如果模型是可 识別的,表示理论上模型中的每一个参数都可以估计出唯一的一 个估计值.
模型识别结果包括不能识别<Under-Identified>、适度识别 <just-Identified>及过度识别<Over-Identified>三种.
❖ 模型识别
实验一 结构方程模型
❖ 实验目的
明确结构方程分析有关的概念 熟练掌握结构方程模型构建的过程 能用SPSS软件中的AMOS插件进行结构方程模拟及检验 培养运用结构方程分析方法解决身边实际问题的能力
❖ 准备知识
结构方程模型中常用概念
测量变量:也叫观察变量或显示变量,是直接可以测量的指标. 潜变量:其测量是通过一个或几个可观察指标来间接完成的. 外生潜在变量:他们的影响因素处于模型之外,也就是常说的自变量. 内生潜在变量:由模型内变量作用所影响的变量〔因变量.
〔3可以在一个模型中同时处理因素的测量和因素之间的结构 传统的统计方法中,因素自身的测量和因素之间的结构关系往
往是分开处理的——对因素先进行测量,评估概念的信度与效度,通 过评估标准之后,才将测量资料用于进一步的分析.
在结构方程模型中,则允许将因素测量与因素之间的结构关系纳 入同一模型中同时予以拟合,这不仅可以检验因素测量的信度和效 度,还可以将测量信度的概念整合到路经分析等统计推理中.
❖ 请对大学生闲暇时间消费与满意度之间构 建结构方程模型.
❖ 实验步骤
❖ 结构方程分析由SPSS17.0软件中的 AMOS插件完成.下面以案例说明判别分析 的基本操作步骤.
❖ 实验步骤
〔1准备工作.在SPSSl7.0软件中安装AMOS插件后,先 调用SPSS17.0软件,打开数据文件9-1.sav,通过选择" 文件—打开"命令将数据调入SPSSl7.0的工作文件窗口.
卡方检验解释
第一步:输入数据(略)
第二步:指定频数变量:weight cases—人数
第三步:crosstabs过程(略)
(三)结果解释:(P265)
1、value:检验统计量值
2、asymp.sig.2-sided:双侧近似概率
3、exact sig.2-sided:双侧精确概率
4、exact sig.1-sided:单侧精确概率
1、tables模块:即custom tables菜单
可以为多选题生成各种复杂的频数表和交叉表,并计算表中各种比例指标。
2、optimal scaling过程:
用于非线性典型相关法(OVERALS)对多选题数据进行最优尺度分析(多重对应分析)。
3、multiple response菜单:
专门为多选题数据的描述而设计,用于生成频数表和交叉表。
(2)列(columns):用于选择行*列表中的列变量
(3)层(layer):用于设置分层分析变量
(4)显示分组条形图(display clustered bar charts):可以直观反映各单元格内频数的多少。
(5)压缩表(suppress table):禁止在结果中输出行*列表
2、exact对话框(略):
用于设定针对2*2以上行*列表是否进行确切概率的计算,以及具体的计算方法。
(1)Asymptotic only:只计算近似的概率值,不计算确切概率
(2)montecarlo:采用蒙特卡罗 模拟方法计算确切概率值。
即进行10000次抽样,给出确切概率以及99%可信区间。(默认值可以更改)
(3)exact:计算出确切的概率值
如:要了解病人采用了那些非药物方法来控制高血压,问题如下:
《医学统计学》医统-第九章卡方检验
卡方值
当自由度ν确定后,χ2分布曲线下右侧尾部的面积 为α时,编辑课横件 轴上相应的χ2值记作χ2α,ν
查χ2界值表,得χ20.05,1=3.84,按α=0.05 水 准, 拒绝H0 , 接受H1 , P<0.05,可 以认为两组治疗原发性高血压的总体有 效率不同,即可认为吲达帕胺片治疗原 发性高血压是有效的。
医学统计学
第九章 2检验
公共卫生系 流行病与卫生统计学教研室
祝晓明
一、率
率(rate):率表示在一定空间或时间范围内 某现象的发生数与可能发生的总数之比,说明 某现象出现的强度或频度,通常以百分率 (%)、千分率(‰)、万分率(/万)、或 十万分率(/10万)等来表示。
你们班级的及格率,挂科率怎么算?
❖自由度ν愈大,χ2 值也会愈大;所以 只有考虑了自由度ν的影响,χ2 值才
能正确地反映实际频数A和理论频数T 的吻合程度。
检验的自由度取决于可以自由取值的格子数目,
而不是样本含量n。四格表资料只有两行两 列,ν=1,即在周边合计数固定的情况下,4个基
本数据当中只有一个可以自由取值。
编辑课件
检验步骤: 1.建立检验假设并确定检验水准 H0:π1=π2 即试验组与对照组的总体有效率相等 H1:π1≠π2 即试验组与对照组的总体有效率不等
2
(20 25.77)2
(24 18.23)2
(21 15.23)2
(5 10.77)2
8.40
25.77
18.23
15.23
10.77
(2 1)(2 1) 1
编辑课件
纵高
3.确定P 值,作出推断结论
0.5
0.4
0.3
自由度=1
医学统计学 -第09章 卡方检验
0.4 f(x)
v=1
0.3
2分布
0.2
v=4
v=6 v=9
0.1
0.0
0
3
6
9
12
15 x
(2)计算检验统计量
2 (A T )2
T
(41 36.5625)2 (4 8.4375)2 (24 28.4375)2 (11 6.5625)2
36.5625
8.4375
28.4375
6.5625
理论基础:超几何分布,不属于卡方检验
谢谢
表 慢性咽炎两种药物疗效资料
分组
兰芩口服液 银黄口服液
合计
有效
41 24 65
无效
4 11 15
有效率 (%) 91.11
68.57 81.25
合计
45 35 80
问题: 两个总体有效率是否相等?
(1)建立检验假设 H0:π1=2 两药的总体有效率相同 H1:π1≠π2 两药的总体有效率不同 检验水准=0.05
bc
= 1
若b+c<40,采用以下校正公式
2 (| b c | 1)2
= 1
bc
第三节 行×列表资料的2检验
(一)R×C表 最常见的形式是
2×C列联表(一般为2个构成比的比较) R ×2列联表(一般为多个样本率的比较)
R×C列联表2检验的原理与2×2列联表2 检验的原理完全一样
统计量计算公式
合计 40 30 32 102
有效率(%) 87.50 66.67 21.88 60.78
(1)建立检验假设,确定检验水准
H0 :1 2 3
H1
:
1
,
第9章 定性资料的参数估计与卡方检验
n r nc Trc n
基本步骤:
1. 建立检验假设,确定检验水准 H0:1= 2 即试验组与对照组的总体有效率相等 H1:1≠2 即试验组与对照组的总体有效率不等 =0.05 2. 计算检验统计量
( ARC TRC )2 ( A T )2 TRC T
2
(20 25.8)2 (24 18.2)2 (21 15.2)2 (5 10.8)2 25.8 18.2 15.2 10.8 8.40
2检验的基本步骤与其他假设检验方法相同 检验的基本步骤与其他假设检验方法相同。 。随 实验设计方法的不同, 实验设计方法的不同 ,检验假设的具体内容与计算2 值的专用公式也不尽相同, 值的专用公式也不尽相同 ,分述于后 分述于后。 。 应用范围:推断两个及多个总体率或多个构成 应用范围: 推断两个及多个总体率或多个构成 比之间有无差别;两种属性或两个变量之间有无关 联性;频数分布的拟合优度检验。 联性;频数分布的拟合优度检验 。
种培养基培养结核菌,结果如下,问A、B两种培养基 的阳性培养率是否不等? A、B两种培养基的培养结果 A + 合计 B + 48 (a) 20 (c) 68 24 (b) 106 (d) 130 合计 72 126 198
基本步骤:
1. 建立检验假设,确定检验水准 H0:B= C 即两种培养基的阳性培养率相等 H1:B≠C 即两种培养基的阳性培养率不等 =0.05 2. 计算检验统计量,本例b+c>40,因此
70名高血压患者随机分为两组,试验组用该药加辅助 治疗,对照组用安慰剂加辅助治疗,结果如下,问该 药治疗原发性高血压是否有效? 两种疗法治疗原发性高血压的疗效 组别 有效 无效 合计 有效率( (a+b) 80.77 试验组 21 (15.2) c 5 (10.8) d 26 (c+d) 41 (a+c) 29 (b+d) 70 (n) 58.57 合计
第9章卡方检验
当n较小时,则可以利用校正的u检验:
| p1 p2 | (1 / n1 1 / n2 ) / 2 uc Nov 24,2009 S p1 p2
例9-3 考察某市2000年城乡居民的卫生服 务需求,以近两周病患病情况作为调查指 标。分别在城区和农村进行了抽样调查, 其中城区调查了660人,有90人近两周患病, 农村调查了640人,有140人近两周患病, 问两组人群的两周患病率是否相同?
二、正态近似法 当n较大,总体率 既不接近0也不 接近1,n和n (1-)均大于5,二 项分布近似正态分布,利用正态分 布的原理,计算检验统计量u值作假 设检验。
u
Nov 24,2009
p 0
p
p 0
0 (1 0 ) / n
例9-2 已知一般人群中慢性支气 管炎患病率为9.7% ,现调查了500 名吸烟者,其中有95人患慢性支气 管炎,试推断吸烟人群中慢性支气 管炎患病率是否比一般人群高?
Nov 24,2009
一、四格表资料的2检验
2检验的基本思想
组别 阳性数 阴性数 合计
I组
II组 合计
a
c a+c=n.1
b
d b+d=n.2
a+b=n1.
c+d=n2. a+b+c+d=n
Nov 24,2009
基本步骤
1、建立假设 H0:城乡居民的两周总体患病率相同 即1=2= H1:城乡居民的两周总体患病率不同 即1≠2, α=0.05
b
d b+d=n.2
a+b=n1.
c+d=n2. a+b+c+d=n
(ad bc) n (a b)(c d )(a c)(b d )
医学统计学第六版(马斌荣)课后习题答案教学教材
医学统计学第六版(马斌荣)课后习题答案第一章绪论部分一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A二、计算与分析12[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
第9章第3节相关性最小二乘估计回归分析与独立性检验
第9章第3节相关性最小二乘估计回归分析与独立性检验首先来看相关性。
相关性是指两个或多个变量之间的关联程度。
相关性可以用相关系数来度量,最常用的是皮尔逊相关系数。
皮尔逊相关系数的取值范围为-1到1,其中1表示完全正相关,-1表示完全负相关,0表示无相关性。
相关性分析可以帮助我们了解两个变量之间的关系,以及一个变量的变化如何影响另一个变量。
最小二乘估计是一种用于估计回归方程中参数的方法。
回归方程是用来描述一个因变量和一个或多个自变量之间关系的数学模型。
最小二乘估计通过最小化实际观测值和回归方程预测值之间的平方差来找到最佳拟合的回归模型。
最小二乘估计的结果是一组参数估计值,可以用来预测因变量的值。
回归分析是利用回归模型来分析因变量和自变量之间的关系。
回归分析可以用于预测因变量的值,检验自变量对因变量的影响,以及评估模型的拟合度等。
回归分析可以应用于各种领域,如经济学、医学、社会学等。
通过回归分析,我们可以找出自变量对因变量的贡献程度,并使用回归模型进行预测和决策。
独立性检验是用于判断两个或多个变量之间是否存在关联性的方法。
独立性检验通常用于分析分类变量之间的关系。
最常用的独立性检验方法是卡方检验。
卡方检验通过比较实际观测值和期望频数之间的差异来判断两个变量之间是否独立。
如果实际观测值和期望频数之间没有显著差异,可以认为两个变量是独立的;反之,如果有显著差异,则说明两个变量存在关联性。
总结起来,相关性、最小二乘估计、回归分析和独立性检验是统计学中常用的分析变量之间关系的方法。
它们可以帮助我们了解变量之间的关联程度,估计回归方程中的参数,预测因变量的值,判断变量之间是否独立等。
在实际应用中,我们可以根据具体研究问题选择适当的方法来进行分析。
《统计学》第9章 逻辑回归
《统计学》
4
9.1 二分类变量的逻辑回归模型
逻辑回归模型中
二分类因变量 :只有两个取值 0、1。
✓ 在引例中,信贷违约记为1,没有违约记为0。
✓ 根据邮件的特征做一个垃圾邮件过滤系统,预测的 值就是邮
件的类别:垃圾邮件(记为1) 还是正常邮件(记为0)。
第九章 逻辑回归
《统计学》
5
9.1 二分类变量的逻辑回归模型
(0 ) − (1 )
当样本量足够大时,偏差的差也近似服从卡方分布,自由度等于两个
模型自由度之差。
✓第三步:同样当偏差大到超过卡方的 1 − 分位数时拒绝原假设,即认
为简化模型0 不成立。
第九章 逻辑回归
《统计学》
20
9.4 拟合方程的评价
例.例9.2中得到拟合模型 logit () = −3.6947 + 1.8151。
第九章 逻辑回归
《统计学》
18
9.4 拟合方程的评价
偏差——模型的比较或简化
假设有两个模型0 和1 ,其中 0 是1 的特例,称1 为完全模型,0
为简化模型。
例.考虑有3个自变量的模型
logit () = 0 + 0 1 + 2 2 + 3 3 .
要检验0 : 2 = 3 = 0。
➢第一步:检验 0 : 1 = 0。0 模型即为 logit () = 0 。
➢第二步:进行偏差的卡方检验,结果显示
(0 ) − (1 ) = 225.76 − 195.74 = 30.021
自由度的差 = 1。
➢第三步:卡方检验的 值 = 4.273 − 08。
拒绝原假设,说明重量对于是否有追随者有显著性的影响。
统计学课件第9篇章分类数据分析
谢谢聆听
其他回归模型
总结词
除了线性回归分析和Logistic回归分析之外,还有许多其他类型的回归模型可 供选择。
详细描述
这些模型包括岭回归、套索回归、多项式回归、逐步回归等,每种模型都有其 特定的适用场景和假设条件。选择合适的回归模型需要考虑数据的特征、模型 的预测精度和解释性等因素。
06 分类数据分析的实际应用
市场细分分析
市场细分
通过分类数据分析,将市场划分为不 同的细分市场,以便更好地理解客户 需求和行为,从而制定更有效的营销 策略。
消费者行为研究
通过分析消费者的购买行为、偏好和 态度,了解不同细分市场的消费者需 求和趋势,以优化产品设计和市场定 位。
人口统计学研究
人口普查
利用分类数据分析对人口普查数据进行处理和分析,了解人口分布、年龄结构、 性别比例等人口统计学特征。
05 分类数据的回归分析
线性回归分析
总结词
线性回归分析是一种通过建立自变量与因变量之 间的线性关系来预测因变量的方法。
总结词
线性回归分析的假设包括线性关系、误差项独立 同分布、误差项无偏和误差项同方差。
详细描述
线性回归分析基于最小二乘法原理,通过拟合一 条直线来描述自变量和因变量之间的关系。这种 方法适用于因变量是连续变量的数据,并且自变 量和因变量之间存在线性关系。
选择合适的图形类型,将频数分布表 中的数据按照分类变量进行分组并绘 制图形。
相对频率与累积频率
相对频率
01
某一组的频数与总频数之比,用于表示该组在总体中的相对重
要程度。
累积频率
02
某一组的相对频率与前面所有组的相对频率之和,用于表示该
组及之前所有组在总体中的相对重要程度。
第09章 X2检验
第9章 X2检验9.1 列联表统计分析1、列联表统计分析过程例9.1在二乙基亚硝胺诱发大白鼠咽癌的实验中,一组单纯用亚硝胺向鼻腔内滴注;另一组在鼻注的基础上加肌注维生素B12,问两组发癌率的差别有无统计意义。
实验结果如表9.1所示。
表9.1大白鼠鼻回癌的实验数据━━━━━━━━━━━━━━━━━━发癌数 未发癌数━━━━━━━━━━━━━━━━━━鼻注组 52 19鼻注加肌注组 39 3━━━━━━━━━━━━━━━━━━本例为两样本率之间的比较,可以采用x2检验进行分析。
1)首先建立数据文件,定义变量“组别”(n型,宽度为1,在数值标签中定义1为鼻注组,2为鼻注加肌注组)、“疗效”(N型,宽度为1,在数值标签中定义1为发癌,2为未发癌)、和“频数”并输入数据,如图9.1。
图 9.1 卡方检验数据格式由于该数据不是原始数据,而是频数表的数据。
所以要用“data”(数据)菜单中的weight cases(案例加权)来进行加权处理。
2)、单击Data(数据)菜单中的Weight Cases(案例加权)子菜单,弹出Weight Cases (案例加权)对话框,将“频数”变量单击进入Frequency Variable(频数变量)框内,按“频数”对数据进行加权,此时所有观测值相当于发生了“频数”次,如图9.1.2,单击Continue按钮返回主对话框。
图 9.2 案例加权3)、执行Analyze(统计分析)菜单|Descriptive Statistics(描述统计量)子菜单|Crosstabs…(交叉表)命令,系统弹出Crosstabs(交叉表)对话框,如图9.1.3,图 9.3交叉表对话框(1)单击变量从变量清单中选择1个(组别)或几个变量进入Row(s)(行)框中,作为交叉表的行,选择1个(疗效)或几个变量进入Column(s)(列)框中,作为交叉表的列,表示以“组别”变量为交叉表的行,以“疗效”为交叉表的列。
医学统计学第七版课后答案及解析
医学统计学第七版课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A二、计算与分析12[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
医学统计学-第九章计数资料的参数估计与卡方检验
率的标准误的计算公式:
p
(1-)
n
式中,δp 为率的标准误,π为总体率,n为样本含量
在实际工作中,由于总体率π很难知道,常用样本率P来代 替,故公式变为:
sp
Sp为率的标准误的估计值
p(1 p)
n
p为样本率
n为样本含量
方法: 1.查表法:当样本含量较小(如n≤50),特别是np或n(1-p)较小时,p呈偏态 分布, 可根据样本含量n和阳性数x,查相关统计学教材“百分率的可信区间” 表,求得总体率可信区间。 2.正态近似法:当样本含量足够大(如n﹥50),且样本率p或1-p均不太小, 如np和n(1-p)均≥5时,样本率的分布近似正态分布,可按下列公式计算 :
第二步:计算检验统计量
2 ( A T )2
T
式中: A 为实际频数(actual frequency)T 为理论频数(theoretical frequency)
第三步:确定 P 值,得出结论
x2=9.32
ν=(R-1)(C-1)=(2-1)(2-1) 由 2界值表查得 20.05,1 = 3.84 ,
组别 有效 无效 合计
H0成立下的有效率(%)
中药
T11
T12
160
西药
T21
T22
140
72.7% 72.7%
合计 218
82
300
72.7%
T11 =160 ×72.7%= 160×(218/300)=116.3 T12 =160 ×(1-72.7%)= 160×(82/300)=43.7 T21 =140 ×72.7%= 140×(218/300)=101.8 T22 =140×(1-72.7%)= 140×(82/300)=38.2
卫生统计学第二版习题册方积乾答案与解析
卫生统计学第二版习题册方积乾答案与解析第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施;(2)不能随机分组;(3)很难控制干扰因素;(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便:缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小:缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计:缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查:缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标;(2)确定调查对象和观察单位;(3)选释调查方法和技术;(4)估计样本大小;(5)编制调查表;(6)评价问卷的信度和效度;(7)制定资料的收集计划;(8)指定资料的整理与分析计划;(9)制定调查的组织措施。
4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
卡方检验
结果出现了 4 种表现型:长灰(1477)、长黑
(493)、残灰(446)、残黑(143),现假定 控制翅膀长度和身体颜色的两对基因是相互独立
的,且都是显隐性关系,则四种类型的果蝇其比
例应当是 9:3:3:1
现需验证这次试验的结果是否符合这一分离比例
长翅灰身(LLGG)× 残翅黑檀体(llgg) 长翅灰身(L_G_) 长灰 (1477) 长黑 (493) 残灰 (446) 残黑 (143)
• 为了度量实际观察次数与理论次数偏离的程度,最简单的
办法是求出实际观察次数与理论次数的差数。
• 当将这两个差值相加,(705-696.75)+(224-232.25)= 0。可以说, 任何类似的问题其结果都是 0。 为了避免正、负抵消,可将两个差数平方后再相加,即计算∑(O-E)2,且 由于平方,使得原来较大的差变得更大了,因而增大了分析问题的灵
算的理论频数是否相符等问题。早
在1875年,F. Helmet即得出来自正
态总体的样本方差的分布服从卡方
分布。1900年,K. Pearson也独立
地从检验分布的拟合优度发现这一
Karl Pearson (1857-1936)
相同的卡方分布。
■ χ2分布
χ2分布的概率密度函数:
■ χ2分布
χ2分布的概率密度函数:
②理论频数不少于 5
若某组的理论次数小于5,则应把它与其相邻 的一组或几组合并,直到理论次数大于5为止。
• 当自由度为 1时, • Yates(1934)提出了一个矫正公式,矫正后 的2值记为 c2
2 c
| O E | 0.5
E
2
例2 正常情况下,中国婴儿的性别比为:♂51:♀49
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、计算检验统计量 2 2592( 3212 3692 L 4442 1)
1080 987 1080518 995933 297.3750
(3 1)(4 1) 6
3、确定 P 值,作出统计推断
本例
2
2 0.05,6
12.59 ,P<0.05,按=0.05水准拒绝H0,
接受H1,差异有统计学意义,可以认为三个不同地区的 人群血型构成分布不同或不全相同。
第九章
分类变量资料的统计推断
2检验是一种用途比较广泛的检验方法, 它属于非参数检验的范畴,主要用于两个及 两个以上样本率(或构成比)的比较以及两 个分类变量的关联性分析,还可用于拟合优 度的检验等。
第一节
完全随机设计两样本率比较的2 检验
分组
城区 农村 合计
表 9-1 某市 2008 年城乡居民的两周患病率
α=0.05
2、计算理论值和检验统计量
2 280 ( 90 2 10 2 42 2 1) 31.80
100 198 100 82
90 82
(3 1)(2 1) 2
3、确定 P 值,作出统计推断
查2
界值表,得
2 0.05,2
5.99
,
P<0.05,拒绝 H0,可以认为三种药物治疗胃溃疡的愈合率不
两周患病情况
有
无
合计 患病率(%)
95(123.31) 585(556.69)
680
13.97
148(119.69) 512(540.31)
660
22.42
243
1097
1340
18.13
一、假设 H0:两种疗法治愈率相等 即1=2=
H1:甲乙疗法治愈率不等 即1≠2 2. 计算统计量 理论频数TRC的计算公式为:
表 93 两组治疗心绞痛疗效比较
组别 有效人数 无效人数 合计 有效率(%)
治疗组 32(28.64) 3(6.36) 35
91.43
对照组 13(16.36) 7(3.64) 20
65.00
合计
45
10
55
80.82
2 (| 32 7 313 | 55 / 2)2 55 4.33
35 45 20 10
第二节 配对设计两样本率比较的2检验
变色培 养基
+ 合计
表 9-4 两种培养基的培养结果
罗氏培养基
+ 54(a) 18(c)
30(b) 18(d)
72
48
合计
84 36 120(n)
1、建立检验假设 H0:两种培养基的阳性率相同,即总体 B=C H1:两种培养基的阳性率不同,即总体 B≠C =0.05
113.23
526.77
=(R-1)(C-1)
0.3 =1
=3 0.2
=5 0.1
0.0
0
1
2
3
4
5
6
7
8
9
10
2
3、求P值并作出统计结论
查附表
9
可知,自由度
=1
时,
2 0.05,1
=3.84,
2 0.01,1
6.63,本例
2
值
16.12>6.63, 因此 P<0.01。按照 =0.05 的检验水准,拒绝 H0 假设,接受
2、计算检验统计量
2 (b c)2 3.0
(b c)
(b+c40)
2 ( b c 1)2
(b c)
(b+c<40 )
3、得出P值和结论
查 2 界值表得: 02.05,1 =3.84, 2 =3.00<3.84,因此 P>0.05, 不拒绝 H0 假设,尚不能认为两种方法检出细菌的阳性率不同。
第三节 完全随机设计的行×列表2检验
2 n( A2 1)
nr nc
一、多组率的比较
表 9-5 三种药物治疗胃溃疡的疗效
分组
治疗效果
愈合
未愈合
合计 愈合率(%)
奥美拉唑
90
雷尼替丁
60
硫糖铝片
48
10
100
90.00
30
90
66.67
42
90
53.33
合计
198
82
280
70.71
1、建立检验假设 H0:三种药物治疗胃溃疡的愈合率相等 H1:三种药物治疗胃溃疡的愈合率不等或不全相等
TRC=nR×nC/n 243
T11 6801340 6800.1813 123.31
计算2值的基本公式:
2 ( A T )2
T
2
(A T)2 (90 116.77)2 (570 543.23)2
T
116.77
543.23
(140 113.23)2 (500 526.77)2 16.12
第五节 定性资料的关联性分析
对同一组对象,按照其两种分 类变量的不同水平分组,所产生的 数据排成双向交叉的统计表,称为 列联表,用以描述行变量和列变量 的关系。
一、22列联表资料的相关分析
表 9-10 甲乙两种培养基的培养结果
甲法
乙法
+
-
+
54(a)
30(b)
-
18(c)
18(d)
合计
72(a+c)
等或不全相等。
二、两组或多组构成比的比较
表9-6 三个不同地区人群血型的频数分布
分组
A
B
AB
O
合计
亚洲
321 369 95
295 1080
欧洲
258 43 22
194 517
北美洲 408 106 37
444 995
合计
987 518 154
933 2592
1、建立检验假设 H0:不同地区人群血型构成分布相同 H1:不同地区人群血型构成分布不同或不全相同
2
( A T )2
T
(2)当总合计数n≥40,而有1<T<5 时,用
校正公式或确切概率法。
(3)有T<1或n<40时,需用确切概率法。
四格表资料2值的校正公式
2 ( A T 0.5)2
T
2 ( ad bc n / 2)2 n
(a b)(c d )(a c)(b d )
48(b+d)
合计
84(a+b) 36(c+d) 120(n)
2值的校正 x1、x2……xk~N 2= x12+ x22+……+xk2为ν=k的连续型分布
分类资料为间断的、不连续分布。 故计算的2值不连续,尤其是自由度为1 的四格表,求出的概率可能偏小,因此 需进行连续性校正。
四格表2检验的条件
(1)当n≥40,且每个格子的理论频数T≥5 时,用基本公式或确切概率法:
H1 假设。即该市城乡居民的总体两周患病率不同。根据现有资料看出,
农村的患病率高于城区。
二、四格表资料的专用公式
2
(ad bc)2 n
(a b)(a c)(c d )(b d )
2 (95 512 585 148)2 1340 16.12
680 660 2431097
三、四格表资料2值的校正及2检验的条件