定性资料的统计描述4
医学统计学(第二版)思考与练习答案
离散程度指标四分位数间距= (mmol/L)
三、最佳选择题
1.B2. E3. B4.C5. D6.E7.A8.D9. D
四、综合分析题
1.解:输出结果
图4-4尿总砷的频数分布图
由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。
输出结果
图4-5尿总砷对数的频数分布图
2.样本均数的抽样分布的特点有:①各样本均数未必等于总体均数;②样本均数之间存在差异;③样本均数服从正态分布;④样本均数的变异范围较原变量的变异范围小;⑤随着样本含量的增加,样本均数的变异范围逐渐缩小。
3.标准差与标准误的区别在于:①计算公式:标准差为 ,标准误为 ;②统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大;③用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。
COPD患者的经常吸烟率比非COPD患者高26.69%
还需进一步对 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。
输出结果
2.解:
表5-4某地居民1998~2004年某病死亡率(1/10万)动态变化
年份
符号
死亡率
绝对增长量
发展速度
增长速度
累计
二、案例辨析题
该结论不正确。因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。
三、最佳选择题
4.定性资料的统计描述
但要注意的是:在一定的条件下, 但要注意的是:在一定的条件下,构成比可以反映 率的趋势 如某幼儿园在一年内总的人数不变, 如某幼儿园在一年内总的人数不变,现知春夏 秋冬四季感冒的发病情况 : 春 人数 % 35 35% 夏 20 20% 秋 20 20% 冬 25 25%
3、正确计算合计率 合计率=合计的阳性人数/ 合计率=合计的阳性人数/合计的总人数 Pc=(X1+X2)/(n1+n2) 4、注意资料的可比性 在比较相对数时,除了要比较的因素不同以外, 在比较相对数时,除了要比较的因素不同以外, 其余的影响因素应尽可能相同或相近。要注意: 其余的影响因素应尽可能相同或相近。要注意:
医学上常用的频率指标有
患病率
= = = =
某期内患病人数(新旧病例 某期内患病人数 新旧病例) 新旧病例 调查人数 一定时间内新病例数 该地同期平均人口数 某期内死亡人数 该期内平均人口数
×比例基数
发病率 死亡率
×比例基数
×比例基数 ×比例基数
病死率
某期内因某病死亡人数 同期内患该病的病人数
2、构成比(proportion) 、构成比
甲乙两方法对某病的疗效
甲方法
病 情 治愈率( ) 治疗例数 治愈例数 治愈率(%)
乙方法
治愈率( 治疗例数 治愈例数 治愈率(%)
轻病人 重病人 合 计
10 40 50 32 64
40 10 50 33 66
.间接法的计算:被标化组各组段的率 i未知,只知道各组 间接法的计算:被标化组各组段的率p 未知,
0 25 125 344 371 170 1035
0 8.6 49.9 179.9 324.4 329.0 39.46
合计 2694627 1.0000
定性资料统计描述
(一) 单项选择题 1. 某病患者120人,其中男性114人,女性6人,分别占95%与5%,则结论为( )。
A. 该病男性易得B. 该病女性易得C. 该病男性、女性易患率相等D. 尚不能得出结论2. 甲县恶性肿瘤粗死亡率比乙县高,经标准化后甲县恶性肿瘤标化死亡率比乙县低,其原因最有可能是( )。
A. 甲县的诊断水平高B. 甲县的肿瘤防治工作比乙县好C. 甲县的老年人口在总人口中所占比例比乙县小D. 甲县的老年人口在总人口中所占比例比乙县大3. 已知男性的钩虫感染率高于女性。
今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( )。
A. 分别进行比较B. 两个率比较的χ2检验C. 不具备可比性,不能比较D. 对性别进行标准化后再比较4. 经调查得知甲乙两地的冠心病粗死亡率为40/10万,按年龄构成标化后,甲地冠心病标化死亡率为45/10万;乙地为38/10万,因此可以认为( )。
A. 甲地年龄别人口构成较乙地年轻B. 乙地年龄别人口构成较甲地年轻C. 甲地冠心病的诊断较乙地准确D. 甲地年轻人患冠心病较乙地多5. 某地区某种疾病在某年的发病人数为a 0,以后历年为a 1,a 2,……,a n ,则该疾病发病人数的年平均增长速度为( )。
A .B .C .D .6. 某部队夏季拉练,发生中暑21例,其中北方籍战士为南方籍战士的2.5倍,则结论为( )。
A . 北方籍战士容易发生中暑B . 南方籍战士容易发生中暑C . 北方、南方籍战士都容易发生中暑D . 尚不能得出结论7. 某地区某种疾病在某年的发病人数为a 0,以后历年为a 1,a 2,……,a n ,则该疾病发病人数的年平均发展速度为( )。
A .B .C .D .8. 相对比包括的指标有( )。
A . 对比指标B .计划完成指标C . 关系指标D .以上都是 (二) 名词解释1...10++++n a a a n n n a a a 110+⨯⨯n n a a 010-n n a a nn a a a 110+⨯⨯nn a a 010-n n a a 1...10++++n a a a n1. 相对数2. 率3. 构成比4. 比5. 标准化法6. 动态数列7. 时点动态数列8. 定基比9. 环比 10.平均增长速度(三)简答题1. 常用的相对数指标有哪些?它们的意义和计算上有何不同?2. 为什么不能以构成比代率?请了解实际加以说明。
预防医学考研资料
19.85 12.65
20
总患病率=147/1162×100%=12.65%
5、相对数比较时应有可比性。
(1)观察对象是否同质:即除了观察因素外,影
响相对数大小的其他因素,应尽量相同,才属于同 质,才有可比性。如比较甲乙两种方法的治愈率时, 除了两种方法不同外,影响治愈率大小的因素有年 龄、病因、病型、病情严重程度等因素应尽量相同。 (2)观察对象内部构成是否相同,如不同,应进行 率的标准化。
这一定义是从防止死亡角度来考虑的。只 是原则之一。
如:某人患慢性支气管炎30年,肺气肿10
年,肺心病3年,心力衰竭死亡。
a、肺心病
3年
b、肺气肿
10年
c、慢性支气管炎 30年
整理课件
35
3、疾病统计指标
发病率:表示某时期内某一定人群中 新发生某病的频度。
发病率 同某期时平期均新人发口 病 1年 数例 K数
女性:136人 为54% 男性:116人 为46%
居住地不同缺铁性贫血患病率
居住地 住院总人数 缺铁贫血数 患病率(%)
河南平原 贵州山区
20611 31860
53 137
0.26 0.43
整理课件
18
3、不能用构成比的动态分析代替率的动态 分析。
表 某市1980年和1990年5种传染病情况
疾病
1980年
-
380
乙疗法
原治愈率
预期治 愈数
65.0 260
41.7 -
167 427
整理课件
42
按照上述公式计算标准化率:
p甲 ' 380800100%47.5% p乙 ' 427800100%53.4% 可以认为,乙疗法化的治标愈率高于甲疗法
定性数据统计描述、统计图表
人口数 ⑵
82920
死亡 总数 ⑶
其中恶性肿 瘤死亡数 ⑷
4
恶性肿瘤死 亡占总死亡
的% ⑸
2.90
恶性肿瘤死 年龄别死
亡率(1/10 亡率(‰)
万)
⑺
⑹
20~
63
19.05
25.73
40~ 28161 172
42
60及以
32
上
合计 167090 715
90
12.59
年龄 (岁)
⑴
人口数 ⑵
胃癌 食管癌 肝癌 肺癌
无 无 0.34/10万 无
1.13/10万 0.1/10万 1.64/10万 0.41/10万
19.92/10 万 2.18/10万
25.30/10 万 20.21/10 万
150/10万
35.20/10 万 97.51/10 万 125.10/10 万
313.44/10 万
单选题
已知男性的钩虫感染率高于女性。今欲比较甲乙两 乡居民的钩虫感染率, 但甲乡人口女多于男, 而乙乡 男多于女, 适当的比较方法是( )。
A. 分别进行比较 B. 两个率比较的χ2检验 C. 不具备可比性, 不能比较 D. 对性别进行标准化后再比较
单选题
▪ 已知238名健康人发汞含量的频数分布, 若 用图形进行描述, 则选择( )
▪ 比较不同年代心脏病的发病率的情况, 这就要求正确计算 各年代的发病率。根据率的计算公式, 分子是各年代心脏 病人数, 分母应当是所研究地区和时间内所有的受检人数。
案例分析3
请按照统计表编制的要求修改下表。
表4 1976~1979年吉林市各型恶性肿瘤的死亡率
年龄组
医学统计学定性资料定量资料习题
第四章定量资料的统计描述1. 编制频数表时错误的做法是().A. 用最大值减去最小值求全距B。
组距常取等组距,一般分为10~15组C。
第一个组段须包括最小值 D. 最后一个组段须包括最大值E. 写组段,如“1.5~3,3~5,5~6。
5,…”2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是()。
A. 中位数B. 几何均数C. 调和均数D. 算术均数E。
众数3。
比较5年级小学生瞳距和他们坐高的变异程度,宜采用()。
A. 变异系数B。
全距 C. 标准差D。
四分位数间距 E. 百分位数P2.5与P97.5的间距4. 均数和标准差S的关系是( )。
A。
S越小,对样本中其他个体的代表性越好B。
S越大,对样本中其他个体的代表性越好C。
越小,S越大D。
越大,S越小E。
S必小于5。
在正态分布条件下表示变量值变异情况的指标最常用的是()。
A。
标准差B。
标准误 C. 变异系数D。
全距E。
百分位数6. 变异系数越大说明( ).A. 标准差越大B。
平均数越大C。
标准差、平均数都大D。
平均数小 E. 以均数为准变异程度大7. 在服从正态分布条件下,样本标准差S的值( )。
A。
与集中位置有关 B. 与观察例数n无关C。
与平均数有关D。
与平均数无关E。
与个体的变异程度有关8。
计算几何均数G时,用常用对数lgX和用自然对数lnX所得计算结果( ).A. 一样B。
不一样C。
有时一样,有时不一样D。
有时相差较大,只能用lgX9. 算术均数与中位数相比,()。
A. 抽样误差更大B。
不易受极端值的影响C。
更充分利用数据信息 D. 更适用于分布不明及偏态分布资料10. 比较连续分布数据的离散度,( )。
A. 单位相同时根本不能用CV B。
单位相同均数相差较大时根本不能用SC. S表示绝对离散度,CV表示相对离散度. D。
只要单位相同,用S和用CV都是一样的11. 以中位数表示几种趋势,( )资料。
A。
不能用于正态分布的B。
不能用于严重偏态的连续分布C. 可用于任何分布的定量资料D. 可用于任何一种定性资料12。
2.2定性资料的统计描述
1.分类资料的描述—频率和频率分布
1.1 二分类资料的描述—频率
当事物只有两种可能的结局时,常用频 率来描述结局的规律性。如存活与死亡、 患病与未患病、阳性与阴性等。 频率型指标是最常见的, 通常近似地反 映某一事件出现的机会大小,如发病概率、 死亡概率等。
实 际 发 生 某 事 件 的 观单 察位 数 频率型指标 K 可 能 发 生 某 事 件 的 观单 察位 总 数
有人据此提出干预试验虽然可以降低充血性心力衰竭等的死亡 率,但却增高了冠状动脉病和心脏病猝死的死亡率。
某市1980年和1990年五种传染病发病情况
病种 1980年 1990年 病例数 % 病例数 % 痢疾 3604 49.39 2032 37.92 肝炎 1203 16.49 1143 21.33 流脑 698 9.56 542 10.11 麻疹 890 12.20 767 14.31 腮腺炎 902 12.36 875 16.33 合计 7297 100.00 5359 100.00
例1 在某医院的院内感染调查中,5031名病人 共观察了127859人日(例均25.4日),其中有 596人在医院发生感染,请计算院内感染率。
596 院内感染率 100% 0.47 0 0日 127859
平均每天有0.47%的病人在医院发生感染。
例2 某医院对同一疾病开展甲、乙两种手 术治疗,分别随机抽取100名患者评价复发 率。已知手术完成时间各不相同,而未复 发患者的最后随访时间均为2006年1月1日。 限于篇幅,在下表中仅给出部分数据,以 说明此类资料的统计描述方法。
乙
2004-1-1 2004-7-1
合计
——
4.5
被观察者中发生的阳性 数 人时阳性率 K 所有个体尚处于阴性状 态的人时之和
定性资料的统计描述.
性别 频数(N) 百分比(%)
男
54
42.5
女
73
57.5
合计
127
100.00
绝对数
相对数
定性资料的统计描述
频数图 80
频数
70
60
50
40
30
20
10
0
男
女
图1 卫检班同学性别分布情况
频数表
表7 卫检班同学血型的分布情况
血型 频数(N) 百分比(%)
A型
33
26.00
B型
27
21.30
AB型
适用资料:连续型变量资料
纵轴:对数尺度;
横轴:算术尺度,连续性变量(时间、年龄 等)
表2-9 某地1975-1990年痢疾与百日咳死亡率
年度
痢疾
百日咳
1975
1.45
0.22
1980
0.82
0.05
1985
0.23
0.02
1990
0.14
0.01
1.6
死 1.4
痢疾:1.45-0.14=1.31
亡 1.2 率1
强度型指标
随访资料:如计算发病率,死亡率
发病 失访
观察开始时间
观察结束时间
相对比型指标(ratio)
指两个有关联的指标A与B之比 ,简称比。 A和B可以性质相同,也可以性质不同。 如性别比,师生比,变异系数,OR值,RR 值等。
比= A 100% B
相对数指标类型辨析
相对数指标类型辨析
图例:在图外要附图例说明。 多组比较:若要比较的事物不止一个时,
可以画几个平行的百分条图,以示比较。 各条图的排列顺序相同,图例相同。
医学统计学定性资料的统计描述
卡方检验在医学领域应用
疾病与基因型关联分析
01
通过比较不同基因型在疾病组和对照组中的分布差异,判断基
因型与疾病是否有关联。
临床试验效果评价
02
比较不同治疗方法在患者中的疗效差异,如药物疗效、手术效
果等。
医学影像学诊断准确性评估
03
通过比较影像学诊断结果与金标准诊断结果的一致性,评估影
像学诊断方法的准确性。
非数值性
定性资料不以数值形式表示,而是用 文字、符号等描述。
类别性
定性资料通常按照不同的类别或属性 进行分类。
主观性
定性资料的收集和分析往往涉及主观 判断和解释。
常见定性资料类型
分类资料
按照某种特征或属性将数据分成不同的组别,如性别、 血型等。
顺序资料
除了分类外,还具有一定程度的顺序或等级关系,如 病情严重程度、治疗效果评价等。
数分布表。
图表展示技巧与规范
选择合适的图表类型
根据数据的性质和特点,选择合适的图表类 型,如直方图、条形图等。
数据点标识
在图表中标识出重要的数据点,如最大值、 最小值、平均值等。
图表标题和坐标轴标签
为图表添加标题和坐标轴标签,以便读者理 解图表内容。
图例和颜色使用
使用图例说明不同数据系列的含义,并合理 运用颜色以增强图表的可读性。
整性。
02
Fisher确切概率法计算
根据研究目的和假设,选择合适的统计软件或编程语言实现Fisher确切
概率法的计算过程。
03
结果解读与报告
对计算结果进行解读和分析,将结果以图表或文字形式呈现,并结合专
业知识对结果进行解释和讨论。同时,需要注意结果的可靠性和可重复
医学统计人卫6版 第四章 定性数据的统计描述
.
一、定性数据的统计描述
➢定性数据的特点:将观察结果先按 分析要求,分类汇总观察单位数, 再用统计表列出。
➢常用相对比、构成比、率来描述计 数资料,这些指标统称为相对数。
.
二、常用相对数:
1.率(rate): 表示某现象发生的频率和强度, 常以百分率(%)、千分率(‰)、万分率 (/万)、十万分率(/10万)等表示。
合计 16709 715 0
90 12.59
53.86 4.28
.
五、应用相对数时应注意的问题
1.根据要说明的问题,选择合适的相对数,不能 以构成比代替率;
2.计算时分母不宜过小,分母过小时相对数不稳 定。在观察例数较少时,应直接用绝对数表示, 以免引起误解。
3.对观察单位数不等的几个率,பைடு நூலகம்能直接相加求 其平均率即合计率(总率)不等于各分率(组 率)之和。
➢ 基本思想:采用统一的标准(人口构成、年龄 构成等)以消除混杂因素的影响。
例题1.2
.
标准化率的计算:直接法
已知某一影响因素标准构成的每层例数Ni或 已知标准构成的构成比时,选用该法。 标准构成可选:
另选一有代表性、较稳定、数量较大的 构成为标准;
取各层合计为标准; 在各组中任选一组作为标准构成。 P30例4-5;例4-6
4.资料的对比应注意可比性: 1)“同质”事物比较相对数才有意义; 2)其它影响因素在各组的内部构成是否相同,
若不同,应先进行标准化后再作比较。 5.率或比的比较,亦应考虑存在抽样误差,对于
样本之间的差异应作显著性检验。
.
.
小结
发病率、死亡率、病死率 率的标准化
.
计算公式为: 比 A B
定性资料的统计描述
第五章 定性资料的统计描述在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这类资料称为定性资料,也称分类资料或计数资料。
如性别、HIV 感染情况、病情轻重等都属于分类资料。
对于这类资料,其绝对数往往不便于进行相互比较。
例如甲医院某年因某病死亡105人,同年乙医院因该病死亡185人。
但不能据此认为乙医院该病的死亡情况比甲医院严重,因为两医院因该病住院的人数不一定相等,此时需要采用相对数指标进行统计描述。
第一节 常用相对数及其应用相对数是两个有关联的数值之比,常用的相对数指标有率、构成比和相对比三种。
一、率率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
根据计算公式中分母的观察单位总数是否引入时间因素,率包括频率和速率两类指标。
频率(frequency)计算中,分母没有引入时间因素,无时间量纲,分子是分母的一部分,其取值在0~1之间,如常见的发病率、患病率、病死率、治愈率等指标,都属于频率型指标,其实质是比例,在流行病学中也常称为累积发生率。
其计算公式可表达为:K =⨯同时期实际发生某现象的观察单位数频率某时期可能发生某现象的观察单位总数(5.1) 式中,K 为比例基数,可以是100%、1000‰、100000/10万等。
比例基数的选择主要根据习惯用法或使计算结果保留1~2位整数,以便阅读。
例5.1 为研究吸烟与肺癌的关系,某医生收集了2003~2005年286例住院肺癌患者的吸烟史,吸烟的肺癌患者有166例,而同时期同年龄段的1855名非肺癌患者中,吸烟的有407例。
试计算该资料中肺癌患者与非肺癌患者的吸烟率。
由式(5.1),肺癌患者的吸烟率=166/286100%=58.04%⨯,非肺癌患者吸烟率=407/1855100%=21.94%⨯,肺癌患者的吸烟率比非肺癌患者的吸烟率高36.1%。
速率(rate)是带有时间因素的频率,根据数理统计的定义是指随时间变化而改变的速度,此处取其某现象在单位时间内的发生频率之意。
医学统计学4. 定性数据的统计描述
已知健康男童体重近似服从正态分布,某年某地 150名12岁健康男童体重的均数为35kg,标准差为 6kg,试估计
1)该地12岁健康男童体重在50kg以上者占该地12岁健康男 童总数的百分比;
2)该地12岁健康男童体重30-40公斤占该地12岁健康男童的 百分比;
3)该地80%的12岁健康男童集中在哪个范围;
应用相对数的注意事项
例如,某医师对口腔门诊不同年龄龋齿患病情况 (表5-3)进行了分析,得出40~49岁组患病率高, 0~9岁组和70岁及以上组患病率低的错误结论。
年龄组(岁)
0~ 10~ 20~ 30~ 40~ 50~ 60~ 70~ 合计
表 5-3 口腔门诊龋齿患者年龄构成
患者人数
患者构成比(%)
一、统计学指标
绝对数:反应实际水平 相对数----两个数值的比,包括: 率 构成比 相对比
(一)率
率:
说明某现象或某事物在它可能发生的范围内实际发 生的频率或强度,又称频率指标或强度指标。
常以百分率(%)、千分率(‰)、万分率(1/ 万)、十万分率(1/10万)等表示,计算公式为:
率
某时期内实际发生某现象的观察单位数 同时期可能发生某现象的观察单位总数
比例基数
需要注意的是,分母中所规定的平均人口是指可 能会发生该病的人群。
2.患病率: 也称现患率,表示某一时点某人群人口 中患某病的频率,通常用来表示病程较长的慢性
病的发生或流行情况,其计算公式为
某病患病率
某地某时点某病患病例数 该地同期内平均人口数
比例基数
以上比例基数可为100%、1000‰、10000/万、 100000/10万,实际中患病率的分母通常为调查 的总人数,分子为患病的人数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
第6章总体率的区间估计和假设检验
第 19 页
结果判断
• X2临界值:X20.05(1)=3.84, 请记住 : X2 0.01(1)=6.63, 本例 : X2=4.125> X20.05,1=3.84, 两组差别 有统计学意义。与前面的结论相同。
第6章总体率的区间估计和假设检验
第 20 页
四格表值的校正
第 21 页
例6.8 某医师用甲、乙两疗法治疗小儿单纯性消化不良, 治疗结果如表6-4,问两疗法的治愈率是否相等?
表6-4 甲、乙两疗法治疗小儿单纯性消化不良的治愈率比较
组 别 发病人数 26(28.8) 未发病人数 7(4.2) 合计 33
用药组
对照组
合 计
36(33.2)
62
2(4.8)
9
38
⒈粗死亡率、出生率、人口自然增长率、 婴儿死亡率、新生儿死亡率等人口学指标常 用的比例基数是1000‰。 2. 恶性肿瘤的死亡率、发病率、患病率 通用比例基数是100000/10万。 3. 生 存 率 、 病 死 率 通 用 的 比 例 基 数 是 100%。
第5章定性资料的统计描述
第3页
• 条件: • (1)任一格的1≤T<5,且n≥40时,需计算校正值。 • (2)任一格的T<1或n≤40时,用确切概率计算法。
基本公式
2
AT
0.5
2
T
2
专用公式
2
ad bc n 2 n
(a b)(c d )(a c)(b d )
第6章总体率的区间估计和假设检验
第5章定性资料的统计描述
第7页
第三节 率的标准化法
• 一、标准化法的意义和基本思想 • 率的标准化--不同时间或不同地区的几组 率比较时,为了消除资料在年龄、性别或其 它有关指标的构成的不同,而选用某一标准 人口构成加以校正,称为率的标准化。 • 不同地区,不同时间的两个或多个率直接进 行比较是不太合适的。会造成错误的结论。
发生某现象的观察单位 数 率 K 可能发生某现象的观察 单位总数
式中:K为比例基数,常以百分率(%)、千分率(‰)、 万分率(1/万)、十万分率(1/10万)表示,原则上使计 算结果至少保留1~2位整数。但在医学资料中某些指标的 比例基数是固定的。
第5章定性资料的统计描述
第2页
常见率的指标如下:
第5章定性资料的统计描述
第4页
率和构成比的区别(补充)
构成比 率
1.各部分可直接相加 2.各部分之和等于100%。 3.某部分变化,其它部分 随之变化。
各率不可直接相加。 总率不一定等于各率之 和。 某率的变化,不影响其它 各率。
第5章定性资料的统计描述
第5页
三、比(相对比)
• 比(ratio)又称相对比,是A、B两个有 关指标之比,说明 A 是 B 的若干倍或百分 之几,通常用倍数或分数表示。计算公 式为:
第6章总体率的区间估计和假设检验
第 16 页
X2检验的基本公式为
• 条件:n>40, T>=5
2
A T
T
2
• 理论频数T
TRC
n R nC n
第6章总体率的区间估计和假设检验
第 17 页
四格表检验专用公式
• 省去计算T值
n (a b)(c d )(a c)(b d )
第 23 页
二、配对四格表资料的检验
• 1。用于配对定性资料差异性的假设检验 。
若b+c>40,公式为:
2
b c
bc
2
2
若b+c≤40,需计算X2校正值
b c 1
bc
2
第6章总体率的区间估计和假设检验
第 24 页
三、行×列表的检验
• 行×列表(R×C表)的检验主要用于解决多个样本率或多 个样本构成比的比较以及有序分类资料的关联性检验。 •
第5章定性资料的统计描述
第8页
第六章
总体率的区间估计和假设检验
第一节 率的抽样误差与总体率的区间估计(1)
• 一。率的抽样误差:在同一总体中按一定的样本含量n抽样, 样本率和总体率或样本率之间也存在着差异,这种差异称 为率的抽样误差。 • 率的抽样误差的大小是用率的标准误来表示的。
p
(1 )
2 A 2 n 1 n n R C
式中n 为总例数,A 为每格子的实际频数,nR 、 nC 分别 为与某格子实际频数(A)同行、同列的合计数。
第6章总体率的区间估计和假设检验
第 25 页
A 比 B
(或× 100%)
第5章定性资料的统计描述
第6页
常用相对比指标
• 1.对比指标:指两个同类事物某种指标(绝 对数、两个率或其它同类指标)的比。 • 2.关系指标:指两个有关的、但非同类事物 的数量的比。 • 3.计划完成指标:说明计划完成的程度,常 用实际数达到计划数的百分之几或几倍表示。
二、构成比
• 构成比(proportion)又称构成指标,说明 某一事物内部各组成部分所占的比重或分布。 • 常用来表示疾病或死亡的顺位、位次或所占 比重。由于构成比之和为100%,一部分变化 会影响其它部分的也发生变化。
某一组成部分的观察单 位数 构成比 100% 同一事物各组成部分的 观察单位总数
第6章总体率的区间估计和假设检验
第 13 页
第三节
2 X 检验
• X2 检验 (chi - square test) 或称卡方检 验,是一种用途较广的假设检验方法, 常用于检验两个或多个样本率及构成比 之间有无差别,还用来检验配对定性资 料及两种属性或特征之间是否有关系等。
第6章总体率的区间估计和假设检验
n
Sp
p(1 p) n
第6章总体率的区间估计和假设检验
第9页
For example
• 例6.1 检查居民800人粪便中蛔虫阳性200 人,阳性率为25%,试求阳性率的标准误。 • 本例:n=800,p=0.25,1-p=0.75,
0.25 0.75 Sp 0.0153 1.53% 800
第6章总体率的区间估计和假设检验
第 10 页
第一节 率的抽样误差与总体率 的区间估计
• 二、总体率的区间估计 • ㈠正态分布法 • 样本含量n足够大, np与n(1-p)均≥5时 ,
p u S p
第6章总体率的区间估计和假设检验
第 11 页
For example
• 例 6.2 求例 6.1 当地居民粪便蛔虫阳性 率的95%可信区间和99%的可信区间。 • 95% 的 可 信 区 间 为 : 25%±1.96×1.53% 即(22.00%,28.00%) • 99%的可信区间为:25%±2.58×1.53% 即(21.05%,28.95%)
2
ad bc
2
第6章总体率的区间估计和假设检验
第 18 页
两种方法计算结果
2
14 20 86 80 30 24 90 96
4.125
14 90 86 30
2
220 4.125 100 120 44 176
第 14 页
一、四格表资料的检验
• 四格表资料的检验主要用于两个样本率 (或构成比)的假设检验,一般制成表 6-2的计算格式(以阳性和阴性为例)。
第6章总体率的区间估计和假设检验
第 15 页
表6-2
组 甲 别 组
四格表资料检验计算表
阳性数 阴性数 合计
a
b
a+b
乙
合
组
计
c
a+c
d
b+d
c+d
a+b+c+d=n
第五章
定性资料的统计描述
第一节
常用相对数
• 绝对数--调查或实验研究中清点定性 资料得到的实际数据被称为绝对数。 • 相对数:两个有联系指标之比。 • 医学上常用的相对数有率、构成比相对 比等统计指标。
第5章定性资料的统计描述
第1页
一、率
• 率(rate)又称频率指标,是某现象实际发生的观 察单位数与可能发生该现象的观察单位总数之比, 用以说明某现象发生的频率或强度。计算公式为:
第6章总体率的区间估计和假设检验
第 12 页
㈡ 查表法 当样本含量较小(如n≤50),np或n(1- p)<5时,样本率的分布呈二项分布,总体率 的可信区间可据二项分布的理论求得。 例 6.3 某医院用某药治疗脑动脉硬化症 22 例,其中显效者 10 例。问该药总显效率的 95%可信区间为多少? 本例n=22, X=10, 查附表7(201页),得此 两数相交处的数值为24~68,即该药总显效 率的95%可信区间为(24%,68%)。
71
第6章总体率的区间估计和假设检验
第 22 页
计算结果及判断
2
26 2 7 36 71 2 71
2
33 38 62 9
2.74
• 本例:X2=2.71< X2 0.05,1=3.84 • 本例若对X2值不校正,α=4.06,得P<0.05,结论正好 相反。
第6章总体率的区间估计和假设检验