人群健康研究的统计学方法(四)考试答案和讲义

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人群健康研究的统计学方法(四)
1、率表示()
A、某现象发生的频率或强度
B、事物内部各组成部分所占的比重或分布情况
C、两个有联系指标之比
D、某事物内部各组成部分出现的频率
2、以下关于率的抽样误差代表意义描述错误的是()
A、率的抽样误差越小,说明率的标准误越小
B、率的抽样误差越小,用样本推论总体时,可信程度越低
C、率的抽样误差越小,用样本推论总体时,可信程度越高
D、率的抽样误差越大,说明率的标准误越大
3、相对比=A/B,说明()
A、A为B的若干倍或百分之几
B、A、B两个指标只可以为绝对数
C、性质肯定相同
D、肯定是定性资料
4、以下关于应用相对数时的描述正确的是()
A、分析时可以以构成比代替率
B、观察单位数不等的几个率的平均率,不能将这几个率直接相加求其均值
C、所比较资料的内部构成不一定相同
D、样本率或构成比的比较不必进行假设检验
5、()在表的左侧,表明被研究事物的主要特征,相当于句子的主语
A、备注
B、标题
C、纵标目
D、横标目
人群健康研究的统计学方法(四)
北京大学公共卫生学院刘爱萍
一、分类变量资料的统计分析
(一)分类变量资料的统计描述
1 .相对数常用的指标及其意义
相对数主要涵盖:率、构成比和相对比。

率是表示某现象发生的频率或强度,常用百分率、千分率、万分率或十万分率等表示。

它的计算公式是:(实际发生某现象的观察单位数 / 可能发生该现象的观察单位总数)×比例基数。

构成比是说明事物内部各组成部分所占的比重或分布情况,用百分数表示。

构成比 = (事物内部某一组成部分的观察单位数 / 同一事物各组成部分的观察单位总数)× 100% 。

构成比的特点有 : 它的值在 0 和 1 之间变动。

当某一部分构成比发生变化时,其他部分的构成比也相应地发生变化。

相对比是指两个有联系指标之比( A/B ),常以百分数或者倍数表示。

它说明 A 是 B 的若干倍或百分之几,指标可以是绝对数,也可以是相对数,性质可以相同,也可以不同,可以是定性资料,也可以是定量资料。

如性别比、变异系数均属于相对比的指标。

应用相对数时的注意事项有,首先:计算相对数的分母不宜过小。

第二,分析时不能以构成比代替率。

构成比只是说明事物内部的组成或者分布,率是说明强度或者频率。

第三,观察单位数不等的几个率的平均率,不能将几个率直接相加求其均值。

应该将各率的分子和分子分别相加、分母和分母分别相加后,再求总率即平均率。

第四,相互比较时,应该注意可比性。

所比较资料的内部构成要相同,如果内部构成不相同,不能够直接进行总率的比较,只能分性别、分年龄别、分地区等进行率的比较或进行率的标准化后再作对比较。

第五,样本率或构成比的比较应该进行假设检验。

(二)分类变量资料的统计推断
1 .率的标准误的意义及其计算
从同一总体中随机抽取 N 个观察单位的一组样本,计算得到各个样本率 P i 不一定都与总体率π完全相同,这种由于抽样而引起的样本率与总体率之间的差别称为率的抽样误
差。

率的抽样误差可用率的标准误表示,它的公式为。

总体率往往未知,用样本率作为对总体率的估计值 , 率的抽样误差的估计值
为:。

率的抽样误差越小,说明率的标准误越小,用样本推断总体的可信程度越高。

2 .总体率可信区间的估计
样本率的分布如果近似服从正态分布:样本的例数足够大,样本率 p 或者 (1-P) 都不太小时, np 、 n(1-p) 均大于 5 ,可以认为它服从正态分布或近似正态分布。

总体率π的 95% 的可信区间为( p ± 1.96s p )。

3. 率的 u 检验
(1) 样本率与总体率的比较
推断样本所代表的总体均数与已知总体均数是否相同,或者是推断样本是否来自已知总体。

如果资料为近似正态分布,可以用 u 检验,它的检验公式
为。

例:根据大量观察,旧药治疗某病的治愈率为 70% ,今随机抽取该病患者 200 人,用新药治疗,治愈 160 人。

问:新、旧药物治愈率是否不同?
首先建立检验假设 ,H 0 : 新药与旧药治愈率相同,π = π 0 ; H 1 :新药与旧药治愈率不同,π≠π 0 。

α等于 0.05 。

第二步,计算统计量。

样本含量较大,可以用 u 检
验,,大于 1.96 的界值,故按α =0.05 水准,拒绝 H 0 ,接受 H 1 ,差异有统计学意义,可以认为新、旧药物治愈率不同,新药的治愈率更高。

( 2 )两个样本率比较的 u 检验
如果是大样本,可用 u 检验,公式为 u=(p 1 -p 2 )/s p1-p2 ,小样本用 T 检验。

4 . X 2 检验
X 2 检验的用途有:它可以用于两个及多个样本率或构成比的比较。

第二、两分类变量间相关关系的分析。

X 2 检验的基本思想:假设比较样本所对应的总体率相同,样本来自同一总体。

假设 H 0 成立,计算统计量 X 2 值,根据 X 2 值的大小,并结合自由度,确定概率,然后对总体
做出推断。

它的基本公式是, A 是实际频数, T 是理论频数。

( 1 )四格表 X 2 检验
例:某中药在改变剂型前曾在临床观察了 152 例,治愈 129 例。

改变剂型后临床观察130 例,治愈 101 例,能否得出新剂型疗效与旧剂型不同的结论。

可将资料整理成四格表形式( PPT35 ),红色部分数据为基本数据,其余数据为派生数据。

四格表资料它比较的是两种处理的效果,每种处理只产生两种相互对立的结果,如生和死,有效、无效,阴性、阳性等。

首先建立假设, H 0 :π 1 = π 2 ,新旧两种剂型的疗效不同;备择假设 H 1 :π1 ≠π 2 ,新旧两种剂型的疗效不同。

检验水准α =0.05 。

第二步,计算统计量 X 2 值。

计算在 H 0 成立的条件下,两样本率的差异是由于抽样误差造成,来自同一个总体。

可以用合计的治愈率作为总体治愈率的点估计,本例为
230/282=81.6% 。

先计算 H 0 成立条件下的理论频数, T RC =n r n c /n , T RC 为第 R 行 C 列的理论频数, n R 为相应的行合计, n c 为相应的列合计。

旧剂型治愈的理论值 T 11 =152 × 81.6%=124 ;旧剂型治愈的理论值 T 12 =152-124=28 ;新剂型组治愈的理论值 T 21 =130 × 81.6%=106.1 ;新剂型未治愈的理论值 =130-106.1=23.9 。

计算,自由度 V= (行数 -1 )×(列数 -1 )。

第三步,确定概率值并做出统计推断。

查 X 2界值表, X 2 =2.428 < X 2 0.05 ( 1 ) =3.84 , P 值> 0.05 。

按α =0.05 水准,不拒绝 H 0 ,差异无统计学意义,认为两种剂型的疗效相同。

四格表的专用公式为 X 2 = ( ad-bc ) 2 n / (a+b) (c+d) (a+c) (b+d), 应用条件为 n ≥ 40 且 T ≥ 5 。

如果 n ≥ 40 且 1 ≤ T < 5 ,可以用校正公式 X 2 = (︳ad-bc ︳ -n/2 ) 2 n /(a+b)(c+d)(a+c)(b+d) 。

如果 n < 40 或 T < 1 ,可用 Fisher 精确概率法。

( 2 )行×列表的 X 2 检验
行×列表的 X 2 检验可以进行多个率、多个构成比之间差别的假设检验。

H 0 :假设的是 k , H 1 为 k 个总体率不等或不全相等。

如果 P < 0.05 ,按 0.05 的水准拒绝 H 0 ,接受 H 1 ,只能认为 k 个总体率有差别,但具体还须进行两两比较。

二、统计表和统计图
(一)统计表的基本结构和要求
统计表的结构有:标题、标目、线条、数字、备注,分简单表和复合表两种。

标题是简明扼要说明表的中心内容,必要时应该注明研究事物现象发生的时间、地点。

标题一般写在表的正上方。

标目有横标目和纵标目。

横标目列在表的左侧,表示被研究事物的主要特征,相当于句子的主语。

纵标目—般列在表的右上端,说明横标目内容的各项统计指标,相当于句子中的谓语。

横、纵标目连贯起来能读成一句比较完整而通顺的话。

统计表一般是三条线:顶线、底线和隔开纵标目与数字的横线,无竖线、斜线,必要时用细横线将合计隔开。

数字一律阿拉伯数字表示,同一指标的小数位数、单位和精度应该一致,上下位次应该对齐。

第二,表内不应该有空格、数据暂缺或未记录,未记录用“…”表示,无数据用“ - ”表示。

备注在表的下方打“*”,说明表的内容。

统计表的结构具体说明见 PPT60 。

(二)统计图形的选择和制图通则
制图通则:第一,标题。

概括图的内容应简明确切,一般置于图域的下方,标题前应标注序号。

第二,统计图。

有横轴和纵轴为坐标的图形,作图一般在第一象限,两轴的交点为起点,纵轴的左侧和横轴的下方分别放置纵标目和横标目,并指明纵、横轴表示的指标与单位,图域的长宽比例一般为 5:7 。

如考核某学校随着年龄变化情况,学生的近视情况,横标目要标明年龄,纵标目是近视率。

第三,同一个图内比较不同的事物比较几个不同的事物时,要用不同的图案或者是颜色表示并附图例,图例放在图内或者是图形的下方。

图形的选择:进行统计描述后,不仅要列出统计表,还要用图表示,不同的资料应该选择不同的图形。

第一,如果资料是连续性,目的是用线段的升降表示事物动态变化的趋势,应选择普通线图。

第二个,资料是连续性的,但目的是用线段的升降表达事物动态变化的速度,要选择半对数线图。

普通线图只能看趋势,半对数线图可以看速度的变化。

第三,数值变量的频数表资料,目的是用直方的面积表达各组段的频数或频率分布情况,应选择直方图。

第四,资料是相互独立的,目的是用直条的长短比较数值的大小,选择直条图。

第五,事物内部各部分的百分构成比资料,目的是用面积的大小表示各部分所占比重的大小,选择圆图或者是百分条图。

第六,双变量连续性资料,目的是用点的密集程度和趋势表达两变量的相互关系,用散点图。

相关文档
最新文档