人群健康研究的统计学方法(四)考试答案和讲义

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

人群健康研究的统计学方法（四）
1、率表示（）
A、某现象发生的频率或强度
B、事物内部各组成部分所占的比重或分布情况
C、两个有联系指标之比
D、某事物内部各组成部分出现的频率
2、以下关于率的抽样误差代表意义描述错误的是（）
A、率的抽样误差越小，说明率的标准误越小
B、率的抽样误差越小，用样本推论总体时，可信程度越低
C、率的抽样误差越小，用样本推论总体时，可信程度越高
D、率的抽样误差越大，说明率的标准误越大
3、相对比=A/B，说明（）
A、A为B的若干倍或百分之几
B、A、B两个指标只可以为绝对数
C、性质肯定相同
D、肯定是定性资料
4、以下关于应用相对数时的描述正确的是（）
A、分析时可以以构成比代替率
B、观察单位数不等的几个率的平均率，不能将这几个率直接相加求其均值
C、所比较资料的内部构成不一定相同
D、样本率或构成比的比较不必进行假设检验
5、（）在表的左侧，表明被研究事物的主要特征，相当于句子的主语
A、备注
B、标题
C、纵标目
D、横标目
人群健康研究的统计学方法（四）
北京大学公共卫生学院刘爱萍
一、分类变量资料的统计分析
（一）分类变量资料的统计描述
1 ．相对数常用的指标及其意义
相对数主要涵盖：率、构成比和相对比。

率是表示某现象发生的频率或强度，常用百分率、千分率、万分率或十万分率等表示。

它的计算公式是：（实际发生某现象的观察单位数 / 可能发生该现象的观察单位总数）×比例基数。

构成比是说明事物内部各组成部分所占的比重或分布情况，用百分数表示。

构成比 = （事物内部某一组成部分的观察单位数 / 同一事物各组成部分的观察单位总数）× 100% 。

构成比的特点有 : 它的值在 0 和 1 之间变动。

当某一部分构成比发生变化时，其他部分的构成比也相应地发生变化。

相对比是指两个有联系指标之比（ A/B ），常以百分数或者倍数表示。

它说明 A 是 B 的若干倍或百分之几，指标可以是绝对数，也可以是相对数，性质可以相同，也可以不同，可以是定性资料，也可以是定量资料。

如性别比、变异系数均属于相对比的指标。

应用相对数时的注意事项有，首先：计算相对数的分母不宜过小。

第二，分析时不能以构成比代替率。

构成比只是说明事物内部的组成或者分布，率是说明强度或者频率。

第三，观察单位数不等的几个率的平均率，不能将几个率直接相加求其均值。

应该将各率的分子和分子分别相加、分母和分母分别相加后，再求总率即平均率。

第四，相互比较时，应该注意可比性。

所比较资料的内部构成要相同，如果内部构成不相同，不能够直接进行总率的比较，只能分性别、分年龄别、分地区等进行率的比较或进行率的标准化后再作对比较。

第五，样本率或构成比的比较应该进行假设检验。

（二）分类变量资料的统计推断
1 ．率的标准误的意义及其计算
从同一总体中随机抽取 N 个观察单位的一组样本，计算得到各个样本率 P i 不一定都与总体率π完全相同，这种由于抽样而引起的样本率与总体率之间的差别称为率的抽样误
差。

率的抽样误差可用率的标准误表示，它的公式为。

总体率往往未知，用样本率作为对总体率的估计值 , 率的抽样误差的估计值
为：。

率的抽样误差越小，说明率的标准误越小，用样本推断总体的可信程度越高。

2 ．总体率可信区间的估计
样本率的分布如果近似服从正态分布：样本的例数足够大，样本率 p 或者 (1-P) 都不太小时， np 、 n(1-p) 均大于 5 ，可以认为它服从正态分布或近似正态分布。

总体率π的 95% 的可信区间为（ p ± 1.96s p ）。

3. 率的 u 检验
(1) 样本率与总体率的比较
推断样本所代表的总体均数与已知总体均数是否相同，或者是推断样本是否来自已知总体。

如果资料为近似正态分布，可以用 u 检验，它的检验公式
为。

例：根据大量观察，旧药治疗某病的治愈率为 70% ，今随机抽取该病患者 200 人，用新药治疗，治愈 160 人。

问：新、旧药物治愈率是否不同？
首先建立检验假设 ,H 0 : 新药与旧药治愈率相同，π = π 0 ； H 1 ：新药与旧药治愈率不同，π≠π 0 。

α等于 0.05 。

第二步，计算统计量。

样本含量较大，可以用 u 检
验，，大于 1.96 的界值，故按α =0.05 水准，拒绝 H 0 ，接受 H 1 ，差异有统计学意义，可以认为新、旧药物治愈率不同，新药的治愈率更高。

（ 2 ）两个样本率比较的 u 检验
如果是大样本，可用 u 检验，公式为 u=(p 1 -p 2 )/s p1-p2 ，小样本用 T 检验。

4 ． X 2 检验
X 2 检验的用途有：它可以用于两个及多个样本率或构成比的比较。

第二、两分类变量间相关关系的分析。

X 2 检验的基本思想：假设比较样本所对应的总体率相同，样本来自同一总体。

假设 H 0 成立，计算统计量 X 2 值，根据 X 2 值的大小，并结合自由度，确定概率，然后对总体
做出推断。

它的基本公式是， A 是实际频数， T 是理论频数。

（ 1 ）四格表 X 2 检验
例：某中药在改变剂型前曾在临床观察了 152 例，治愈 129 例。

改变剂型后临床观察130 例，治愈 101 例，能否得出新剂型疗效与旧剂型不同的结论。

可将资料整理成四格表形式（ PPT35 ），红色部分数据为基本数据，其余数据为派生数据。

四格表资料它比较的是两种处理的效果，每种处理只产生两种相互对立的结果，如生和死，有效、无效，阴性、阳性等。

首先建立假设， H 0 ：π 1 = π 2 ，新旧两种剂型的疗效不同；备择假设 H 1 ：π1 ≠π 2 ，新旧两种剂型的疗效不同。

检验水准α =0.05 。

第二步，计算统计量 X 2 值。

计算在 H 0 成立的条件下，两样本率的差异是由于抽样误差造成，来自同一个总体。

可以用合计的治愈率作为总体治愈率的点估计，本例为
230/282=81.6% 。

先计算 H 0 成立条件下的理论频数， T RC =n r n c /n ， T RC 为第 R 行 C 列的理论频数， n R 为相应的行合计， n c 为相应的列合计。

旧剂型治愈的理论值 T 11 =152 × 81.6%=124 ；旧剂型治愈的理论值 T 12 =152-124=28 ；新剂型组治愈的理论值 T 21 =130 × 81.6%=106.1 ；新剂型未治愈的理论值 =130-106.1=23.9 。

计算，自由度 V= （行数 -1 ）×（列数 -1 ）。

第三步，确定概率值并做出统计推断。

查 X ２界值表， X 2 =2.428 ＜ X ２ 0.05 （ 1 ） =3.84 ， P 值＞ 0.05 。

按α =0.05 水准，不拒绝 H 0 ，差异无统计学意义，认为两种剂型的疗效相同。

四格表的专用公式为 X ２ = （ ad-bc ） 2 n / (a+b) (c+d) (a+c) (b+d), 应用条件为 n ≥ 40 且 T ≥ 5 。

如果 n ≥ 40 且 1 ≤ T ＜ 5 ，可以用校正公式 X ２ = （︳ad-bc ︳ -n/2 ） 2 n /(a+b)(c+d)(a+c)(b+d) 。

如果 n ＜ 40 或 T ＜ 1 ，可用 Fisher 精确概率法。

（ 2 ）行×列表的 X 2 检验
行×列表的 X 2 检验可以进行多个率、多个构成比之间差别的假设检验。

H 0 ：假设的是 k ， H 1 为 k 个总体率不等或不全相等。

如果 P ＜ 0.05 ，按 0.05 的水准拒绝 H 0 ，接受 H 1 ，只能认为 k 个总体率有差别，但具体还须进行两两比较。

二、统计表和统计图
（一）统计表的基本结构和要求
统计表的结构有：标题、标目、线条、数字、备注，分简单表和复合表两种。

标题是简明扼要说明表的中心内容，必要时应该注明研究事物现象发生的时间、地点。

标题一般写在表的正上方。

标目有横标目和纵标目。

横标目列在表的左侧，表示被研究事物的主要特征，相当于句子的主语。

纵标目—般列在表的右上端，说明横标目内容的各项统计指标，相当于句子中的谓语。

横、纵标目连贯起来能读成一句比较完整而通顺的话。

统计表一般是三条线：顶线、底线和隔开纵标目与数字的横线，无竖线、斜线，必要时用细横线将合计隔开。

数字一律阿拉伯数字表示，同一指标的小数位数、单位和精度应该一致，上下位次应该对齐。

第二，表内不应该有空格、数据暂缺或未记录，未记录用“…”表示，无数据用“ - ”表示。

备注在表的下方打“＊”，说明表的内容。

统计表的结构具体说明见 PPT60 。

（二）统计图形的选择和制图通则
制图通则：第一，标题。

概括图的内容应简明确切，一般置于图域的下方，标题前应标注序号。

第二，统计图。

有横轴和纵轴为坐标的图形，作图一般在第一象限，两轴的交点为起点，纵轴的左侧和横轴的下方分别放置纵标目和横标目，并指明纵、横轴表示的指标与单位，图域的长宽比例一般为 5:7 。

如考核某学校随着年龄变化情况，学生的近视情况，横标目要标明年龄，纵标目是近视率。

第三，同一个图内比较不同的事物比较几个不同的事物时，要用不同的图案或者是颜色表示并附图例，图例放在图内或者是图形的下方。

图形的选择：进行统计描述后，不仅要列出统计表，还要用图表示，不同的资料应该选择不同的图形。

第一，如果资料是连续性，目的是用线段的升降表示事物动态变化的趋势，应选择普通线图。

第二个，资料是连续性的，但目的是用线段的升降表达事物动态变化的速度，要选择半对数线图。

普通线图只能看趋势，半对数线图可以看速度的变化。

第三，数值变量的频数表资料，目的是用直方的面积表达各组段的频数或频率分布情况，应选择直方图。

第四，资料是相互独立的，目的是用直条的长短比较数值的大小，选择直条图。

第五，事物内部各部分的百分构成比资料，目的是用面积的大小表示各部分所占比重的大小，选择圆图或者是百分条图。

第六，双变量连续性资料，目的是用点的密集程度和趋势表达两变量的相互关系，用散点图。