医学统计学第七版课后答案及解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学统计学第七版部分课后答案及解析
第二章
1. 答:统计学中用来描述集中趋势的体系是平均数,包括算术均数,几何均数,中位数。

均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。

几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。

几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。

中位数和百分位数:
中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。

理论上数据集中有一半数比中位数小,另一半比中位数大。

中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。

所谓“开口”资料,是指数据的一端或者两端有不确定值。

百分位数(percentile )是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100- X)%观察值比P X大。

故百分位数是一个界值,也是分布数列的一百等份分割值。

显然,中位数即是P50 分位数。

即中位数是一特定的百分位数。

常用于制定偏态分布资料的正常值范围。

2. 答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变
异系数,尤以方差和标准差最为常用。

极差(range ,记为R),又称全距,是指一组数据中最大值与最小值之差。

极差大,说明资料的离散程度大。

用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。

其缺点是: 1. 不灵敏; 2. 不稳定。

四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q=Q U-Q L , 其间包含了全部观察值的一半。

所以四分位数间距又可看成中间一半观察值的极差。

其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。

常用于描述偏态分布资料的离散程度。

极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。

方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。

3. 答:常用的相对数指标有:比,构成比和率。

比(ratio ),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,它是对比的最简单形式。

其计算公式为比=A/B
率(rate)又称频率指标,用以说明某现象发生的频率或强度。

常以百分率(%)、千分率(‰)、万分率(1/ 万)、十万分率(1/10 万)等表示。

计算公式为:
率实际发生某现象的观察单位数
比例基数(K )
可能发生某现象的观察单位总数
构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重
或分布,常以百分数表示,其计算公式为:
某一组成部分的观察单位数
构成比
同一事物内各组成部分的观察单位总数
4. 答:当比较两类事物的总率时,如果此两同类事物的内部构成,特别是某项能影 响指标水
平的重要特征在构成上不同,往往会高估或低估总率。

在这种情况下,直 接进行两个总率的比较,会产生错误的结论。

此时,必须首先设法消除这种内部构 成上的差别, 才能进行比较。

统计学上将这种方法称为率的标准化 (standardization method of rate) ,即采用统一的标准对内部构成不同的各组频率进行调整和对比的 方法,调整后的率为标准化率,简称为标化率。

5
1) 编制频数分布表并绘制频数分布图,简述这组数据的分布特征;
组段
频数
频率 (%) ; 累计频 数(%) 组中值
108 3 2.5 2.5 109.5 111~ 10 8.33 10.83 112.5 114~ 22 18.33 29.17 115.5 117~ 38 31.67 60.83 118.5 120~ 20 16.67 77.5 121.5 123` 18 15 92.5 124.5 126~ 7 5.83 98.33 126.5 129~132
2 1.67
100
129.5
合计
120
100
(2) 计算中位数、均数、几何均数,用何者表示这组数据的集中位置好? 答:
X 3 109.5 10 112.5 22 115.5 38 118.5 20 121.5 18 124.5 7 126.5 2 139.5 /120
=119.4135
X g lg 1
lg3 109.5 lg10 112.5 lg22 115.5 lg38 118.5 lg20 121.5 lg18 124.5 lg7 126.5 lg2 139.5 /120 =119.25125
M d 116.63
用均数较好 .
(3) 计算极差、标准差,用何者表示这组数据的离散趋势好? 答: 极差: 22.62
100%
108.00 111.00 114.00 117.00 120.00 123.00 126.00 129.00 132.00 135.00
''height (cm)''
ycneuqer
四分位数间距: 5.915 标准差: 4.380736
用标准差表示较好.
6.答:本例频数分布为偏态分布,长尾拖向x 轴正方向,故为正偏态。

适宜用中位数表示其平均水平,中位数为4,四分位数间距为4。

7.40 名麻疹易感儿童接种麻疹疫苗后个月,血凝抑制抗体滴度如下试计算平
均滴度。

抗体滴度1:41:81:161:32 1:64 1:1281:256 1:512
人数156 2 7 10 4 5
几何均数
:exp((ln(4) +5×ln(8)+16 ×ln(16)+2×ln(32)+7×ln(64)+10 × ln(128)+4×ln(256)+5
×ln(512))/40)
=128
观察结果不会影响到其他观察单位的结果。

7 二项分布和正态分布之间的关系: 随着 n 的增大,二项分布逐渐逼近正态分布。

当 n π 较大时,二项分布 B(n, π) 近似正态分布。

举例:病人的治愈与不治愈,理化检验结果的阴性与阳性,个体的发病与不发病等属 于二项分布资料; 某地区 12 岁男孩的身高,某学校同年级女生的体重等属于正态分布。

第四章
1
标准差
标准误
不同:
意义上: 描述一组变量值的离散程 度
描述样本均数的离散称度
应用上:
1、标准差越小,说明变量
值围绕均值分布越紧密,均 数的代表性越好。

1、标准误越小,说明样本
均数和总体均数的差异越 小,用样本均数估计总体均
数的可靠性越大。

2、 x u s 估计变量值的分
布范围。

2、用 x t s x 估计总体均数 的
可信区间。

与 n 的关系: n 越大,标准差越稳定
n 越大,标准误越小
相同:
1、都是描述变异度的统计指标
2、 x x x 与 x 成正比,与 n 成反比;
3、n 一定时,同一组资料,标准差越大,标准误也越大。

2 α 水准是在假设检验之前确定的,说明按不超过多大的误差为条件作结论,是犯Ⅰ型 错误
的最大风险,是事前概率; P 值是指由 H 0所规定的总体作随机抽样,获得等于大于 现有样本获得的检验统计量值得概率。

标明以多大的误差拒绝 H 0,是事后概率。

3 ①配对设计的差值的总体均数的可信区间表达公
式: d t ,n 1s d

可以用可信区间回答假设检验的问题。

可信区间估计与假设检验时统计学中两种重 要的、独特的思维方式,它们在原理上相通,均基于抽样误差理论,只是考虑问题的角 度不同。

例如:样本均数与总体均数的比较,用可信区间的估计方法,观察由样本信息 估计的总体均数的可信区间是否包含已知的总体均数, 即可推断该样本是否来自已知均 数的总体; 用假设检验的方法, 先假设样本均数代表的总体均数等于某已知的总体均数, 再判断样本提供的信息是否支持这种假设。

拒绝实际上成立的 H 0,这类“弃真”的错误称为Ⅰ型错误或第一类错误;不拒绝
两均数差值的总体均数的可信区间表达公式:
x 1 x 2
n
1
n 2
n 1
n
2 2
1
n 1
1
n
2
实际上是不成立的H0,这类“存伪”的错误称为Ⅱ型错误或第二类错误。

第一类错误的概率用α 表示,第二类错误的概率用β 表示。

α 越大,β 越小;反之,α 越小,β 越大。

拒绝H0,只可能犯第一类错误,不可能犯第二类错误;不拒绝H0,只可能犯第二类
错误,不可能犯第一类错误。

由于假设检验中可能犯第一类错误或第二类错误,所以结论不能绝对化。

5 t 检验的应用条件:独立性、正态性、方差齐性。

u 检验的应用条件:适用于大样本资料。

t 检验和u 检验的关系:随自由度的增加,t 分布逐渐趋向于标准正态分布。

因此u 检验是t 检验的一种近似检验方法。

当自由度大于50 时,近似程度比较满意。

6 假设检验的意义就是分辨所研究的样本是否分别属于不同的总体,并对总体做出适当的结论。

假设检验应注意的问题:
①要有严密的抽样研究计划:要保证样本是从同质总体中随机抽取,除了对比的因素外,其
他影响结果的因素应一致。

②选用的假设检验方法应符合应用条件。

③结论不能绝对化。

④正确理解差别有无显著性的统计意义:差别有统计意义或有显著性,指我们有很大的把握
认为原假设不成立,并非是说它们有较大差别;差别无统计学意义或无显著性,我们只是认为以很大的把握拒绝原假设的理由还不够充分,并不意味着我们很相信它。

⑤统计学意义与其他专业上的意义不同。

7 H 0:矽肺患者的血红蛋白与健康人相同,即
H 1:矽肺患者的血红蛋白与健康人不同,即
α=0.05
=μ 0 μ≠μ 0
|12.59 14.02 |
1.63/ 10
2.7743
ν= 10 -1=9 ,t 0.05,9 =2.262<t ,p<0.05 ,拒绝H0,接受
认为矽肺患者的血红蛋白与健康人不同。

H1,差别有统计学意义,可以
8 H0:新药与常规药物的疗效没有差别,即μ 1=μ2
H 1:新药与常规药物的疗效不同,即μ1≠μ 2
α=0.05 t
1=
22
x1 x1
n1
n1 n2 2x 1 x=21.2823
22
x2x2n2 1 1
n1 n2
ν=n1+n2-2=20-2=18 ,t 0.05,18 =2.101<t ,p>0.05 ,不拒绝H0,差别无统计学意义,尚不能认为新药与常规药物的疗效不同。

1 不满足正态近似条件,所以采用直接计算概率法
x
H 0:加维生素 C 的治愈率与不加相同,即 π=π 0=0.6
H 1:加维生素 C 的治愈率高于不加维生素 C ,即 π>π 0 α=0.05
P(X ≤8)=1 - P(X ≥9)=1 -P(X=9)-P(X=10)=1-C 109*0.6 9*0.4 1-C 1010*0.6 10*0.4 0= 0.9536>0.05 不拒绝 H 0,差别无统计学意义,可以认为加维生素 C 的治愈率与不加相同。

2 满足正态近似条件,采用正态近似法。

H 0:经健康教育后的高血压患病率与以前相同,即 π=π 0=0.6 H 1:经健康教育后的高血压患病率比以前降低,即 π<π 0
单侧 α=0.05
u >u 0.05, 单侧 =1.64
p<0.05 ,拒绝 H 0 ,接受 H 1,差别有统计学意义,可以认为经健康教育后的高血压患病 率与以前有差别。

3①建立检验假设和确定检验水准
H 0:男女大学生 HBV 感染对其心理影响相同,即 π1 =π2 H 1:男女大学生 HBV 感染对其心理影响不同,即 π1≠π2 检验水准 α=0.05 ② 计算检验统计量
χ 2=( ad-bd )2*n/(a+b)(c+d)(a+c)(b+d) =(250*213-246*320)/(250+320)(246+213)(250+246)(320+213)=9.651
ν=1
③ 确定 p 值
查 χ 2届值表,得 p<0.05 ④ 统计推断
按 α =0.05 水准,拒绝 H O ,接受 H 1,差别有统计学意义,可以认为 HBV 感染对不同性 别的大学生在心理行为方面的影响不同。

4①建立检验假设和确定检验水准 H 0:两组的治愈率相等,即 π1 =π2 H 1:两组的治愈率不等,即 π1≠π2 检验水准 α=0.05 ②Fisher 精确概率法
P (i) = 0.280>0.05
③ 统计推断
按 α =0.05 水准,不拒绝 H 0,差别无统计学意义,尚不能认为两组治愈率有差别。

5①建立检验假设和确定检验水准
H 0:治疗三种类型病人的有效率相同,即 π1 =π2 =π3
H 1:治疗三种类型病人的有效率不等或不全相等。

检验水准 α=0.05
②计算检验统计量
p 0
1 0 /n
4.9453536
2
A i T i n T i
199*98 87*98 199*146 87*146 199*42 87*42
③确定 p 值
查 χ 2界值表,得 p>0.05 ④ 统计推断
按 α=0.05 水准,不拒绝 H 0,拒绝 H 1 ,差别无统计学意义,尚不能认为治疗三种类 型病人的有效率有差别。

6①建立检验假设和确定检验水准
H 0:该三种人群有相同的血型分布,即 π1 =π2 =π3 H 1:该三种人群的血型分布不等或不全相等。

检验水准 α=0.05
②计算检验统计量
2
A i T i 2 A 2
2 i i
n 1
i
T i
n R n C
2 2
= 9312* ( 6792
+134 2 + ⋯⋯
+ 4352
- 1
)= 71.180
3720*1883 788*1883 546*6522 ③ 确定 p 值
查 χ 2界值表,得 p<0.05 ④ 统计推断
按 α =0.05 水准,拒绝 H 0,接受 H 1,差别有统计学意义,可以认为三种人群的血型 分布不等或不全相等。

第八章
1 答:适用于有序分类资料、偏态分布资料、 变异较大或方差不齐的资料、分布型不 明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。

2 答:属于非参数检验。

因为参数检验针对的是总体变量服从某种分布,即具有某个已知的函数形式,而 其中的参数是未知的, 统计分析的目的就是对这些未知参数进行估计或检验。

但本题即 使 n 1 > 10, n 2- n 1 > 10 时采用的是 u 检验,但它比较的是分布而不是参数,所以它还是 属于非差数检验。

3 答:有序分类资料可做秩和检验、等级相关分析。

4 答:(一)建立检验假设 H 0:两种药的治疗效果总体分布相同;
H 1:两种药的治疗效果总体分布不同;
α= 0.05 ;
(二)编秩和求秩和 T
A 2 1
n
R n C
= 286* 712 + 27
2 +1042 + 42 2 + 24 2 +182 -1 )=3.6389
显效6235971-974930381715
有效18314998-14612221963782
无效51419147-1651567802184
加重347166-172169507676
合计n
1=88n2=8417265218357(三)计算检验统计量T
由于n1 > n 2 , 则取n2 组的
秩和为T,故检验统计量
T=T2=8357。

(四)确定P 值,做出推断结论
由于n2>10 ,T分布已接近均数为n1 (N+1)/2 ,方差为n1 n2 (N+1)/12 的正态分布,按书上式(8.3 )(8.4 )求出u c =3.7439
u c > 2.56, P<0.01, 按α=0.05 水准拒绝H0 ,接受H1,差异有统计学意义。

可以认为缓释片和普通片治疗心绞痛的疗效有差别。

5 答:(一)建立检验假设H0:治疗前后HCG值的总体分布相同;
H 1:治疗前后HCG值的总体分布不同;
α=0.05 ;
(二)计算检验统计量T
HCG
T +36 T -0
本例T+=36 ,T-=0,任取T+或(T-)作为检验统计量T,本例取T+=36 。

(三)确定P 值,做出推断结论
由于n<50 ,查附表9,T 界值表。

本例n=8,T=36,查附表9,得α=0.05 时的T界值为5-31,T在双侧界值范围外,故P<0.05 。

按α=0.05 水准拒绝H0,接受H1,差异有统计学意义。

可以认为肿瘤患者灌注治疗前后HCG值有差别。

6 答:(一)建立检验假设H0:三种卵巢功能异常患者血清中促黄体素的含量的总体分布相同;
H 1 三种卵巢功能异常患者血清中促黄体素的含量的总体分布不全相同或全不相同;
α=0.05 ;
(二)计算检验统计量T
卵巢功能异常患者血清中促黄体素的含量
8.5 H=15.4184
(三)确定P 值,做出推断结论
由于k=3, 每组例数n i =9 ,查附表11,H界值表得P<0.01。

按α=0.05 水准拒
绝H0 ,接受H1,差异有统计学意义。

可以认为三种卵巢功能异常患者血清中促黄体素的含量有差别。

7 答:(一)建立检验假设H0:针刺三个穴位的镇痛效果的总体分布相同;
H 1:针刺三个穴位的镇痛效果的总体分布不全相同或全不相同;
α=0.05 ;
(二)计算检验统计量T
按书上式(8.5 )求出H=2.4143
(三)确定P 值,做出推断结论
由于k=3, 每组例数n i>9 ,已超出附表11的范围,故按v=k-1=2,查附表8,χ2界值表,得P>0.05。

按α=0.05 水准不拒绝H0,差异无统计学意义。

故尚不能认为针刺不同穴位的镇痛效果有差别。

第三章
1 正态分布与标准正态分布的区别:
正态分布是一簇单峰分布的曲线,μ 和σ 可以有任意取值;标准正态分布是一条单峰曲线,μ 和σ 有固定的值,μ =0,σ =1。

2 u = (x- μ )/ σ = ( μ - σ - μ )/ σ = -1
查标准正态分布表,得Φ(-1)=0.1587 ,所以小于μ- σ 者所占的比例为15.87%。

3 医学参考值范围的含义:是根据正常人的数据估计绝大多数正常人某项指标所在的范围。

选定同质的正常人作为研究对象。

所谓正常人是指不具有影响所测指标的因素或疾病的那类同质人群。

确定原则:①选定同质的正常人群作为研究对象
②控制检测误差
③判断是否分组
④单、双侧问题
⑤选择百分界值
⑥确定可疑范围方法:①正态分布法:适用于服从正态分布或近似正态分布的资料
②百分位数法:适用于不服从正态分布的资料③对数正态分布法:适用于对数正态分布的资料
4 如果资料服从正态分布,那么双侧95%正常值范围为μ±1.96 σ;如果资料不服从正态分布,那么双侧95%正常值范围就不能用正态分布来做。

0 0 10 1 1 9
5 1 人以下的概率:P(x≤1)=P(0)+P(1)=C 1000.2 00.8 10+C10* 10.2 10.8 9 =0.375
8 人以上的概率:
P(X≥8)=P(8)+P(9)+P(10)=C 1080.2 80.8 2+C1090.2 90.8 1+C10100.2 10 40.8 0 =7.79 ×105 6 *
6 二项分布的应用条件:
①观察单位只能有互相对立的两种结果之一。

②已知发生某一结果的概率π 不变,其对立结果的概率则为1- π
③n 次试验在相同的条件下进行,且各观察单位的结果互相独立,即每个观察单位的。

相关文档
最新文档