医学统计学课后答案解析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章
1、答:在统计学中用来描述集中趋势得指标体系就是平均数,包括算术均数,几何均数,中位数。
均数反映了一组观察值得平均水平,适用于单峰对称或近似单峰对称分布资料得平均水平得描述。
几何均数:有些医学资料,如抗体得滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布得资料。
中位数与百分位数:
中位数(median)就就是将一组观察值按升序或降序排列,位次居中得数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置得描述,也适用于开口资料得描述。所谓“开口”资料,就是指数据得一端或者两端有不确定值。
百分位数(percentile)就是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %得观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数就是一个界值,也就是分布数列得一百等份分割值。显然,中位数即就是P 50分位数。即中位数就是一特定得百分位数。常用于制定偏态分布资料得正常值范围。
2、答:常用来描述数据离散程度得指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差与标准差最为常用。
极差(range,记为R ),又称全距,就是指一组数据中最大值与最小值之差。极差大,说明资料得离散程度大。用极差反映离散程度得大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等得最短、最长潜伏期等。其缺点就是:1、不灵敏; 2、不稳定。 四分位数间距(inter-quartile range)就就是上四分位数与下四分位数之差,即:Q =Q U
-Q L ,其间包含了全部观察值得一半。所以四分位数间距又可瞧成中间一半观察值得极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料得离散程度。
极差与四分位数间距均没有利用所研究资料得全部信息,因此仍然不足以完整地反映资料得离散程度。
方差(variance)与标准差(standard deviation)由于利用了所有得信息,而得到了广泛应用,常用于描述正态分布资料得离散程度。
变异系数(coefficient of variance,CV )亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊得两组或多组资料得离散程度。
3、答:常用得相对数指标有:比,构成比与率。
比(ratio),又称相对比,就是A 、B 两个有关指标之比,说明A 为B 得若干倍或百分之
几,它就是对比得最简单形式。其计算公式为
比=A /B 率(rate)又称频率指标,用以说明某现象发生得频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为:
)
比例基数(单位总数
可能发生某现象的观察单位数
实际发生某现象的观察率K ⨯=
构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占得比重或分布,常以百分数表示,其计算公式为:
100%=
⨯某一组成部分的观察单位数
构成比同一事物内各组成部分的观察单位总数
4、答:当比较两类事物得总率时,如果此两同类事物得内部构成,特别就是某项能影响指标水平得重要特征在构成上不同,往往会高估或低估总率。在这种情况下,直接进行两个总率得比较,会产生错误得结论。此时,必须首先设法消除这种内部构成上得差别,才能进行比较。统计学上将这种方法称为率得标准化(standardization method of rate),即采用统一得标准对内部构成不同得各组频率进行调整与对比得方法,调整后得率为标准化率,简称为标化率。 5
(1) 编制频数分布表并绘制频数分布图,简述这组数据得分布特征;
组段 频数 频率(%) ;累计频数(%)
组中值 108 3 2、5 2、5 109、5 111~ 10 8、33 10、83 112、5 114~ 22 18、33 29、17 115、5 117~ 38 31、67 60、83 118、5 120~ 20 16、67 77、5 121、5 123` 18 15 92、5 124、5 126~ 7 5、83 98、33 126、5 129~132 2 1、67 100 129、5 合计 120 100
(2) 计算中位数、均数、几何均数,用何者表示这组数据得集中位置好? 答:
()3109.510112.522115.538118.520121.518124.57126.52139.5/120
X ≈⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯
=119、4135 ()1lg lg3109.5lg10112.5lg 22115.5lg38118.5lg 20121.5lg18124.5lg7126.5lg 2139.5/120g X -≈⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯⎡⎤⎣⎦ =119、25125 116.63d M =
用均数较好、
(3) 计算极差、标准差,用何者表示这组数据得离散趋势好? 答:极差:22、62
四分位数间距:5、915 标准差:4、380736 用标准差表示较好、
6.答:本例频数分布为偏态分布,长尾拖向x 轴正方向,故为正偏态。适宜用中位数表示其平均水平,中位数为4,四分位数间距为4。
7、40名麻疹易感儿童接种麻疹疫苗后一个月,血凝抑制抗体滴度如下表。试计算平均滴度。
抗体滴度 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512 人数 1 5 6 2 7 10 4 5
几何均数:exp((ln(4)+5×ln(8)+16×ln(16)+2×ln(32)+7×ln(64)+10×ln(128)+4×ln(256)+5×ln(512))/40)
=128
8、答:此医生得分析就是不正确得,原因在于:
首先明确率得定义:)
比例基数(单位总数
可能发生某现象的观察单位数
实际发生某现象的观察率K ⨯=
发病率得分子为“某时期内发病人数”,而被观察对象某时期内可能发病多次,所以发病人数就是人次数;分母为“同时期平均人口数”,而按率得定义应为“同时期暴露总人数
该单位抽样检查2839名职工,其中高血压患者中,男性就是178例,女性就是49例,共227例,可以计算高血压患者占接受检查所有职工得构成比为7、995773%
至于40岁以上得患者占接受检查总人数得90、3%,也就是构成比;60岁以上者占接受检查总人数得10、2%也就是构成比,不能与发病率混为一谈。关于高血压与性别有关得结论也不妥。因为在接受检查人群中得男女内部构成比就是不同得,要进行比较首先要设法消除内部构成比得差异,即就就是率得标准化,然后比较。 第三章
1 正态分布与标准正态分布得区别:
正态分布就是一簇单峰分布得曲线,μ与σ可以有任意取值;标准正态分布就是一条单峰曲线,μ与σ有固定得值,μ=0,σ=1。 2 u = (x-μ)/σ= (μ-σ-μ)/σ= -1
查标准正态分布表,得Φ(-1)=0、1587,所以小于μ-σ者所占得比例为15、87%。
3 医学参考值范围得含义:就是根据正常人得数据估计绝大多数正常人某项指标所在得范围。选定同质得正常人作为研究对象。所谓正常人就是指不具有影响所测指标得因素或疾病得那类同质人群。
确定原则:①选定同质得正常人群作为研究对象 ②控制检测误差 ③判断就是否分组 ④单、双侧问题 ⑤选择百分界值 ⑥确定可疑范围
方法:①正态分布法:适用于服从正态分布或近似正态分布得资料 ②百分位数法:适用于不服从正态分布得资料 ③对数正态分布法:适用于对数正态分布得资料 4 如果资料服从正态分布,那么双侧95%正常值范围为μ±1、96σ;如果资料不服从正态分布,那么双侧95%正常值范围就不能用正态分布来做。
5 1人以下得概率:P(x≤1)=P(0)+P(1)=C 1000、200、810+C 1010、210、89 =0、375