数值变量资料的统计描述(精)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 数值变量资料的统计描述 (Measures of Dispersion)
例3.1 对甲乙两名高血压患者连续观察5天,测得 的收缩压(mmHg)结果如下:
患者 甲患者 乙患者
第1天 第2天 第3天 第4天 第5天 162 145 178 142 186 164 160 163 159 166
5
特点:直观 , 易理解;但由于用了绝对值,不便于 数学处理,实际中很少使用。
(二)离均差平方和(Sum of Square,SS)
为了克服平均偏差的缺点,可以不通过取绝 对值,而是通过取平方来避免正负抵消,即使用 离均差平方和,其计算公式为
SS
(X

X )2

X2

( X )2
n
SS 通常作为一个中间统计量使用。
10.7
CV舒张压

100% 77.5
13.8%
CV收缩压

17.1 100% 122.9
13.9%
第二节 正态分布及应用
一、正态分布(Normal Distribution)
f (X) 1.2 1
0.8
f (X) 1.2 1
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0 3.8 4.2 4.6 5.0 5.4 5.8 X
符号R 表示。如前例甲乙两患者收缩压的极差分别为
R甲 186 142 44(mmHg)
R乙 166 159 7 (mmHg)
该法简单明了、容易使用,如用于说明传染病、食 物中毒等的最短、最长潜伏期等;缺点是结果不稳 定。
(二)四分位数间距 (Quartile)
Q P75 P25
同理乙患者: S 2.88(mmHg)
(五)变异系数(Coefficient of Variation )
CV S 100% X
主要用于对均数相差较大或单位不同的几组观 察值的变异程度进行比较。
例3.3 测得某地成年人舒张压均数为77.5mmHg, 标准差为10.7mmHg;收缩压均数为122.9mmHg,标准 差为17.1mmHg。试比较舒张压和收缩压的变异程度。
如由上一章例2.4 算出,50岁~60岁正常女性血清
甘油三脂含量的百分位数P75和P25的位置分别为63.2
mg/dl和135.7 mg/dl,则
Q 135.7 63.2 72.5(mg/dl)
四分位数间距主要用于衡量明显偏态分布资料的 变异程度。
二、平均差距指标 (一)平均偏差(Mean Difference)
通常指正常人的解剖、生理、生化、免疫及组 织代谢产物的含量等各种数据的波动范围。主要目 的:用于临床疾病诊断。最常用的是95%参考值范Baidu Nhomakorabea。
确定95%参考值范围示意图
二、医学参考值范围的制定方法
(一)选择一定数量的参照样本
选择参照样本必须要考虑可能影响所要制定参 考值范围指标的各种疾病及干扰因素,将这些人排 除在外。例如在制定血清谷-丙转氨酶活性正常值 时,选取正常人的条件为肝、肾、心、脑、肌肉等 无器质性疾患,近期无特殊用药史等。同时可能需 要考虑性别、年龄、民族、地理位置等因素。样本 含量一般要较大,如n>120。
X
正态分布有两个参数: 和 , 分别表示均数和标准差。
主要特征:
1.以 为中心的对称分布
2.钟型曲线
-5 2-.548 -3 1.96-2 -1 0 1 2 1.936 4 2.585
68.3% 95.0% 99.0%
3.曲线下面积分布有规律 4.两个参数决定位置和变异
均数 X
162.6 162.4
可以看出:两患者收缩压的均数十分接近,但甲患 者的血压波动较大,而乙患者相对稳定。通常,描 述一组观察值,除需要表示其平均水平外,还要说 明它的离散或变异的情况。
第一节 衡量变异程度的指标
一、间距指标 (一)极差(Range)
也称作全距,即观察值中最大值和最小值之差,用
平均偏差 X X
n
如对于例3.1:
甲患者: 平均偏差 162 162.6 145 162.6 186 162.6 15.52(mmHg )
5
乙患者: 平均偏差 164 162.4 160 162.4 166 162.4 2.32(mmHg)
对任何参数的正态分布,都可以通过一个简单的 变量变换 u X 化成 0和 1 的标准正态分布。

通常,可以利用标准正态分布表求出与原始变量X 有
关的概率值。
图3-5 标准正态分布及曲线下面积
参见书中计算实例……
第三节 医学参考值范围
(Reference Value Range) 一、基本概念
将方差取平方根,还原成与原始观察值单位 相同的变异量度即为标准差:
S (X X )2 X 2 ( X )2 n
n 1
n 1
例如对于例3.1经计算有
甲患者: X 813 X 2 133713
n5
S 133713 8132 / 5 19.49(mmHg) 5 1
(三)方差 (Variance)
方差是将离均差平方和再取平均,即
S 2
(X X )2
n 1
注意:对于样本资料,分母用的是n-1,称 为自由度(degree of freedom,df )。
方差的特点:便于数学上的处理,但由于 有平方,度量衡发生变化,不便于实际应用。
(四)标准差 (Standard Deviation)
0 3.8 4.2 4.6
f (X )1.2
1
0.8
0.6
0.4
0.2
5 5.4 5.8 X
0 3.6 4 4.4 4.8 5.2 5.6 6 X
图3-1 某地成年男子红细胞数的分布逐渐接近正态分布示意图
f (X ) ( fi / n) / Xi
f (X)
1
e
(
X 2 2
)
2
2
图3-2 正态分布曲线下的面积
1 2
3
-4 -3 -2 -1 01 1 22 3 43 5 6 7
1 2 3
图3-3 三种不同均值的正态分布
-5 -4 -3 -2 -1 0 1 2 3 4 5
1 2 3 图3-4 三种不同标准差的正态分布
二、标准正态分布 (Standard Normal Distribution)
相关文档
最新文档