3正态分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态分布及其应用
一、正态分布的概念
在医学卫生领域中,许多变量的取值 (频数分布)是中间(靠近均数处)较多,两边 较少,且左右对称。
这种变量的频数分布规律可用概率论 中的一种重要的随机变量分布——正态分布 (Normal distribution)加以描述。
25 20 15 10 5 0 109 113 117 121 125 129 133
0.4
0.35
0.3
0.25
0.2
0.150.10源自050 -4 -3 -2 -1 0 1 2 3 4
标准正态分布N(0, 1)
标准正态分布的密度函数为
u
2
(u )
1 2
e
2
0.4
0.35
D
u
1 2

e dx
u
2
0.3
0.25
0.2
0.15
0.1
0.05
u 标准正态分布曲线下从-∝到u之间的面积示意图
D
0.08
x
1 2

( x )
2

e

2
dx
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0 105 110 115 120 125 130 135 140
对于服从正态分布的变量,只要知道 与 , 就可用下式求得曲线下区间(x1, x2)范围的面积。
D

x2
1 2
10 8 6 4 2 0 105 109 113 117 121 125 129 133
107 109 111 113 115 117 119 121 123 125 127 129 131 133
7岁男童身高的频数曲线或频率曲线,略 呈钟型,中间高,两头低,左右对称,近似 数学上的正态分布。
若变量 x 的频率曲线对应于数学上的正 态分布曲线,则称该变量服从正态分布。
越小,分布越集中,曲线的形状越“瘦高”,
三、正态曲线下面积分布规律
无论 、 取什么值,正态曲线与横轴间的面积等于1。 正态分布是对称分布,其对称轴为直线 x =,左右两侧 曲线下面积相等,各占50%。 靠近均数处曲线下面积较集中,两边逐渐减少。在 范围内曲线下面积等于0.6827,在 1.64 范围内曲线下面 积为0.9090,在 1.96 范围内曲线下面积为0.9500,在 2.58 范围内曲线下面积为0.9900。 一个服从正态分布的变量,只要求得其均数与标准差, 就能全面掌握该变量的频数分布规律。
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0 90 100
不同, 相同
110
120
130
140
150
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0 90 100
相同, 不同
110
120
130
140
150
160
0.08
0.07
0.06
0.05
0.04
正态分布主要应用于
1. 估计频率分布 2. 制定医学参考值范围 3. 正态分布是许多统计方法的理论基础
制定医学参考值范围的基本步骤
确定一批样本含量足够大的“正常人”;
根据专业知识和实际用途确定单侧或双侧界值;
选定适当的百分界值如80%,90%,95%或和 99%,常用95%; 根据资料的分布特点,选用恰当的计算方法。

(x )
2
e

2
dx
x1
但对于不同的 与 , (x1, x2)范围内的面积
不同,即D不仅与(x1, x2)有关,还与、 有关。
四、标准正态分布
1. 标准化变换
u
x

若 x 服从正态分布 N (,) ,则 u 就服从均数为 0、标准差为1的正态分布,这种正态分布称为标准 正态分布或 u 分布,记为 N (0,1),u 称为标准正态 变量,这一变换也称为标准化变换。
五、正态分布的应用
医疗卫生工作中许多指标近似服从正态分布。如同性 别同年龄正常儿童的身高,实验中的随机误差等服从正态 分布。此外,还有许多指标虽不服从正态分布,但通过变 量转换后,能近似服从正态分布。例如,抗体滴度、处方 费用等,原本是偏态分布的,但经过对数转换后,近似正 态。这种原不服从正态分布,但经对数转换后服从正态分 布的指标,被称为服从对数正态分布。经过转换后能近似 正态分布的指标,也能借助正态分布理论作统计处理。
0.05
0 -4
(u2 ) (u1 ) 0.3557 0.1469 0.2088
-3
-2
-1
0
1
2
3
4
常用的三个区间
(-1.645, 1.645)区间面积占总面积(或总观察例数)的90%。 (-1.96, 1.96)区间面积占总面积(或总观察例数)的95%。 (-2.58, 2.58)区间面积占总面积(或总观察例数)的99%。
二、正态分布的两个参数
正态分布图形由正态分布的密度函数 f (x) 决定, 即以 f (x) 为纵轴,x 为横轴所决定的图形。其密度 函数为:
f (x)
1
(x )
2

2
e
2
2
两个不确定的常数 与 ,称为正态分布的两 个参数。 即正态总体的均数,描述了正态分布的 集中位置, 是正态总体的标准差,描述正态分布 的离散程度。若已知 与 ,即可据上式绘出正态 分布图形。
0.03
0.02
0.01
0 70 80 90 100 110 120 130 140 150 160
、 变化
越大,分布越离散,曲线的形状越“肥胖”。 不同的 和不同的 ,对应于不同的正态分布。通 常用记号 N (, )表示均数为 ,标准差为 的正
态分布。
0.6 0.5 0.4 0.3 0.2 0.1 0 0 2 4 6
0 -4 -3 -2 -1 0 1 2 3 4
统计学家制定了标准正态曲线下面积的分布表 注意表中面积指曲线下从-∞到u的面积。对于服从正 态分布的变量x,先进行标准化变换,然后借助标准 正态分布表可得到任意(x1, x2)范围内的面积或频数 比例。
0.4
0.35
0.3
0.25
0.2
0.15
0.1
相关文档
最新文档