第三讲 正态分布及其应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
曲线向左、右两边无限延伸时,以 x轴为渐近线,向它无限靠 µ 为正态曲线的位置参数 近.
0.6 0.5
曲线2 曲线1
0.4 0.3 0.2 0.1 0.0
0 1 2 3 4 5 6
曲线3
三条不同μ和σ的正态分布曲线
当σ相同时,正态分布曲线的位置由μ来决定.
σ为正态曲线的形态参数
③正态分布有两个参数,一个正态分布 可以表示为N(µ,σ2)
f=120×0.2088=25(人)
三、正态分布的应用
正态分布是一种重要的分布,它是许多统计处理 方法的基础。对于服从正态分布或近似正态分布或对 数正态分布的资料,都可以借助于正态分布的规律来 解决问题。其在医药卫生领域的应用有以下方面:
(一)估计频数分布
(二)制定医学参考值范围 (三)质量控制 (四)作为许多统计方法的基础
例题2.18:已知u1=-1.2,u2=1.6,
求标准正态曲线下(-1.2,1.6)范围内的面 积。
请同学们不看书,自己试做一下。 题目有什么不同,如何解决?
例题2.19:已知120名5岁女孩身高X=110.15, S=5.86,现欲估计该市城区某年身高界于 104.0~108.0cm范围内的5岁女孩所占比例和人 数。
例题2.17:已知u1=-1.76,u2=-0.25,
求标准正态曲线下(-1.76,-0.25)范围内 的面积。 解:查附表1,得; Φ(u1)=0.0392,同理,Φ(u2)=0.4013, 则(-1.76,-0.25)范围内的面积为 D= Φ(u2)-Φ(u1)=0.4013-0.0392=0.3621
正态分布及其应用
一、正态分布的概念和特征
(一)、正态分布的概念和图形
频
数
f(x)
5岁女孩身高的直方图
身高x(cm)
频 数 f(x)
5岁女孩身高的直方图
身高X(cm)
频数
组段 a b
频 数 f(x)
5岁女孩身高的频数分布曲线
身高x(cm)
f(X)
m
X
正态分布以均数为中心,左右两侧对称, 靠近均数两侧的频数较多,而距均数两侧较远
解:第一步,将该分布进行标准正态变换,以样本均数和 标准差代替总体均数和标准差,进行U变换。
U1=(104.0-110.15)/5.86 =-1.05 , U2=(108.0-110.15)/5.86 =-0.37
第二步,查附表1得: Ф (u1)=0.1469 ,Ф (u2)=0.3557
D=0.3557-0.1469=0.2088
2. 百分位数法 用于描述偏态分布资料 。
确定尿铅的95%参考值范围,因为尿铅以 过高为异常,应计算P95 白细胞数的95%参考值范围,因为白细胞数 无论过高或过低均属异常,则分别计算P2.5 和P97.5。这是双侧95%参考值范围;
处,频数逐渐减少,形成的钟形分布。
正态分布
正态分布是应用最 广泛的一种连续型分布. 德莫佛最早发现了二项概 率的一个近似公式,这一公式 被认为是正态分布的首次露面.
德莫佛
正态分布在十九世纪前叶由 高斯加以推广,所以通常称为高 斯分布.
高斯
正态分布(normal distribution)也 叫高斯分布(Gaussian distribution), 是最常见、最重要的一种连续型分布。 因为医学卫生领域中,有许多变量为连 续的随机变量,并呈现正态分布。如,身高 、体重,血压。
分析三条正态曲线的共同特征:
①均数处最高 (一个最高点) ②左右对称(一个对称轴x=µ )
观察以上三条正态曲线,归纳出正态曲线的性质
①曲线在 x轴的上方,与x轴不相交. 确定. 越大,曲线越“矮 当 m 一定时,曲线的形状由
越小,曲线越“瘦高”,表 胖”,表示总体的分布越分散; ②曲线关于直线 x m对称,且在 x m 时位于最高点. 示总 ③当时 x m ,曲线上升;当时 x m ,曲线下降.并且当 体的分布越集中.
例2.21 某地调查正常成年男子120人的第一秒肺 通气量,得均数= 4.2L, 标准差 s=0.7L ,试估 计该地成年男子第一秒肺通气量的 95%参考值 范围。 因肺第一秒通气量过低为异常,故按单侧 估计95%界值。 下限为:x – 1.64s=4.2-1.64 ×0.7 =3.05(L) 故该地成年男子第一秒肺通气量的95%参 考值范围为不低于3.05L
(二)、正态分布的特征
正态分布曲线的密度函数:
( X m )2 1 f (X ) exp , X 2 2 2 =3.14159, exp 是以2.72818为底的自然对数指数 X ~ N ( m , 2 ), m为X的总体均数,为总体标准差 f ( X )称为概率密度函数(probabilit y density function ) 以f ( X )为纵坐标,X为横坐标,绘制的曲线就是 正态曲线(normal curve )
1 X F(X ) e 2
( X m ) 2
dX
百度文库
正态曲线下面积
标准正态曲线下面积分布规律
正态曲线下面积分布规律
正态分布 μ±σ μ±1.96σ μ±2.58σ
面积或概率 68.27% 95.00% 99.00%
标准正态分布的意义
标准正态曲线下面积分布有规律,统计 学家将曲线下所有的U值对应的的面积全部计 算出来,并做成一个表,叫“标准正态分布 表”,供查用。见P261附表1。 借助于“标准正态分布表”,任何正态 分布都可以进行正态变换,计算出曲线任意 两个变量值之间的面积。
X us
如制定95%参考值范围,双侧界值 u=1.96,单侧界值u=1.645。 双侧界值:x1.96s 单侧上界:x+1.645s 单侧下界:x-1.645s
[ 例 2.21] 某地调查正常成年男子 200 人的红细胞 数近似正态分布,得均数= 5.526 ( 10 12 /L ) , 标准差s=0.38(1012/L),试估计该地成年男 子红细胞数的95%参考值范围。 因红细胞数过多或过少均为异常,故按双 侧估计95%界值。 下限为:x - 1.96s=5.526-1.96 ×0.38 =5.452 (1012/L) 上限为:x + 1.96s=5.526+1.96×0.38 =5.600(1012/L) 故该地成年男子红细胞数的95%参考值范围 (5.452—5.600)1012/L
(一)估计频数分布
例题2.20 某项研究显示,某地婴儿出生体重均数 为3100g,标准差为300g,试估计该地当年出生低体 重儿(≤2500g)所占比例。 解:已知婴儿出生体重服从正态分布。记做变 量X, 则当X ≤2500时,其对应于标准正态分布的u
值为:
u
X m
2500 3100 2.00 300
步骤: 1. 2. 3. 4. 5. 6.
异常
从“正常人”总体中抽样:明确研究总体 统一测定方法以控制系统误差。 判断是否需要分组(如性别、年龄)确定。 根据专业知识决定单侧还是双侧。 确定绝大多数的比例;最常用95% 选择适合的计算方法
正常
正常
异常
正常 异常
异常
单侧下限
单侧上限
双侧下限
双侧上限
1.正态分布法估计参考值范围公式为:
④正态曲线下面的面积分布有一定规律
二、标准正态分布
经标准正态变量u变换:一般正态分布 N ( m , )被变为 X m 标准正态分布 N (0,1); 即令u
2
u2 1 f (u ) exp , 2 2 X
f(X)
a
m
X
σ
标准正态分布 (standard normal distribution) 的两个参数为:μ=0,σ=1 记为 N(0,1)
一般正态分布为一个分布族:N(m,2) ;标准 正态分布只有一个 N(0,1) ;这样简化了便
于应用 。
曲线下面积
0.5
f(X)
0.4
-∞
u 0.3
0.2 0.1 0.0
(u )
2
4
1
u
e
u 2
2
du
-4
-3
-2
-1
0 X
1
2
3
附表1(P261) 就是根据此公式 和图形制定的
2 ( 2 )
查表得:Φ (-2.00)=0.0228=2.28%,即该地当 年低体重出生儿的比例为2.28%
(二)制订医学参考值范围
定义:指包括绝大多数正常人的人体形态、功能 和代谢等各种生理生化指标的波动范围,也可以 看作是常数,又称“正常值”
制订方法有两种: 1、正态分布法:适合正态或近似正 态分布的资料 2、百分位数法:适合偏态分布资料
0.6 0.5
曲线2 曲线1
0.4 0.3 0.2 0.1 0.0
0 1 2 3 4 5 6
曲线3
三条不同μ和σ的正态分布曲线
当σ相同时,正态分布曲线的位置由μ来决定.
σ为正态曲线的形态参数
③正态分布有两个参数,一个正态分布 可以表示为N(µ,σ2)
f=120×0.2088=25(人)
三、正态分布的应用
正态分布是一种重要的分布,它是许多统计处理 方法的基础。对于服从正态分布或近似正态分布或对 数正态分布的资料,都可以借助于正态分布的规律来 解决问题。其在医药卫生领域的应用有以下方面:
(一)估计频数分布
(二)制定医学参考值范围 (三)质量控制 (四)作为许多统计方法的基础
例题2.18:已知u1=-1.2,u2=1.6,
求标准正态曲线下(-1.2,1.6)范围内的面 积。
请同学们不看书,自己试做一下。 题目有什么不同,如何解决?
例题2.19:已知120名5岁女孩身高X=110.15, S=5.86,现欲估计该市城区某年身高界于 104.0~108.0cm范围内的5岁女孩所占比例和人 数。
例题2.17:已知u1=-1.76,u2=-0.25,
求标准正态曲线下(-1.76,-0.25)范围内 的面积。 解:查附表1,得; Φ(u1)=0.0392,同理,Φ(u2)=0.4013, 则(-1.76,-0.25)范围内的面积为 D= Φ(u2)-Φ(u1)=0.4013-0.0392=0.3621
正态分布及其应用
一、正态分布的概念和特征
(一)、正态分布的概念和图形
频
数
f(x)
5岁女孩身高的直方图
身高x(cm)
频 数 f(x)
5岁女孩身高的直方图
身高X(cm)
频数
组段 a b
频 数 f(x)
5岁女孩身高的频数分布曲线
身高x(cm)
f(X)
m
X
正态分布以均数为中心,左右两侧对称, 靠近均数两侧的频数较多,而距均数两侧较远
解:第一步,将该分布进行标准正态变换,以样本均数和 标准差代替总体均数和标准差,进行U变换。
U1=(104.0-110.15)/5.86 =-1.05 , U2=(108.0-110.15)/5.86 =-0.37
第二步,查附表1得: Ф (u1)=0.1469 ,Ф (u2)=0.3557
D=0.3557-0.1469=0.2088
2. 百分位数法 用于描述偏态分布资料 。
确定尿铅的95%参考值范围,因为尿铅以 过高为异常,应计算P95 白细胞数的95%参考值范围,因为白细胞数 无论过高或过低均属异常,则分别计算P2.5 和P97.5。这是双侧95%参考值范围;
处,频数逐渐减少,形成的钟形分布。
正态分布
正态分布是应用最 广泛的一种连续型分布. 德莫佛最早发现了二项概 率的一个近似公式,这一公式 被认为是正态分布的首次露面.
德莫佛
正态分布在十九世纪前叶由 高斯加以推广,所以通常称为高 斯分布.
高斯
正态分布(normal distribution)也 叫高斯分布(Gaussian distribution), 是最常见、最重要的一种连续型分布。 因为医学卫生领域中,有许多变量为连 续的随机变量,并呈现正态分布。如,身高 、体重,血压。
分析三条正态曲线的共同特征:
①均数处最高 (一个最高点) ②左右对称(一个对称轴x=µ )
观察以上三条正态曲线,归纳出正态曲线的性质
①曲线在 x轴的上方,与x轴不相交. 确定. 越大,曲线越“矮 当 m 一定时,曲线的形状由
越小,曲线越“瘦高”,表 胖”,表示总体的分布越分散; ②曲线关于直线 x m对称,且在 x m 时位于最高点. 示总 ③当时 x m ,曲线上升;当时 x m ,曲线下降.并且当 体的分布越集中.
例2.21 某地调查正常成年男子120人的第一秒肺 通气量,得均数= 4.2L, 标准差 s=0.7L ,试估 计该地成年男子第一秒肺通气量的 95%参考值 范围。 因肺第一秒通气量过低为异常,故按单侧 估计95%界值。 下限为:x – 1.64s=4.2-1.64 ×0.7 =3.05(L) 故该地成年男子第一秒肺通气量的95%参 考值范围为不低于3.05L
(二)、正态分布的特征
正态分布曲线的密度函数:
( X m )2 1 f (X ) exp , X 2 2 2 =3.14159, exp 是以2.72818为底的自然对数指数 X ~ N ( m , 2 ), m为X的总体均数,为总体标准差 f ( X )称为概率密度函数(probabilit y density function ) 以f ( X )为纵坐标,X为横坐标,绘制的曲线就是 正态曲线(normal curve )
1 X F(X ) e 2
( X m ) 2
dX
百度文库
正态曲线下面积
标准正态曲线下面积分布规律
正态曲线下面积分布规律
正态分布 μ±σ μ±1.96σ μ±2.58σ
面积或概率 68.27% 95.00% 99.00%
标准正态分布的意义
标准正态曲线下面积分布有规律,统计 学家将曲线下所有的U值对应的的面积全部计 算出来,并做成一个表,叫“标准正态分布 表”,供查用。见P261附表1。 借助于“标准正态分布表”,任何正态 分布都可以进行正态变换,计算出曲线任意 两个变量值之间的面积。
X us
如制定95%参考值范围,双侧界值 u=1.96,单侧界值u=1.645。 双侧界值:x1.96s 单侧上界:x+1.645s 单侧下界:x-1.645s
[ 例 2.21] 某地调查正常成年男子 200 人的红细胞 数近似正态分布,得均数= 5.526 ( 10 12 /L ) , 标准差s=0.38(1012/L),试估计该地成年男 子红细胞数的95%参考值范围。 因红细胞数过多或过少均为异常,故按双 侧估计95%界值。 下限为:x - 1.96s=5.526-1.96 ×0.38 =5.452 (1012/L) 上限为:x + 1.96s=5.526+1.96×0.38 =5.600(1012/L) 故该地成年男子红细胞数的95%参考值范围 (5.452—5.600)1012/L
(一)估计频数分布
例题2.20 某项研究显示,某地婴儿出生体重均数 为3100g,标准差为300g,试估计该地当年出生低体 重儿(≤2500g)所占比例。 解:已知婴儿出生体重服从正态分布。记做变 量X, 则当X ≤2500时,其对应于标准正态分布的u
值为:
u
X m
2500 3100 2.00 300
步骤: 1. 2. 3. 4. 5. 6.
异常
从“正常人”总体中抽样:明确研究总体 统一测定方法以控制系统误差。 判断是否需要分组(如性别、年龄)确定。 根据专业知识决定单侧还是双侧。 确定绝大多数的比例;最常用95% 选择适合的计算方法
正常
正常
异常
正常 异常
异常
单侧下限
单侧上限
双侧下限
双侧上限
1.正态分布法估计参考值范围公式为:
④正态曲线下面的面积分布有一定规律
二、标准正态分布
经标准正态变量u变换:一般正态分布 N ( m , )被变为 X m 标准正态分布 N (0,1); 即令u
2
u2 1 f (u ) exp , 2 2 X
f(X)
a
m
X
σ
标准正态分布 (standard normal distribution) 的两个参数为:μ=0,σ=1 记为 N(0,1)
一般正态分布为一个分布族:N(m,2) ;标准 正态分布只有一个 N(0,1) ;这样简化了便
于应用 。
曲线下面积
0.5
f(X)
0.4
-∞
u 0.3
0.2 0.1 0.0
(u )
2
4
1
u
e
u 2
2
du
-4
-3
-2
-1
0 X
1
2
3
附表1(P261) 就是根据此公式 和图形制定的
2 ( 2 )
查表得:Φ (-2.00)=0.0228=2.28%,即该地当 年低体重出生儿的比例为2.28%
(二)制订医学参考值范围
定义:指包括绝大多数正常人的人体形态、功能 和代谢等各种生理生化指标的波动范围,也可以 看作是常数,又称“正常值”
制订方法有两种: 1、正态分布法:适合正态或近似正 态分布的资料 2、百分位数法:适合偏态分布资料