正态分布1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态分布概率密度曲线与横轴围成的区域的总面积恒等于 1。
正态分布概率密度曲线下横轴上一定区间的面积可应用数 学知识求出。
在实际应用中,由于所有正态分布都可以通过变量变换转 变为标准正态分,为了省去积分计算不同正态分布曲线下 横轴上一定区间面积的繁琐过程,所以数理统计学家专门 编制了标准正态分布曲线下横轴上一定区间面积分布表, 供查表求标准正态分布曲线下一定区间面积。
正态分布的应用
估计医学正常值范围。 医学正常值范围又称医学参考值范围,医学正常值范 围是指包括绝大多数正常人的各种生理及生化指标 的范围。 一般常用 95%或 99%的医学参考值范围。 某指标的 95%或 99%的医学参考值范围只包括 95%或 99%的正常人该指标的变量值分布范围,还有 5%或 1% 的正常人该指标的变量值不在此范围内。所以,在诊 断时参考值范围只能起“参考”作用,不在此范围并 不一定异常(患病),在此范围内也不一定正常(不 患病)。
正态分布曲线及其面积分布: 在正态曲线下,μ ±1σ 、μ ±1.96σ 和μ ±2.58σ 所对应的面积分别为 0.6827、0.9500 和 0.9900。
图一:
图二: 图三:
图四:
当有一随机变量X服从正态分布N(μ,σ2),若要求某
一区间(x1,x2)的曲线与横轴围成的面积时,无须运 用积分学知识求从x1移到x2所对应区域的面积大小来得 到这一区间所对应的面积。此时,我们可以通过变量 变换,把X转变成u,即把一般的正态分布变换为标准 正态分布,通过求标准正态分布区间(u1,u2)所对应的面 积来间接求得一般正态分布区间(x1,x2)所对应的面 积。
制定医学参考值范围时,应从正常人群中抽样,且样本含量应 较大(n>100),根据资料的分布类型采用正态分布法或百分位 数法。 正态分布法: 适用于资料服从正态分布或近似正态分布时。 公式;
双侧 1-α 参考值范围: X U 2 S
单侧 1-α 参考值范围: X U S或 X U S
u2
x2 s
x
155 144.29 5.41
1.98
PX x2 155 PU u2 PU u2 1.98 1 1.98 1 0.97615 0.02385
该地 13 岁正常女孩身高在 135 厘米以下者占正常女孩总人数的 4.272%,身高 在 155 厘米以上者占正常女孩总人数的 2.385%。
正态分布
正态分布的概念
正态分布的通俗概念: 如果把数值变量资料编 制频数表后绘制频数分布图(又称直方图,它用 矩形面积表示数值变量资料的频数分布,每条直 条的宽表示组距,直条的面积表示频数(或频率) 大小,直条与直条之间不留空隙。),若频数分 布呈现中间为最多,左右两侧基本对称,越靠近 中间频数越多,离中间越远,频数越少,形成一 个中间频数多,两侧频数逐渐减少且基本对称的 分布,那我们一般认为该数值变量服从或近似服 从数学上的正态分布。
正态分布的特征及其面积规律
正态分
布曲线
max
位于横
轴上方,
呈钟形。
正态分 布曲线 f(x) 以均数 所在处 最高, 且以均 数为中 心左右
对称。
0
µ
正态分布曲线由两个参数决定,即总体均数μ和总体标准差σ。在σ不变的 情况下,函数曲线形状不变,若μ变大时,曲线位置向右移;若变小时, 曲线位置向左移,故称μ为位置参数。在μ不变的情况下,函数曲线位置 不变,若σ变大时,曲线形状变的越来越“胖”和“矮”;若σ变小时, 曲线形状变的越来越“瘦”和“高”,故称σ为形态参数或变异度参数。
式中σ 为总体标准差;μ 为总体均数;π
为圆周率,即3.14159···;e为自然对数的底,
即2.71828···。
若某一随机变量的概率密度函数(频率曲线方程) 为上式,则称该变量X服从参数为μ和σ的正态分布, 记为:X~N(μ,σ2)。
函数方程中μ为位置参数,σ为形状参数。
在σ不变的情况下,函数曲线形状不变,若μ变大 时,曲线位置向右移;若μ变小时,曲线位置向左 移。
例题参见教科书。
百分位数法: 适用于资料服从偏态分布时。 公式:
双侧 1-α 参考值范围:P100 2 ~P1001 2
单侧 1-α 参考值范围:> P100 或< P1001
例题参见教科书。
若u=-1.96,那么Ф(-1.96)则表示从-∞移到-1.96所对应区域的
面积,通过查标准正态分布曲线面积分布表得到Ф(-1.96)=0.025。
u
uU界指值单,侧
也称随机 变量U的 上侧α 分 位数。其 意义为: 从到+∞这 一侧的面 积为α ,也 即在随机 变量U的所 有取值中, 有100α 的 值比大, 有100(1α )的值 比小。
14 12 10
8 6 4 2 0
身高(cm)
某地13岁女孩118人身高(cm)频数分布图
正态分布图四
身高(cm)
频数分布逐渐接近正态分布示意图
正态分布的数理统计学概念:
如果随机变量(X)的概率密度函数为:
f x
1
x 2
e 2 2
-∞<x<+∞
2
则该随机变量服从正态分布。
u/2
U 2 指 双 侧
U 界值,也称 U 的双侧α 分位数。 其意义为:从
U 2 到+∞这 一
侧的面积为α /2,
从-U 2 到-∞这
一侧的面积也为 α /2,两侧面积之 和为α 。即在随机 变量 U 的所有取 值中,有 100α 的
值比 U 大,有
100(1-α )的值
比 U 小。
标准正态分布
标准正态分布曲线下对称于0的区间,面积相等,各占50%,即 左右各为0.5。
标准正态分布曲线的纵坐标与面积关系图
即纵坐标从-∞移到u所对应区域的面积为上图红色区域面积的 大小,这样一个区域的面积我们用Ф(u)表示,可通过查标准正
态分布曲线面积分布表得到Ф(u)的大小。
u值查表所对应的面积是区间(-∞,u)所对应的面积,即Ф(u)。
当随机变量的参数μ和σ未知时,若来自该总体的样本 含量n很大时,可分别用样本均数和样本标准差作为μ 和σ的估计值来计算u值。
其基本步骤如下:
已知 X~N(μ ,σ 2), 求随机变量 X 出现在 区间(x1,x2)的概率
即求服从一般正态分 布 N(μ ,σ 2)的随机 变量 X 在区间(x1,x2) 所对应的面积
我们把U或Z称为标准正态变量。
标准正态分布是正态分布中的一个典型分布,数理统
计上证明:对一服从正态分布的随机变量(X),若
进行特定的变量变换,可将任何一服从正态分布的随
机变量(X)转变成服从标准正态分布的随机变量
(U或Z),这种变量变换过程称为变量的标准化,
也称为U或Z变换。
U
X
式中符号意义如前述。
进行标准化变换:
U x
求服从标准正态分布 N (0,1)的随机变量 U 在区间(u1,u2)所对 应的面积。
通过查标准正态分布 面积分布表,分别求 Ф (u2) 、Ф (u1)的 大 小。
Ф (u2) -Ф (u1)即 为 该随机变量 U 在区间 ( u1,u2 ) 所 对 应的 面 积。
144~
25
145.5
147~
20
148.5
150~
9
151.5
153~
3
154wenku.baidu.com5
156~
2
157.5
159~162
1
160.5
合计
118
—
频数分布图一(又称直方图)
30
20
从频数表及频数分布图上可得 知:
该数值变量资料频数分 布呈现中间频数多,左右两侧 基本对称的分布。所以我们通
俗地认为该资料服从正态分布。
Ф (u2) -Ф (u1)即 为 该随机变量 U 在区间 ( u1,u2 ) 所 对 应的 面 积。
随机变量 U 在区间 (u1,u2)所对应的面积 即为随机变量 X 在区 间(x1,x2)所对应的面 积
举例 说明 通 过正 态分 布 求随 机 变量的 频数分布范围。
例:某地 13 岁女孩 118 人的身高(cm) 资料,估计该地 13 岁正常女孩身高在 135 厘米以下及 155 厘米以上者各占正常女孩 总人数的百分比。
N(μ1 ,σ2)、N(μ2 ,σ2)
N(μ,0.52)、N(μ,12)、N(μ,22)
max
σ =0.5
f(x)
f(x)
σ =1 σ =2
0
0
µ1
µ2
µ
正态曲线下面积分布有一定的规律性。
对于服从正态分布的随机变量(X),随机变量值出现在 某在一该区区间间(所围x1,成x2)的的区概域率的与面正积态大分小布相概对率应密(度相曲等线)与。横轴
频数
10
0 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5 154.5 157.5 160.5
身高(cm)
某地13岁女孩118人身高(cm)频数分布图
频数
频数分布图二
20
10
0
身高(cm)
某地13岁女孩118人身高(cm)频数分布图
频数
频数分布图三
在μ不变的情况下,函数曲线位置不变,若σ变大 时,曲线形状变的越来越“胖”和“矮”;若σ变 小时,曲线形状变的越来越“瘦”和“高”。
若某一随机变量X,其总体均数μ=0,总体标准差σ=1, 即X~N(0,1),则称变量X服从标准正态分布。习惯 把服从标准正态分布的变量用字母U或Z表示,此时,
下面我们以第一节某地13岁女孩118人的身高(cm)资料,来说明身高变量服从 正态分布。
频数分布表:
某地 13 岁女孩 118 人的身高(cm)资料频数分布
身高组段
频数
组中值
(1)
(2)
(3)
129~
2
130.5
132~
2
133.5
135~
8
136.5
138~
20
139.5
141~
26
142.5
身高(X)~N(μ ,σ 2),但μ 和σ 未 知,只知来自该总体的样本的身高均数
x =144.29(cm)和标准差 s=5.41(cmx),由
于样本含量 n=118 很大,所以可以用 和 s 估计μ 和σ 来计算 u 值。
身高(X)小于 135(cm)的概率为: PX x1 135 PU u1
u1
x1 s
x
135 144.29 5.41
1.72
PX x1 135 PU u1 PU u1 1.72 1.72 0.04272
身高(X)大于 155(cm)的概率为: PX x2 155 PU u2
正态分布概率密度曲线下横轴上一定区间的面积可应用数 学知识求出。
在实际应用中,由于所有正态分布都可以通过变量变换转 变为标准正态分,为了省去积分计算不同正态分布曲线下 横轴上一定区间面积的繁琐过程,所以数理统计学家专门 编制了标准正态分布曲线下横轴上一定区间面积分布表, 供查表求标准正态分布曲线下一定区间面积。
正态分布的应用
估计医学正常值范围。 医学正常值范围又称医学参考值范围,医学正常值范 围是指包括绝大多数正常人的各种生理及生化指标 的范围。 一般常用 95%或 99%的医学参考值范围。 某指标的 95%或 99%的医学参考值范围只包括 95%或 99%的正常人该指标的变量值分布范围,还有 5%或 1% 的正常人该指标的变量值不在此范围内。所以,在诊 断时参考值范围只能起“参考”作用,不在此范围并 不一定异常(患病),在此范围内也不一定正常(不 患病)。
正态分布曲线及其面积分布: 在正态曲线下,μ ±1σ 、μ ±1.96σ 和μ ±2.58σ 所对应的面积分别为 0.6827、0.9500 和 0.9900。
图一:
图二: 图三:
图四:
当有一随机变量X服从正态分布N(μ,σ2),若要求某
一区间(x1,x2)的曲线与横轴围成的面积时,无须运 用积分学知识求从x1移到x2所对应区域的面积大小来得 到这一区间所对应的面积。此时,我们可以通过变量 变换,把X转变成u,即把一般的正态分布变换为标准 正态分布,通过求标准正态分布区间(u1,u2)所对应的面 积来间接求得一般正态分布区间(x1,x2)所对应的面 积。
制定医学参考值范围时,应从正常人群中抽样,且样本含量应 较大(n>100),根据资料的分布类型采用正态分布法或百分位 数法。 正态分布法: 适用于资料服从正态分布或近似正态分布时。 公式;
双侧 1-α 参考值范围: X U 2 S
单侧 1-α 参考值范围: X U S或 X U S
u2
x2 s
x
155 144.29 5.41
1.98
PX x2 155 PU u2 PU u2 1.98 1 1.98 1 0.97615 0.02385
该地 13 岁正常女孩身高在 135 厘米以下者占正常女孩总人数的 4.272%,身高 在 155 厘米以上者占正常女孩总人数的 2.385%。
正态分布
正态分布的概念
正态分布的通俗概念: 如果把数值变量资料编 制频数表后绘制频数分布图(又称直方图,它用 矩形面积表示数值变量资料的频数分布,每条直 条的宽表示组距,直条的面积表示频数(或频率) 大小,直条与直条之间不留空隙。),若频数分 布呈现中间为最多,左右两侧基本对称,越靠近 中间频数越多,离中间越远,频数越少,形成一 个中间频数多,两侧频数逐渐减少且基本对称的 分布,那我们一般认为该数值变量服从或近似服 从数学上的正态分布。
正态分布的特征及其面积规律
正态分
布曲线
max
位于横
轴上方,
呈钟形。
正态分 布曲线 f(x) 以均数 所在处 最高, 且以均 数为中 心左右
对称。
0
µ
正态分布曲线由两个参数决定,即总体均数μ和总体标准差σ。在σ不变的 情况下,函数曲线形状不变,若μ变大时,曲线位置向右移;若变小时, 曲线位置向左移,故称μ为位置参数。在μ不变的情况下,函数曲线位置 不变,若σ变大时,曲线形状变的越来越“胖”和“矮”;若σ变小时, 曲线形状变的越来越“瘦”和“高”,故称σ为形态参数或变异度参数。
式中σ 为总体标准差;μ 为总体均数;π
为圆周率,即3.14159···;e为自然对数的底,
即2.71828···。
若某一随机变量的概率密度函数(频率曲线方程) 为上式,则称该变量X服从参数为μ和σ的正态分布, 记为:X~N(μ,σ2)。
函数方程中μ为位置参数,σ为形状参数。
在σ不变的情况下,函数曲线形状不变,若μ变大 时,曲线位置向右移;若μ变小时,曲线位置向左 移。
例题参见教科书。
百分位数法: 适用于资料服从偏态分布时。 公式:
双侧 1-α 参考值范围:P100 2 ~P1001 2
单侧 1-α 参考值范围:> P100 或< P1001
例题参见教科书。
若u=-1.96,那么Ф(-1.96)则表示从-∞移到-1.96所对应区域的
面积,通过查标准正态分布曲线面积分布表得到Ф(-1.96)=0.025。
u
uU界指值单,侧
也称随机 变量U的 上侧α 分 位数。其 意义为: 从到+∞这 一侧的面 积为α ,也 即在随机 变量U的所 有取值中, 有100α 的 值比大, 有100(1α )的值 比小。
14 12 10
8 6 4 2 0
身高(cm)
某地13岁女孩118人身高(cm)频数分布图
正态分布图四
身高(cm)
频数分布逐渐接近正态分布示意图
正态分布的数理统计学概念:
如果随机变量(X)的概率密度函数为:
f x
1
x 2
e 2 2
-∞<x<+∞
2
则该随机变量服从正态分布。
u/2
U 2 指 双 侧
U 界值,也称 U 的双侧α 分位数。 其意义为:从
U 2 到+∞这 一
侧的面积为α /2,
从-U 2 到-∞这
一侧的面积也为 α /2,两侧面积之 和为α 。即在随机 变量 U 的所有取 值中,有 100α 的
值比 U 大,有
100(1-α )的值
比 U 小。
标准正态分布
标准正态分布曲线下对称于0的区间,面积相等,各占50%,即 左右各为0.5。
标准正态分布曲线的纵坐标与面积关系图
即纵坐标从-∞移到u所对应区域的面积为上图红色区域面积的 大小,这样一个区域的面积我们用Ф(u)表示,可通过查标准正
态分布曲线面积分布表得到Ф(u)的大小。
u值查表所对应的面积是区间(-∞,u)所对应的面积,即Ф(u)。
当随机变量的参数μ和σ未知时,若来自该总体的样本 含量n很大时,可分别用样本均数和样本标准差作为μ 和σ的估计值来计算u值。
其基本步骤如下:
已知 X~N(μ ,σ 2), 求随机变量 X 出现在 区间(x1,x2)的概率
即求服从一般正态分 布 N(μ ,σ 2)的随机 变量 X 在区间(x1,x2) 所对应的面积
我们把U或Z称为标准正态变量。
标准正态分布是正态分布中的一个典型分布,数理统
计上证明:对一服从正态分布的随机变量(X),若
进行特定的变量变换,可将任何一服从正态分布的随
机变量(X)转变成服从标准正态分布的随机变量
(U或Z),这种变量变换过程称为变量的标准化,
也称为U或Z变换。
U
X
式中符号意义如前述。
进行标准化变换:
U x
求服从标准正态分布 N (0,1)的随机变量 U 在区间(u1,u2)所对 应的面积。
通过查标准正态分布 面积分布表,分别求 Ф (u2) 、Ф (u1)的 大 小。
Ф (u2) -Ф (u1)即 为 该随机变量 U 在区间 ( u1,u2 ) 所 对 应的 面 积。
144~
25
145.5
147~
20
148.5
150~
9
151.5
153~
3
154wenku.baidu.com5
156~
2
157.5
159~162
1
160.5
合计
118
—
频数分布图一(又称直方图)
30
20
从频数表及频数分布图上可得 知:
该数值变量资料频数分 布呈现中间频数多,左右两侧 基本对称的分布。所以我们通
俗地认为该资料服从正态分布。
Ф (u2) -Ф (u1)即 为 该随机变量 U 在区间 ( u1,u2 ) 所 对 应的 面 积。
随机变量 U 在区间 (u1,u2)所对应的面积 即为随机变量 X 在区 间(x1,x2)所对应的面 积
举例 说明 通 过正 态分 布 求随 机 变量的 频数分布范围。
例:某地 13 岁女孩 118 人的身高(cm) 资料,估计该地 13 岁正常女孩身高在 135 厘米以下及 155 厘米以上者各占正常女孩 总人数的百分比。
N(μ1 ,σ2)、N(μ2 ,σ2)
N(μ,0.52)、N(μ,12)、N(μ,22)
max
σ =0.5
f(x)
f(x)
σ =1 σ =2
0
0
µ1
µ2
µ
正态曲线下面积分布有一定的规律性。
对于服从正态分布的随机变量(X),随机变量值出现在 某在一该区区间间(所围x1,成x2)的的区概域率的与面正积态大分小布相概对率应密(度相曲等线)与。横轴
频数
10
0 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5 154.5 157.5 160.5
身高(cm)
某地13岁女孩118人身高(cm)频数分布图
频数
频数分布图二
20
10
0
身高(cm)
某地13岁女孩118人身高(cm)频数分布图
频数
频数分布图三
在μ不变的情况下,函数曲线位置不变,若σ变大 时,曲线形状变的越来越“胖”和“矮”;若σ变 小时,曲线形状变的越来越“瘦”和“高”。
若某一随机变量X,其总体均数μ=0,总体标准差σ=1, 即X~N(0,1),则称变量X服从标准正态分布。习惯 把服从标准正态分布的变量用字母U或Z表示,此时,
下面我们以第一节某地13岁女孩118人的身高(cm)资料,来说明身高变量服从 正态分布。
频数分布表:
某地 13 岁女孩 118 人的身高(cm)资料频数分布
身高组段
频数
组中值
(1)
(2)
(3)
129~
2
130.5
132~
2
133.5
135~
8
136.5
138~
20
139.5
141~
26
142.5
身高(X)~N(μ ,σ 2),但μ 和σ 未 知,只知来自该总体的样本的身高均数
x =144.29(cm)和标准差 s=5.41(cmx),由
于样本含量 n=118 很大,所以可以用 和 s 估计μ 和σ 来计算 u 值。
身高(X)小于 135(cm)的概率为: PX x1 135 PU u1
u1
x1 s
x
135 144.29 5.41
1.72
PX x1 135 PU u1 PU u1 1.72 1.72 0.04272
身高(X)大于 155(cm)的概率为: PX x2 155 PU u2