正态分布概率公式(部分)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图 6-2 正态分布概率密度函数的曲线
正态曲线可用方程式表示。

当n→∞时,可由二项分布概率函数方程推导出正态分布曲线的方程:
f(x)= (6.16 )
式中: x —所研究的变数; f(x) —某一定值 x 出现的函数值,一般称为概率密度函数(由于间断性分布已转变成连续性分布,因而我们只能计算变量落在某一区间的概率,不能计算变量取某一值,即某一点时的概率,所以用“概率密度”一词以与概率相区分),相当于曲线 x 值的纵轴高度; p —常数,等于 3.14 159 ……; e —常数,等于 2.71828 ……;μ为总体参数,是所研究总体的平均数,不同的正态总体具有不同的μ ,但对某一定总体的μ 是一个常数;δ 也为总体参数,表示所研究总体的标准差,不同的正态总体具有不同的δ ,但对某一定总体的δ 是一个常数。

上述公式表示随机变数 x 的分布叫作正态分布,记作N( μ , δ2 ) ,读作“具平均数为μ,方差为δ2 的正态分布”。

正态分布概率密度函数的曲线叫正态曲线,形状见图 6-2 。

(二)正态分布的特性
1 、正态分布曲线是以x= μ 为对称轴,向左右两侧作对称分布。

因的
数值无论正负,只要其绝对值相等,代入公式( 6.16 )所得的 f(x) 是相等的,即在平均数μ 的左方或右方,只要距离相等,其 f(x) 就相等,因此其分布是对称的。

在正态分布下,算术平均数、中位数、众数三者合一位于μ点上。

2 、正态分布曲线有一个高峰。

随机变数 x 的取值范围为( - ∞,+ ∞ ),在( - ∞ ,μ )正态曲线随 x 的增大而上升,;当 x= μ 时, f(x) 最大;在(μ ,+ ∞ )曲线随 x 的增大而下降。

3 、正态曲线在︱x-μ︱=1 δ 处有拐点。

曲线向左右两侧伸展,当x →± ∞ 时,f(x) →0 ,但 f(x) 值恒不等于零,曲线是以 x 轴为渐进线,所以曲线全距从 -∞到+ ∞。

4 、正态曲线是由μ 和δ 两个参数来确定的,其中μ确定曲线在 x 轴上的位置 [ 图 6-3] ,δ 确定它的变异程度 [ 图 6-4] 。

μ 和δ不同时,就会有不同的曲线位置和变异程度。

所以,正态分布曲线不只是一条曲线,而是一系列曲线。

任何一条特定的正态曲线只有在其μ 和δ确定以后才能确定。

5 、正态分布曲线是二项分布的极限曲线,二项分布的总概率等于 1 ,正态分布与 x 轴之间的总概率(所研究总体的全部变量出现的概率总和)或总面积也应该是等于 1 。

而变量 x 出现在任两个定值 x1到x2(x1≠x2)之间的概率,等于这两个定值之间的面积占总面积的成数或百分比。

正态曲线的任何两个定值间的概率或面积,完全由曲线的μ 和δ确定。

常用的理论面积或概率如下:
区间μ ± 1 δ面积或概率 =0.6826
μ ± 2 δ =0.9545
μ ± 3 δ=0.9973
μ± 1.960δ=0.9500
μ ±2.576 δ =0.9900
图 6-3 标准差相同(δ=1 )而平均数
图 6-4 平均数相同(μ =0 )而标准差
不同的三条正态曲线不同的三条正态曲线
(三)正态分布的概率计算
正态分布是连续性变数的理论分布,计算其概率的原理和方法不同于二项分布。

它不能计算变量取某一定值,即某一点时的概率,而只能计算变量落在某一区间内的概率(即概率密度)。

对于任何正态分布随机变量 x 落入任意区间( a , b )的概率可以表示为:P(a<x<b) 。

其概率的计算是求概率密度函数在该区间的定积分,又由于求定积分反应在几何图形上是曲线在该区间上与 x 轴所夹的面积,所以,在曲线下某区间的面积等价于某区间的概率。

对于一般的正态曲线,其概率计算公式为:
P ( a<x<b ) = ( 6.17 )
如果将定积分的形式与结果用累积函数(或称分布函数)表示,那么,正态曲线下从 - ∞ 到 x 的面积,其式如下:
F ( x ) = ( 6.18 )
F(x) 称为正态分布的累积函数。

现如给变数任一定值,假如 x 等于 a ,那么,随机变数 x<a 的概率为
P ( x<a ) =F ( a ) = ( 6.19 )
根据以上的方法,如果 a 、 b(a<b) 是 x 的两个定值,则区间( a , b )的概率可以从下式计算
P(a<x<b)=F(b)-F(a)= - ( 6.20 )
由正态曲线的特性可知,对于不同的μ 和δ ,曲线就有不同的形状和位置。

在所有一系列曲线中,μ =0 、δ =1 的那条曲线是最简单的,我们把μ = 0 、δ =1 对应的曲线称为标准的正态曲线,并用变数 u 代替 x 。

曲线的方程为:Φ( u ) = ( 6.21 )
Φ( u )称为标准正态分布的概率密度函数,随机变量 u 的分布称作标准的正态分布或 u 分布,记作为 N(0 , 1) 。

同理,对于标准正态分布,其累积函数为
F ( u ) = ( 6.22 )
其表示在标准正态曲线下从 -∞ 到 u 之间的面积或概率。

对于一个 u 值,例如等于 a ,标准正态分布的随机变量 u 落入到区间( -∞ , a )的概率可以通过上式求得。

为了计算的方便,统计学家已根据 a 值的大小绘制了标准正态分布的累积分布函数数值表(附表 2 ),通过查表就可以获得( -∞ , a )的概率。

例 6-9 :设 u 服从标准正态分布 N ( 0 , 1 ),试求( 1 )随机变量 u 落入( 0 , 1.21 )区间的概率;( 2 )随机变量 u 落入( -1.96 , 1.9 6 )区间的概率;( 3 )随机变量 u 落入( -2.58 , 2.58 )区间的概率。

P ( 0<u<1.21 ) = F (1.21) - F (0)=0.8869-0.5000=0.3869
P(-.96<u<1.96)= F (1.96) - F (-1.96)=0.9750-0.0250=0.9500
P(-2.58<u<2.58)= F (2.58) - F (-2.58)=0.99506-0.00494=0.99012
从上述计算结果可知:从 u 分布中随机抽取一个 u 值,它落入( -1.96 , 1.
96 )内的概率为 95% ,落到区间外的概率为 5% ,而落到区间( -2.58,2.58 )外的概率更小,只有 1% 。

这说明从 u 分布中随机抽取一个 u 值,它落入到(-1.96 , 1.96 )之外的可能性很小,是一个小概率事件。

对于具有平均数为μ 、标准差为δ 的一般正态分布,只要将它们转化为标准的正态分布(即正态分布标准化),再查表,就很容易获得随机变量 x 落入在某个区间内的概率。

转换的方法很简单,首先将随机变量 x 标准化,(或者说将随机误差
标准化),令:
u= ( 6.23 )
即对 x 取其离均差值,再转换成以标准差为单位的量值 u 。

此 u 值叫正态标准离差或简称正态离差。

经过转换后,原遵从正态分布N ( μ ,δ2 ) 的随机变量 x 落在( a , b )区间内的概率,就等于遵从标准正态分布 N ( 0 ,
1 )的随机变量 u 落在 ( ,) 区间内的概率。

即:
P ( a<x<b ) =F(b)-F(a)=
从正态分布 N ( μ ,δ2 ) 到标准正态分布 N ( 0 , 1 ),从几何意义上说仅是作了坐标轴的平移和尺度单位的变换。

它带来的相应改变是:分布中心从μ处移至 0 处;尺度单位从 x 的单位变为标准差的单位(即在 N ( μ ,δ2 ) 中横轴上的一个标准差距离在 N ( 0 , 1 )中作为 1 ),这些改变可简化处理步骤,而不改变正态分布的基本性质。

因此,在求一般正态分布的概率时,只要将区间的上下限作适当的转换,亦同样查附表 2 即可求得概率。

例 6-10 :假定 x ——随机变数具有正态分布,平均数μ =30 ,标准差δ =5 ,试计算 P ( x<26 ), P(26<x<40) , P(x>40) ?
P(x<26)=F(26)= F ((26-30)/5)= F (-0.8)=0.2119
P(26<x<40)=F(40)-F(26)= )=
= F (2.0)- F (-0.8)=0.97725-0.2119=0.7654
P(x>40)=1-F(40)=1- =1- F (2.0)=1-0.97725=0.02275。

相关文档
最新文档