正态分布下的累积概率

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

正态分布

3.1 正态分布

对于连续型随机变量而言,正态分布(normal distribution)是最重要的一种概率分布。

经验表明:对于依赖于众多微小因素;且每一因素均产生微小的或正或负影响的连续型随机变量来说,正态分布是一个相当好的描述模型。

如人的体重,因为遗传、骨骼结构、饮食、锻炼、等都对人的体重有影响,但又没有一种因素起到压到一切的主导作用。与此相类似,人的身高、考试分数等都近似地服从正态分布。

通常用:

X~N(u, 2δ) (3 - 1)

δ称为正态分布的总表示随机变量X服从正态分布。N表示正态分布,括号的参数u, 2

体均值(或期望)和方差。

3.1.1 正态分布的性质

(1) 正态分布曲线以均值u为中心,对称分布。

(2) 正态分布的概率密度函数呈中间高、两边低,在均值u处达到最高,向两边逐渐降低,即随机变量在远离均值处取值的概率逐渐变小。

(3) 正态曲线下的面积约有68%位于u ±δ两值之间;约有95%的面积位于u±22δ之

间;而约有99.7%的面积位于u±3

δ之间。

★ (4) 两个(或多个)正态分布随机变量的线性组合仍服从正态分布。

令X 和Y 相互独立: X ~N(u X ,2x

δ)

Y ~N(u Y ,

2y δ)

现在考虑两个变量的线性组合:W =a X+b Y 则 W ~N(u W ,

2w

δ) ( 3 - 2 ) 其中,

u W =(au X +bu Y ) ( 3 - 3 )

2w δ = (2

2x

a δ+22y

b δ) (3 - 4)

例3.1

令X 表示在下沙高教区一花店每日出售玫瑰花数量, Y 表示在下沙镇一花店每日出售玫瑰花的数量,假定X 和Y 服从正态分布,且相互独立,并有:

X ~N( 100,64 ),Y ~N( 150,81 )

求两天两花商出售玫瑰花数量的期望及方差?

W =2X +2Y

根据式( 3 - 3 )

E(w)=E( 2X+ 2Y) = 5 0 0,

Var (w) = 4var(X) + 4var(Y) = 5 8 0

因此,W 服从均值为5 0 0,方差为5 8 0的正态分布,即W ~N( 5 0 0,5 8 0 )。

★★3.1.2 标准正态分布

两个正态分布可能因为期望或方差的不同,或是期望和方差均不同而相区别。如何比较各种不同的正态分布呢?

定义一个新的变量Z :

X u Z δ

-=

如果变量X 的均值为u ,方差为

2δ,则根据式(3 - 4),变量Z 的均值为0,方差为1。称

之为标准正态变量(standard normal variable) 。

即若X ~N(u ,

2δ),那么变量Z 就是标准正态变量,用符号表示为:

Z ~N(0,1) (3 - 5) 证明: (1) 均值为0

因为有E (aX+b) = a E(X) + b ,所以

1E E X u X u δδδδ

-+=-+()()=0

(2)方差为1

因为有var ( aX +b ) = a 2var ( X ) ,所以

21var var X u X δδδ

-+=()()=1

图3 - 3a 和3 - 3b 分别给出标准正态分布的概率密度函数和累积分布函数。

例3.2

变量x 表示花房每日出售的玫瑰花量,假定它服从均值为70、方差为9的正态分布,即X ~N( 70,9 ),求任给一天,出售玫瑰花数量大于75支的概率。

7570 1.763

Z -=≈

服从标准正态分布,求P(Z> 1 . 6 7 )。

从附录表可知, Z 位于区间( 0 , 1.3 )的概率为0.4032,位于( 0,2.5 )的概率为0.4938。由正态分布的对称性可知,Z 位于区间(-1.3 , 0 )的概率也为0.4032,位于(-2.5 , 0 )的概率为0.4938。由于这种对称性,在标准正态分布表中一般仅给出Z 取正值的情形。也就是说,标准正态密度函数,在Z=0的左右面积均为0.5,整个面积(或概率)为1。

根据正态分布表得: P( 0≤Z ≤1.67)=0.4525 因此,

P(Z>1.67)=0.5000-0.4257=0.0475

即每天出售玫瑰花的数量超过75支的概率为0.0475。(参见图3-3a )

例3.3

继续例3. 2 ,现假定要求每天出售玫瑰花数量小于或等于7 5支的概率。 概率为: 0.500 0+0.452 5=0.952 5 (见图3-3b )。 例3.4

求每天出售玫瑰花数量在在65与75支之间的概率。

6570 1.673

Z -=≈-

7570 1.673

Z -=≈

查表得,

P(-1.67≤Z ≤0)=0.4525 P(0≤Z ≤1.67)=0.4525

由正态分布的对称性得到, P(-1.67≤Z ≤1.67)=0.9050

即每天出售面包的数量介于65条与75条之间的概率约为90.5% (见图3-3a )。

上面的例子表明:一旦知道某一正态变量的期望与方差,先将其转化为标准正态变量,然后根据正态分布表求得相应的概率。

★★3.2样本均值X 的抽样分布或概率分布

样本均值是总体均值的估计量,但由于样本均值是依据某一给定样本而定,因此其值也会因随机样本的不同而变化。也就是说,样本均值也是随机变量,并且有其自己的概率分布函数。

称X1,X2,⋯⋯,Xn 构成一个容量为n 的独立同分布随机变量(independently and identically distributed random variables,i.i.d.random variables),即所有的X 是从同一概率密度(即每个Xi 有相同的概率密度函数)中独立抽取得到的。

如果Xi~N(u ,2δ)且每个Xi 独立抽取得到,则称X1,X2, ⋯⋯ ,Xn 是 i.i.d.随机变量,正态概率密度函数是其共同的概率密度。

估计量(比如样本均值)的概率密度。 例3.6

正态分布的均值为10,方差为4,即N( 10,4 )。从这个正态总体中抽取20个随机样本,每个样本包括2 0个观察值。对抽取的每一个样本,得到其样本均值X ,因而共有20个样本均值,见表3-3。

相关文档
最新文档