正态分布详解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
服从正态分布 N(µ,σ 2 ) 的随机变量 X的概率密度是 的
1 f ( x) = e σ 2π
( x−µ )2 − 2σ 2
, −∞< x < ∞
X的分布函数 的分布函数P(X≤x)是怎样的呢? 是怎样的呢? 的分布函数 是怎样的呢
设X~ N(µ,σ ) ,
2
X的分布函数是 的分布函数是
( t −µ )2 − 2σ 2
回忆我们在本章第三讲中遇到过的 年降雨量问题, 我们用上海99年年降雨 年降雨量问题 , 我们用上海 年年降雨 量的数据画出了频率直方图。 量的数据画出了频率直方图。
从直方图,我们可以初步看出, 从直方图,我们可以初步看出,年降 雨量近似服从正态分布。 雨量近似服从正态分布。
下面是我们用某大学男大学生的身高 的数据画出的频率直方图。 的数据画出的频率直方图。 红线是拟 红线是拟 合的正态 密度曲线
正态分布的定义是什么呢? 正态分布的定义是什么呢?
对于连续型随机变量,一般是给出 对于连续型随机变量, 它的概率密度函数 概率密度函数。 它的概率密度函数。
一、正态分布的定义 若r.v X的概率密度为 的
( x−µ )2 − 2σ 2
1 f ( x) = e , −∞< x < ∞ σ 2π 2 µ 都是常数, 任意, 其中 µ 和 σ 都是常数, 任意,σ >0, , 2 则称X服从参数为 的正态分布. 则称 服从参数为 µ 和 σ 的正态分布
正态分布是应用最 广泛的一种连续型分布. 广泛的一种连续型分布 德莫佛最早发现了二项概 率的一个近似公式, 率的一个近似公式,这一公式 被认为是正态分布的首次露面 正态分布的首次露面. 被认为是正态分布的首次露面 正态分布在十九世纪前叶由 高斯加以推广, 高斯加以推广,所以通常称为高 斯分布. 斯分布.
1 Φ( x) = 2π
当-x<0时 时
−x x
∫
x
−∞
e dt
t2 − 2
表中给的是x>0时, Φ(x)的值 时 的值. 表中给的是 的值
Φ(−x) = 1 − Φ( x)
若 X~N(0,1), ~
P(a < X < b) = Φ(b) − Φ(a) X −µ 2 若 X ~ N(µ,σ ), Y = ~N(0,1) σ a−µ b−µ ≤Y ≤ ) P(a < X < b) = P( σ σ b−µ a−µ = Φ( ) − Φ( ) σ σ
能不能根据密度函数的表达式, 能不能根据密度函数的表达式, 得出正态分布的图形特点呢? 得出正态分布的图形特点呢?
1 f ( x) = e σ 2π
( x−µ )2 − 2σ 2
, −∞< x < ∞
容易看到, 容易看到,f(x)≥0 即整个概率密度曲线都在x轴的上方; 即整个概率密度曲线都在 轴的上方; 轴的上方
1 f ( x) = e σ 2π
( x−µ )2 − 2σ 2
, −∞< x < ∞
分别代入f 令x=µ+c, x=µ-c (c>0), 分别代入 (x), 可 + 得 f (µ+c)=f (µ-c) + 且 f (µ+c) ≤f (µ), f (µ-c)≤f (µ) + 为对称轴, 故f(x)以µ为对称轴,并在 以 为对称轴 并在x=µ处达到最大 处达到最大 值: 1 f (µ) = 2πσ
∫
定理表明, 很大, 定理表明,当n很大,0<p<1是一个定值 很大 是一个定值 或者说, 也不太小时),二项变 时(或者说,np(1-p)也不太小时),二项变 也不太小时),二项 量 Yn 的分布近似正态分布 N(np,np(1-p)).
实用中, 实用中,n 似的效果较好. 似的效果较好
, 时正态近 ≥ 30, np ≥10时正态近
[µ − 3σ , µ + 3σ ] 区间内. 区间内.
上一讲我们已经看到, 很大, 接 上一讲我们已经看到,当n很大,p接 很大 近0或1时,二项分布近似泊松分布 如果 或 时 二项分布近似泊松分布; n很大,而p不接近于 或1,那么可以证明, 很大, 不接近于0或 ,那么可以证明, 很大 不接近于 二项分布近似于正态分布. 二项分布近似于正态分布 下面我们不加证明地介绍有关二项分 下面我们不加证明地介绍有关二项分 布近似于正态分布的一个定理 称为棣莫 的一个定理, 布近似于正态分布的一个定理,称为棣莫 拉普拉斯定理. 佛-拉普拉斯定理. 它是第五章要介绍的 中心极限定理的一个最重要的特殊情况. 中心极限定理的一个最重要的特殊情况.
( x−µ )2 − 2σ 2
, −∞< x < ∞
用求导的方法可以证明, 用求导的方法可以证明, x=µ±σ 的两个拐点的横坐标。 为f (x)的两个拐点的横坐标。 的两个拐点的横坐标 这是高等数学的内容,如果忘记了, 这是高等数学的内容,如果忘记了,课下 再复习一下。 再复习一下。
根据对密度函数的分析, 根据对密度函数的分析,也可初步画出正 态分布的概率密度曲线图。 态分布的概率密度曲线图。
1 ϕ( x) = e , −∞< x < ∞ 2π t2 1 x −2 Φ( x) = ∫−∞e dt 2π
ϕ ( x)
ห้องสมุดไป่ตู้
x2 − 2
Φ( x )
标准正态分布的重要性在于, 标准正态分布的重要性在于,任何一个 一般的正态分布都可以通过线性变换转化为 标准正态分布. 标准正态分布. 它的依据是下面的定理: 它的依据是下面的定理: 定理1 定理 设 X ~ N(µ,σ ) ,则 Y =
德莫佛
不知你们是否注意到街头的一种赌博 活动? 用一个钉板作赌具。 活动? 用一个钉板作赌具。
请看
街头
也许很多人不相信, 也许很多人不相信,玩这种赌博游 戏十有八九是要输掉的, 戏十有八九是要输掉的 , 不少人总 想碰碰运气,然而中大奖的概率实 想碰碰运气, 在是太低了。 在是太低了。
下面我们在计算机上模拟这个游戏: 下面我们在计算机上模拟这个游戏:
六、二项分布的正态近似 定理(棣莫佛-拉普拉斯定理) 定理(棣莫佛-拉普拉斯定理) 服从参数n, ( 设随机变量 Yn服从参数 p(0<p<1)的 ) 二项分布,则对任意x, 二项分布,则对任意 ,有 t2 x 1 −2 Yn − np = e dt lim P{ ≤ x} −∞ 2 n→∞ π np(1− p)
街头赌博 高尔顿钉板试验
平时, 平时 , 我们很少有人会去关心小球 下落位置的规律性, 下落位置的规律性 , 人们可能不相信 它是有规律的。 一旦试验次数增多并 它是有规律的 。 且注意观察的话, 你就会发现, 且注意观察的话 , 你就会发现 , 最后 得出的竟是一条优美的曲线。
高 尔 顿 钉 板 试 验 这条曲线就近似我们将要介 绍的正态分布的密度曲线。 正态分布的密度曲线 绍的正态分布的密度曲线。
1 F( x) = σ 2π
∫
x
−∞
e
dt, − ∞ < x < ∞
正态分布由它的两个参数µ和 唯 正态分布由它的两个参数 和σ唯 一确定, 不同时, 一确定, 当µ和σ不同时,是不同的正 和 不同时 态分布。 态分布。 下面我们介绍一种最重要的正态分布 标准正态分布
三、标准正态分布 的正态分布称为标准正态分布. µ = 0,σ = 1的正态分布称为标准正态分布. 表示: 其密度函数和分布函数常用ϕ(x)和 Φ(x)表示:
再看一个应用正态分布的例子: 再看一个应用正态分布的例子 例2 公共汽车车门的高度是按男子与车门 顶头碰头机会在0.01以下来设计的.设男子 以下来设计的. 顶头碰头机会在 以下来设计的 身高X~ ( 问车门高度应如何确定? 身高 ~N(170,62),问车门高度应如何确定? , ),问车门高度应如何确定 设车门高度为h 解: 设车门高度为 cm,按设计要求 , P(X≥ h)≤0.01 或 P(X< h)≥ 0.99, ,
2
X −µ
根据定理1,只要将标准正态分布的分布 根据定理1,只要将标准正态分布的分布 1, 函数制成表, 函数制成表,就可以解决一般正态分布的概 率计算问题. 率计算问题.
σ
~N(0,1)
四、正态分布表 书末附有标准正态分布函数数值表, 书末附有标准正态分布函数数值表,有了 可以解决一般正态分布的概率计算查表. 它,可以解决一般正态分布的概率计算查表.
1 f ( x) = e σ 2π
( x−µ )2 − 2σ 2
, −∞< x < ∞
当x→ ±∞时,f(x) → 0, , 向左右伸展时, 这说明曲线 f(x)向左右伸展时,越来越 向左右伸展时 贴近x轴 轴为渐近线。 贴近 轴。即f (x)以x轴为渐近线。 以 轴为渐近线
1 f ( x) = e σ 2π
X − np X − 5000 = 50 np(1− p)
近似正态分布N(0,1). 近似正态分布
X − np X − 5000 = 近似正态分布N(0,1). 近似正态分布 50 np(1− p)
P(X≥5800) =1-P(X<5800)
5800 − 5000 ≈ 1 − Φ( ) 50
=1-Φ(16) ≈0 此概率接近于0, 此概率接近于 ,故认为这枚硬币不均匀 是合理的 .
五、3
σ 准则
由标准正态分布的查表计算可以求得, 由标准正态分布的查表计算可以求得, (0,1)时 当X~N(0,1)时, ~ (0,1) P(|X| ≤1)=2 Φ 1)-1=0.6826 ( ) = P(|X| ≤2)=2 Φ2)-1=0.9544 ( ) = P(|X| ≤3)=2 Φ 3)-1=0.9974 ( ) = 这说明, 的取值几乎全部集中在 的取值几乎全部集中在[ 这说明,X的取值几乎全部集中在[-3,3]区间 ] 超出这个范围的可能性仅占不到0.3%. 内,超出这个范围的可能性仅占不到 .
可见, 可见,某大学男大学生的身高 应服从正态分布。 应服从正态分布。
人的身高高低不等, 人的身高高低不等 , 但中等身材的占大 多数, 特高和特矮的只是少数, 多数 , 特高和特矮的只是少数 , 而且较 高和较矮的人数大致相近, 高和较矮的人数大致相近 , 这从一个方 面反映了服从正态分布的随机变量的特 点。
请同学们想一想, 请同学们想一想,实际生活中具有这 种特点的随机变量还有那些呢? 种特点的随机变量还有那些呢?
除了我们在前面遇到过的年降雨量和 身高外,在正常条件下各种产品的质量指标, 身高外,在正常条件下各种产品的质量指标, 如零件的尺寸;纤维的强度和张力; 如零件的尺寸;纤维的强度和张力;农作 物的产量,小麦的穗长、株高;测量误差, 物的产量,小麦的穗长、株高;测量误差, 射击目标的水平或垂直偏差;信号噪声等 射击目标的水平或垂直偏差; 都服从或近似服从正态分布. 等,都服从或近似服从正态分布.
记作 X ~ N(µ,σ 2 ) f (x)所确定的曲线叫作正态曲线 所确定的曲线叫作正态曲线 所确定的曲线叫作正态曲线.
正态分布有些什么性质呢? 正态分布有些什么性质呢? 由于连续型随机变量唯一地由它 的密度函数所描述, 的密度函数所描述,我们来看看正态 分布的密度函数有什么特点。 分布的密度函数有什么特点。 请看演示 正态分布
将上述结论推广到一般的正态分布, 将上述结论推广到一般的正态分布,
Y ~ N(µ,σ )时, P(| Y − µ |≤ σ ) = 0.6826 P(| Y − µ |≤ 2σ ) = 0.9544
2
P(| Y − µ |≤ 3σ ) = 0.9974
可以认为, 可以认为,Y 的取值几乎全部集中在 这在统计学上称作“3 准则” 这在统计学上称作“σ 准则” 三倍标准差原则) (三倍标准差原则).
见教学软件中的计算机演示 二项分布的正态近似
例1 将一枚硬币抛掷10000次,出现正面5800 将一枚硬币抛掷 次 出现正面 认为这枚硬币不均匀是否合理? 次,认为这枚硬币不均匀是否合理 试说明理由. 试说明理由 次试验中出现正面的次数, 解: 设X为10000次试验中出现正面的次数, 为 次试验中出现正面的次数 若硬币是均匀的, 若硬币是均匀的, X~B(10000,0.5), , 采用正态近似, 采用正态近似 np=5000, np(1-p)=2500, 即
二、正态分布 N(µ,σ 2 ) 的图形特点
正态分布的密度曲线是一条关于 µ对 称的钟形曲线. 称的钟形曲线. 特点是“两头小,中间大,左右对称” 特点是“两头小,中间大,左右对称”.
正态分布 N(µ,σ 2 ) 的图形特点
中峰的陡峭程度. 中峰的陡峭程度.
决定了图形的中心位置, µ 决定了图形的中心位置,σ 决定了图形