第四章 常见的几种概率分布

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0.5 0.4 0.3 0.2 0.1 0 -4 -3 -2 -1 0 1 2 3 4
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
σ =0.5
σ =1 σ =2
2.正态分布特征
⑴ 曲线呈钟型,以 为对称轴左右对称。 ⑵ 在 处, 取最大值,即曲线最高。 ⑶ 正态分布有两个参数,即位置参数 和形态 参数 。 ⑷ 正态分布的标准化变换
u2 125 122.6 0.5 4.8
相当于
119 122.6 125 -0.75 0 0.5
该地当年7岁男孩身高界于119cm 到125cm范围所占的比例为46.49%。
第三节 2分布、t 分布、F分布
t分布
X ~ N( m ,2) ~
• 英国统计学家W. S. Gosset(1908)给出了统计 量t的分布规律,并称统计量
• t分布与正态分布的关系: 自由度v 较小时,t 分布 与标准正态分布相差较大,随着自由度v的增大,t 分 布曲线越来越接近于标准正态分布曲线。
• 当 时,t分布的极限分布就是标准正态分布。
单侧 双侧
• t分布的界值:
t界值示意图:
-t/2,v
t/2,
2分布
设 为相互独立的服从标准正态总体 的随机变量,统计量 为 一随机变量,且其密度函数为
的分布规律为t分布,自由度为v,记为t (v)分 布。 由于每个自由度v对应一个分布,因此t分布是一 簇分布。
自由度不同的三条t分布密度曲线
v =∞ v=5
v =1
v=1
t分布的图形特征和t界值
• 分布特征: t分布曲线是单峰的,且以t = 0左右对称。 • t分布是随自由度v而变化的一簇分布。
概率
:是随机事件发生可能性大小的客观度 量指标,随机事件A的概率记为P(A), 0≤P(A)≤1。
小概率事件
:通常称概率P≤0.05 随机事件为 “小概率事件”,因为“小概率事 件”在一次观察或试验中发生的可 能性很小,可认为其不发生的。
随机变量
:表示随机现象观察结果的变量为随机变量 。
离散型随机变量:可能的取值为有限个或 无限可列个实数 。 随 比如:一个家庭的人口数 X 等 机 变 量 连续型随机变量:可能的取值充满一个区间 或在整个实数轴,无法一一列举。 比如:正常成年人的身高 X 等
称 所服从的分布为自由度为 v 的 (Chi-square distribution),记作
分布 。
2分布曲线
f ( 2 )
图5-8 不同自由度的分布密度曲线图
2分布的特征
1. 2分布是一种连续型分布,2取值范围为(0,
+)。
2. 2分布的曲线形状依赖于自由度v的大小。当
自由度v≤2时,曲线呈L型,随着自由度 v 的增加,
随机变量的概率分布 :即确定随机变量的取值和
相应取值的概率。
(1)离散型随机变量:通常用概率分布描述其取值 和相应取值的概率。 (2)连续型随机变量:通常用概率密度函数和概率 分布函数描述其在一个区间上取值的概率。
例如记 X为抛掷1次均匀的骰子出现的点数,则可将所 有可能的结果及其各结果出现的概率列成下表的形式:
α界值:
0.5
-∞
u
f(X)
0.4 0.3 0.2 0.1 0.0
1 (u ) 2

u

ห้องสมุดไป่ตู้
e
u 2
2
du
-4
-3
-2
-1
0 X
1
2
3
4
α界值:
u 小(大)于 uα 的概率 = α
3.正态曲线下面积的分布规律
(1)服从标准正态分布的随机变量在一区间上曲线 下的面积与服从标准正态分布的随机变量在其上 取值的概率相等。 (2)X 轴上与正态曲线下所夹面积恒等于1。 (3)如果u ,欲求服从标准正态分布的随 机变量在区间(-∞,u)(u≤0)上曲线下的面积, 可直接查附表2 。 (4)在区间 ,正态曲线下面积为68.27%; 在区间 ,正态曲线下面积为95.00%; 在区间 ,正态曲线下面积为99.00%。
正态曲线下面积的分布规律
——一般正态分布
68.27%
95.00% 99.00%
μ-2.58σ μ-1.96σ μ-σ μ μ+σ μ+1.96σ μ+2.58σ

正态曲线面积分布示意图
正态曲线下面积的分布规律 ——标准正态分布
68.27%
95.00%
99.00%
-2.58 -1.96 -1 0 1 1.96 2.58
标准正态分布(standard normal distribution)
X ~ N (m, 2 )
u X m

u2 2
u ~ N (0,1) 1 (u ) e 2 , u
一般正态分布为一个分布族: N ( m , 2 ) ;标准 正态分布只有一个 N (0 , 1) ,这样简化了应用。
2分布趋向对称。 3. 当自由度 v趋于无穷大时, 2分布则趋于正态 分布。
F分布
设随机变量 X ,Y分别服从 分布, ,且 X与 Y 独立,则统计量

为一连续型随机变量,其服从的分布称为 F 分布 , 记为 ,它有2个自由度为 v1和v2。
F分布的曲线形状
f (F)
2.5
v1=100 v2=100
2
v1=50 v2=30
1.5
v1=15 v2=10
1
v1=2 v2=2 F
0.5
0 0
图5-10 不同自由度F分布密度函数曲线图
1
2
3
4
计算正态曲线下面积实例
例5-13 由160名7岁男孩身高测量的数据算得 , ,已知身高数据服从正态分布。试估计该地当年7岁 男孩身高界于119cm 到125cm范围所占的比例。
X 122.6 S 4.8
119 122.6 u1 0.75 4.8
近似看作 X ~ N (122.6, 4.8 2 )
第三章
概率分布
第一节 随机事件与概率
几种重要分布的特点、相互关系为以后 统计分析做准备
确定性现象/必然现象
随机现象
随机事件 :随机现象至少有两个以上可能出现
的结果,通常称每一个可能的结果为 随机事件,简称事件。
频率
:若随机事件A,在n次试验中出现f 次, 则称 为随机事件A在n次试验
中出现的频率。

X的取值
离散型随机变量X 的概率分布表
1 2 3 4 5 6
Pi
1/6
1/6
1/6
1/6
1/6
1/6
连续型随机变量的概率密度函数与分布函数:
概率密度函数具有下列两个重要的性质:
① 对于任意实数 X,都有 ② 面积恒等于1。 ;
,即概率密度函数曲线下的
f(x)
F(x)
F(c) c
F(d)-F(c)
频数
10 5 0
90~
110~
130~
150~
170~
190~
210~
230~
250~
270~290
81名健康成年男子血清总胆固醇值的频数分布
观测人数增加,分割密度
f(X)
X
m
1.正态分布概念
如果连续型随机变量 X 在实数范围内取值,且具 有如下的概率密度函数
称连续型随机变量 X 服从正态分布,记为 X~ 其中 表示 X 的均数, 表示 X 的方差。
F(c) d x c d x
(a) (b) 连续型随机变量的概率密度函数图(a) 与概率分布函数图(b)及其联系
第二节
正态分布
一、正态分布概念和特征
1.正态分布概念 正态分布(normal distribution)也叫 高斯分布,是最常见、最重要的一种连续 型分布。
正态分布的引入
25 20
15
相关文档
最新文档