第4章 几种常见的概率分布
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、正态分布曲线 1.正态分布密度函数的图像
正态分布密度曲线 以 x=μ为对称轴作对称分布,曲线有个最高点,以此点的横坐标为中心,向两边单调下降。 连续型随机变量的概率分布 2. 正态分布的特征
(1) 正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为 x=μ; (2) f(x)在 x=μ处达到极大,极大值 ; (3) f(x)是非负函数,以 x 轴为渐近线,分布从-∞至+∞; (4) 曲线在 x=μ±σ处各有一个拐点,即曲线在(-∞,μ-σ)和(μ+σ,+∞) 区间上是下 凸的,在[μ-σ,μ+σ]区间内是上凸的; (5) 正态分布有两个参数,即平均数μ和标准差σ。μ是位置参数。 当σ恒定时,μ愈 大,则曲线沿 x 轴愈向右移动;反之,μ愈小,曲线沿 x 轴愈向左移动。σ是变异度参数, 如下图所示。当μ恒定时,σ愈大,表示 x 的取值愈分散, 曲线愈“胖”;σ愈小,x 的取 值愈集中在μ附近,曲线愈“瘦”。
解: (1) P(u<-1.64)=0.05050 (2) P (u≥2.58)=Φ(-2.58)=0.00494 (3) P (|u|≥2.56)=2Φ(-2.56) =2×0.00523=0.01046 (4) P (0.34≤u<1.53)=Φ(1.53)-Φ(0.34) =0.93699-0.63307=0.30392
解:
P( X 6.536) (6.536 9.978) (2.39) 0.00842 1.441
P( X 12.128) ( 12.128 9.978) (1.49) 0.06811 1.441
P(8.537 X 9.978 ) (9.978 9.978 ) (8.537 9.978 )
U X
则 U ~ N(0, 1),即
P( X
x0 )
P(U
x0
)
(
x0
)
这样,只要先计算 U 的值,就可以从标准正态分布表中查出所需要的数值了。
例: 已知小麦穗长服从 N(9.978, 1.4412),求下列概率:(1)穗长<6.536cm,(2)穗
长>12.128cm,(3)穗长在 8.573cm 与 9.978cm 之间。
因此,P(U u ) ;同时,我们有P(U u ) 。 u 称为的下侧临界值。
的单侧临界值是将面积 全部放在曲线的上侧或 下侧。 如果将面积 平均分配到两侧,即 P(| U | u /2 ) , 那么u /2称为的双侧临界值,也可以记为 u (双侧)。
面积为,已知
注意:α的双侧临界值=α/2 的上侧临界值
幻灯片 36 4. 一般正态分布的概率计算
若随机变量 x 服从正态分布 N(μ,σ2),则 x 的取值落在任意区间[x1,x2]的概率,记 作 P(x1≤x≤ x2),等于下图中阴影部分曲边梯形面积。即:
P(x1 x x2 )
1
2
( x )2
x2 e 2 2 dx
x1
正态分布的概率
对于服从一般正态分布的随机变量 X,需先把它标准化,然后再查表。标准化方法如下: 设 X~N(μ,σ2),令,
N(0,1)
x=0 时,φ(x) 达到最大值
(1) 关于点(0,0.5)对称,该点也
是它的拐点
(2)x 取值离原点越远,φ (x) 值越小 (2) 曲线以 y = 0 和 y = 1 为渐近线;
(3)关于 y 轴对称,即φ(x)= φ (- x)
(3) Ф(1.960)-Ф(-1.960) = 0.95
查表3
双侧临界值 u0.01(双侧)=u0.005 2.576
1.441
1.441
(0) (1) 0.50000 0.15866 0.34134
5. 几对常见的区间与其相对应的面积或概率
面积或概率
区间
μ± 1σ μ± 2σ μ± 3σ μ± 1.960σ μ± 2.576σ
=0.6827 =0.9545 =0.9973 =0.9500 =0.9900
种变量有它各自的概率而组成一个分布。这个分布就叫做二项概率分布,或简称二项分布
(binomial distribution) 由此得到计算二项分布任何一项概率的通式为:p(x) =Cnx φ
x(1- φ)n-x
二项分布是一种离散型随机变量的概率分布
性质
n
Cnx x (1 )nx 1
x0
m
P( x m) Cnx x (1 )nx x0
(4)在 x=1 有两个拐点
(4) Ф(2.576)-Ф(-2.576) = 0.99
(5)曲线与 x 轴间所夹面积为 1
由于正态分布的重要性,它的密度函数及分布函数的数值都已被编成表格备查(附表 2)。
注意的是多数表中只给出 x≥0 的φ (x)和Ф(x)值,这是因为由它们的对称性,有:
(x) (x),(x) 1 (x)
幻灯片 43
例如,x 落在(μ-1.960σ,μ+1.960σ)之外的α为 0.05,而α/2 为 0.025。即
P(x<μ-1.960σ)= P(x>μ+1.960σ)=0.025
例如:x 落在(μ-2.576σ,μ+2.576σ)之外的α为 0.01,而α/2 为 0.005,即
P(x<μ-2.576σ)= P(x>μ+2.576σ)=0.005
2. 证明平均数、方差
3. 实例 总和数
比率 4. 二项总体分布及二项分布参数比较 5. 二项分布偏斜度和峭度
四、二项分布应用实例 小鼠毛型受一对等位基因控制,Wv 正常直毛对 wv 波浪毛为显性。以杂合基因型 Wvwv
的小鼠为父本,与纯合基因型 wvwv 的小鼠为母本杂交。杂交后代毛型分布符合二项分 布。实验只选每窝 8 只的,多于或少于 8 只的都淘汰,预期每窝小鼠毛型表现。
二项式分布的形状
二项概率分布图
三、服从二项分布的随机变量的特征数
施用某种农药蚜虫存活概率分布 施用某种农药蚜虫存活概率
p(x=5)
0.16807
p(x=1)
0.16807
p(x=4)
0.36015
p(x=0.8)
0.36015
p(x=3)
0.3087
p(x=0.6)
0.3087
p(x=2)
0.1323
n
P(x m)
Cnx x (1 )n x
xm
m2
P(m1 x m2 ) pn (m1 k m2 ) Cnx p xqnx x m1
例 1:若研究施用某种农药后蚜虫的死亡数,设死虫子为 0,其概率为 0.3;其活的为 1,概率为 0.7。如每次观察 5 只,结果将有 0(5 只全死)、1(4 死 1 活)、2(3 死 2 活)、3(2 死 3 活)、4(1 死 4 活)、5(5 全活),共 6 种变量。由这 6 种变量的相应概 率组成的分布,就是 n=5 时活虫数的二项分布。
由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在 4 次试 验中,事件 A 恰好发生 2 次的概率为
一般,在 n 重贝努利试验中,事件 A 恰好发生 k(0≤k≤n)次的概率为
Pn(k) Cnk pk qnk k 0,1, 2,, n
二、二项分布
如果我们每次独立抽取二项总体的 n 个个体,则所得变量 X 将可能有 0,1,…n,共 n+1
(u)
1
u2
e2
2
(u)
1
u 1u2
e 2 du
2
随机变量 u 服从标准正态分布,记作 u~ 2. 标准正态分布曲线 标准正态分布密度函数曲线 分布函数曲线
0.5 0.4 0.3 0.2 0.1
0 -3 -2 -1 -0 1 2 3
1 0.8 0.6 0.4 0.2
0 -3 -2 -1 -0 1 2 3
σ 相同而 μ 不同的三个正态分布
μ 相同而 σ 不同的三个正态分布
(6) 分布密度曲线与横轴所夹的面积为 1,即:
P( x )
1
e
(
x )2 2 2
dx
1
2
三、标准正态分布 1. 标准正态分布定义 μ=0,σ2=1 的正态分布为标准正态分布(standard normal distribution)。标准正态分布 的概率密度函数及分布函数分别记作φ (u)和Φ(u)
p(x=0.4)
0.1323
p(x=1)
0.02835
p(x=0.2)
0.02835
p(x=0)
0.00243
p(x=0)
总和数
比率
幻灯片 11
1. 二项式分布的参数
平均数
以总和数表示时μ=n φ
以比率表示时 μ= φ
0.00243
方差 以总和数表示时σ2=n φ(1- φ) 以比率表示时 σ2= φ(1- φ)/n
例三,求 0.05和=0.01的上侧临界值、下侧临界值和双侧临界值。
解:
查表3
(1) 0.05时,上侧临界值u0.05 1.645;
查表3
双侧临界值 u0.05 (双侧)=u0.025 1.96
查表3
(2) 0.01时,上侧临界值 u0.01 2.326;
所以,下侧临界值 u0.01 2.326;
第四章 几种常见的概率分布 第一节 二项分布 一、二项总体 1. 定义
由非此即彼事件构成的总体,叫做二项总体(binomial population) 孵 n 枚种蛋的出雏数、n 头病畜治疗后的治愈数、n 尾鱼苗的成活数等
2. 表示方法 通常给“此”事件以变量“1”,具概率φ ,给“彼”事件以变量“0”,具概率 1- φ 。
二项总体又称 0、1 总体。 在 n 重贝努利试验中,事件 A 可能发生 0,1,2,…,n 次,现在我们来求事件 A 恰
好发生 k(0≤k≤n)次的概率 Pn(k)。
先取 n=4,k=2 来讨论。在 4 次试验中,事件 A 发生 2 次的方式有
C
2 4
其中 Ak(k=1,2,3,4)表示事件 A 在第 k 次试验发生; Ak (k=1,2,3,4)表示事件 A 在 第 k 次试验不发生。由于试验是独立的,按概率的乘法法则,于是有
因此可容易地算出 x 任意取值时φ (x)和Ф(x)的值。
3. 标准正态分布的概率计算
设 u 服从标准正态分布,则 u 在[u1,u2]内取值的概率为:
P(u1 u u2 )
1
u2
1u2
e2
du
2 u1
1
பைடு நூலகம்
u2
e
1u 2
2
du
2
1
u1
1u2
e2
du
2
=Φ(u2)-Φ(u1) 常用关系式:
6. 正态分布的单双侧临界值
面积为,已知 上侧临界值 P(U> u )= α ,下侧临界值 P (U <- u )= α (附表 3 上侧临界值)
若将一定曲线下面积α,平分到两侧尾区,则每侧曲线下面积为α/2,
即 P(
U U 2
)=
α,
U 这时的
U
2
称为α的双侧临界值。
面积为,已知
u 称为的上侧临界值。 附表3 (256页)给出了u的值。
第二节 泊松分布 描述在一指定时间范围内或在指定的面积或体积内某一事件出现的个体数的分布 泊松分布是一种离散型随机变量的概率分布
实例 调查某种猪场闭锁育种群仔猪畸形数,共记录 200 窝, 畸形仔猪数的分布情况如下表所
示。试判断畸形仔猪数是否服从泊松分布。 畸形仔猪数统计分布
解:根据泊松分布的平均数与方差相等这一特征,若畸形仔猪数服从泊松分布,则由观察数 据计算的平均数和方差就近于相等。样本均数和方差 S2 计算结果如下:
P(0≤u≤ u1)=Φ(u1)-0.5 P(u≥u1) =Φ(-u1) P(|u|≥u1)=2Φ(-u1) P(|u|≤ u1)=1-2Φ(-u1) P(u1≤u ≤ u2)=Φ(u2)-Φ(u1) 幻灯片 35 例:已知 u~N(0,1),试求: (1) P(u<-1.64)=? (2) P (u≥2.58)=? (3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =?
1
(x)2
e 2 2
2
-∞<μ<∞, σ> 0
其中μ为平均数,σ2 为方差,则称随机变量 x 服从正态分布(normal distribution), 记 为 x~N(μ,σ2)。
随机变量 X 的落入任意区间(a,b)概率:
相应的概率分布函数为
F (x) 1
2
e dx x
( x )2 2 2
可以认为畸形仔猪数服从泊松分布。 幻灯片 24 麦田内,平均每 10 m2 有 1 株杂草,现在要问每 100m2 麦田中,有 0 株杂草,有 1 株
杂草,有 2 株杂草,…的概率是多少?
第三节 正态分布
两头少,中间多,两侧对称
一、正态分布的定义 若连续型随机变量 x 的概率分布密度函数为
f (x)