5 几种常见概率分布
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3 6-3 3 3 P6 (3) = C3 ( 0 . 85 ) ( 0 . 15 ) = 20 ( 0 . 85 ) ( 0 . 15 ) = 0.04145344 6
4 P6 (4) = C6 (0.85)4 (0.15)6-4 = 15(0.85)4 (0.15)2 = 0.17617711
5 6-5 5 1 P6 (5) = C5 ( 0 . 85 ) ( 0 . 15 ) = 6 ( 0 . 85 ) ( 0 . 15 ) = 0.39933478 6
Today: 2019/2/23
1 6-1 1 5 P6 (1) = C1 ( 0 . 85 ) ( 0 . 15 ) = 6 ( 0 . 85 ) ( 0 . 15 ) = 0.00038728 6
2 P6 (2) = C6 (0.85)2 (0.15)6-2 = 15(0.85)2 (0.15)4 = 0.00548648
Today: 2019/2/23
先假设母牛产怪胎数的概率分布为泊松分布。 根据观察结果计算每一奶牛场10年内母牛产怪胎
的平均数 x ,根据加权法可得:
n 200
fx 109 ×0 + 65 ×1 + 22 ×2 + 3 ×3 + 4 ×1 122 x= = = 0.61
用 x =0.61估计λ,代入
μ = np σ = npq
当试验结果以事件A发生的频率k/n表示时,
μp = p σ p = (pq) /n
Today: 2019/2/23
四、二项分布的概率计算及其应用条件
(一)概率计算 [例6] 直接利用二项概率公式 有一批种蛋,其孵化率为0.85,今在该批
种蛋中任选6枚进行孵化,试给出孵化出小鸡的各
3. 正态分布表、t值表的用法
教学要求:
掌握正态分布、二项分布、泊松分布的概 率计算方法及应用
Today: 2019/2/23
第一节
二项分布(Binomial distribution) 一、贝努利试验及其概率公式
(一)独立试验和贝努利试验 对于n次独立的试验,如果
每次试验结果出现且只出现对立事件 A 与 A 之一;
6 6-0 6 P6 (6) = C6 ( 0 . 85 ) ( 0 . 15 ) = ( 0 . 85 ) = 0.37714952 6
思考:求
至少孵出3只小鸡的概率是多少? 孵出的小鸡数在2-5只之间的概率是多大?
Today: 2019/2/23 (一)应用条件(三个)
n个观察单位的观察结果互相独立; 各观察单位只具有互相对立的一种结果,如阳 性或阴性,生存或死亡等,属于二项分类资料。
种可能情况的概率。
这个问题属于贝努里模型(?),其 中
n=6 p = 0.85,q = 1 - 0.85= 0.15 ,孵化6枚种蛋孵出的小
鸡数x服从二项分布 B(6,0.85) .其中x的可能取值为0, 1,2,3,4,5,6。
其中:
0 6 6 P6 (0) = C0 ( 0 . 85 ) ( 0 . 15 ) = ( 0 . 15 ) = 0.00001139 6
(其中p>0,q>0,p+q=1),则称随机变量X服从参数 为n和p的二项分布,记为 x ~ B(n, p)
Today: 2019/2/23
(二)二项分布的性质 二项分布是一种离散型随机变量的概率分布,
由n和p两个参数决定,参数n称为离散参数,只能
取正整数;p是连续参数,取值为0与1之间的任何
数值。
对于任何一个服从正态分布(μ ,σ2)的随 机变量χ ,都可以通过标准化变换:u=(χ μ )/ σ, 即减平均数后再除以标准差,将其变
换为服从标准正态分布的随机变量μ 。
对不同的u及P(U<u)值编成函数表,称为正
态分布表,从中可以查到任意一个区间内曲线下
的面积,即为概率。
Today: 2019/2/23
0.9996
199.92
Today: 2019/2/23
下面我们再来证实我们所得的资料是否具有 泊松分布的特征。
已经计算出x =0.61,样本方差计算如下,
Σ2 =
2 2 fx — ( fx ) /n
n -1 109 ×02 + 65 ×12 + 22 ×22 + 3 ×32 + 1 x 42 1222 / 200 = = 0.611 199
Today: 2019/2/23
(三)双侧(两尾)概率与单侧(一尾)概率 随机变量x落在平均数加减不同倍数标准差区间之 外的概率称为双侧概率(两尾概率),记作α
P (x < μ kσ) +P (x > μ+ kσ) =α
对应于双侧概率可以求得随机变量x小于μ -kσ或 大于μ +kσ的概率,称为单侧概率(一尾概率), 记作α/2 P(x < μ- kσ) =P (x > μ+ kσ) = α/ 2
21.64-30.26 x-30.26 32.98-30.26 P(21.64 ≤x < 32.98) = P( ≤ < ) 5.10 5.10 5.10 = P(-1.60 ≤μ < 0.53) = Φ(0.53)-Φ(-1.69) = 0.6564
x1 μ /σ, (x 2 μ/σ 的概率。
一、正态分布的定义及其特征
(一)定义
函数为:
其中,µ 为平均数,σ2 为方差,则称随机变 量χ服从正态分布,记为χ~N(µ ,σ2).相应的概 率分布函数为
1 F(x) = σ 2π
(x -μ) 2 - x 2σ2 -∞
e
(二)特征
正态分布密度曲线是以χ =µ 为对
Today: 2019/2/23
Today: 2019/2/23
应 熟 记 的 几 种 标 准 正 态 分 布 概 率
Today: 2019/2/23
(二)一般正态分布的概率计算 将区间的上下限标准化:服从正态分布的随机变量
χ 落在〔χ 1,χ 2〕内的概率,等于服从标准正态分布
的随机变量μ 落在 查标准正态分布表 [例 ] 若χ 服从μ =30.26,σ2 =5.102的正态分布,试 求P(21.64≦x﹤32.98)。 令u=(χ -30.26)/5.10,则u服从标准正态分布,故
在每次试验中出现A的概率是常数p(0<p<1),因
而出现对立事件 A 的概率是1-p=q,
则称这一串重复的独立试验为n重贝努利试验, 简称贝努利试验。
Today: 2019/2/23
(二)二项分布的概率 在n重贝努利试验中,事件A发生x次的概率恰 好是(q+p)n二项展开式中的第x+1项,因此将
三、正态分布的概率计算
(一)标准正态分布的概率计算 设u服从标准正 态分布,则μ 落在μ 1,μ 2]内的概率
P(u 1 ≤u < u 2 ) =
= 1 2π
1 2π
u2
u1
e
u2 2
du
u2 2
u2
∞
e
u2 2
du -
1 2π
u1
∞
e
du
= Φ(u 2 ) - Φ(u 1 )
而Φ(u 2 )与Φ(u1)可由附表查得
正态分布 密度函数曲线
1 P (- < x < +∞ )= e -∞ σ 2π
+∞
(x -μ) 2 - 2σ2
dx = 1
特征
Today: 2019/2/23
σ相同而μ不同的三个正态总体
μ相同而σ不同的三个正态总体
Today: 2019/2/23 二、标准正态分布standard normal distribution
二项分布具有概率分布的一切性质,即:
P(X = k) = Pn (k) ≥0
(k=0,1,2,…,n)
k k n-k n 二项分布的概率之和等于 1 ,即: Cn p q (q p) 1 k 0
n
二项分布的性质
Today: 2019/2/23
m k n k n -k
P(X ≤m) = Pn (k ≤m) = C p q
因而二项分布中当p很小且n很大时,可用泊松分
布来取代二项分布。
Today: 2019/2/23
第二节
泊松分布 Possion distribution
泊松分布是用来描述和分析稀有事件即小概率事件 分布规律的函数。 一、泊松分布的意义 (一)定义 若随机变量X(X=k)只取零和正整数值,且其概率分 布为 λk
Today: 2019/2/23
第五章
常见概率分布律
难度级:
Today: 2019/2/23
内容提要
第一节
第二节
二项分布
泊松分布
第三节
第四节
正态分布
其他概率分布律
Today: 2019/2/23
教学重点:
1. 正态分布、二项分布、泊松分布的概率 计算方法及应用; 2. 正态分布标准化的方法
k =0
P(X ≥m) = Pn (k ≥m) =
k=m
C
n
k n
p q
k
n -k
P(m1 ≤ X ≤m2 ) Pn (m1 ≤k ≤m2 )
k m1
C
m2
k n
p q (m1 ≤m2 )
k
n-k
Today: 2019/2/23
三、二项分布的平均数与标准差
统计学证明,服从二项分布B(n,p)的随机变量之 平均数μ、标准差σ与参数n、p有如下关系: 当试验结果以事件A发生次数k表示时
Pn (k) =
C
k k n-k p q , k = 0,1,2....., n n
称作二项概率公式。
二、二项分布的意义及其性质 (一)定义 设随机变量X所有可能取的值为零和 正整数:0,1,2,…,n,且有
k n-k P ( X k ) P ( k ) p q , k 0,1,2....., n n n Cn k
已知发生某一结果(如死亡) 的概率为p,其对
立结果的概率则为1-P=q,实际中要求p 是从大 量观察中获得的比较稳定的数值。
Today: 2019/2/23
现实中,有些事件出现的概率特别小,要观察到 这类事件,样本含量n必须很大 。在生物、医学 研究中,服从泊松分布的随机变量是常见的。
此外,由于泊松分布是描述小概率事件的,
如x落在(μ -1.96σ,μ +1.96σ) 之外的双侧概 率为0.05,而单侧概率为0.025。即 P(x < μ - 2.58 σ) = P(x > μ+ 2.58 σ) = 0.005 P(x < μ - 1.96 σ) = P(x > μ+1.96 σ) = 0.025
怪胎数(m) 实际次数(f) 0 109 1 65 2 22
当m=0,1,2,3,4时的概率和理论次数
λ k -λ P(x = k) = e k!
200
计算
总 计 200
3 3
4 1
概 率(理论)
理 论 次 数
0.5434 0.3314 0.1011 0.020 0.0031 6
108.68 66.28 20.22 4.12 0.62
称轴的单峰、对称的悬钟形;
f(x)在χ =µ 处达到极大值,极大值 为
f (μ) = 1 σ 2π
f(x)是非负数,以x轴为渐进线;
正态分布
密度函数曲线
特征
正态分布有两个参数,即平 均数µ 和标准差σ 。µ 是位置参 数,σ 是变异度参数。 分布密度曲线与横轴所夹的 面积为1,即:
Today: 2019/2/23
特征。(具体过程需要后面的拟合优度检验)
S 2 与 x 很接近,这正是泊松分布所具有的
Todawenku.baidu.com: 2019/2/23
第三节
正态分布 normal distribution
若连续性随机变量X的概率分布密度
f(x) = 1 σ 2π
(x-μ) 2 - 2 e 2 σ ,-∞< x < +∞ ,σ > 0
[例]我们调查了200个奶牛场,统计各场某10年内
出现的怪胎(如缺皮症,全身无毛等)的头数,然
后以怪胎头数把200个奶牛场分类,统计每类中奶牛
场数目,结果如下:
10年内母牛产怪胎次数(m) 0 奶牛场数(f) 1 2 3 4 1 总 计 200 109 65 22 3
试研究10年内母牛怪胎数的概率分布。
(一)定义 称µ =0, σ 2=1的正态分布为标准正态分布。 标准正态分布的概率密度函数及分布函数如下:
1 (u)= e σ 2π
- u2 2 u2 2
1 , Φ( u ) = σ 2π
u
-∞
e
-
du
若随机变量u服从标准正态分布,记作u~
(0, 1)
Today: 2019/2/23
(二)标准化的方法
P(X = k) = k! e-λ k = 0,1,; λ > 0;e = 2.7182
则称X服从参数为λ的泊松分布,记为X~P(λ)。
(二)特征
μ=σ2=λ(#样本方差等于平均数)
例
二、泊松分布的概率计算
Today: 2019/2/23
λ k -λ P(X = k) = e k!
以样本平均数作为λ的估计值