【统计分析】概率分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.5 0.4 0.3 0.2 0.1
0 -4 -3 -2 -1 0 1 2 3 4
0.9
0.8
0.7
σ =0.5
0.6
0.5
0.4
σ =1
0.3
σ =2
0.2
0.1
0 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
三、标准正态分布
• 标准化变换 X~N(,2)则
u X N(0,1)
✓累计概率(cumulative probability) 从阳性率为的总体中随机抽取n个个体 最多有k例阳性的概率:
k
P( X k) P( X ) P(0) P(1) ... P(k)
0
最少有k例阳性的概率:
n
P(X k) P(X ) 1 P(X k 1)
k
二项分布的性质(三)
u2 u1 0.6915 0.2266 0.4649
五、标准正态分布的界值
•
双侧界值:在
u 2
右侧及
u 2
左侧的面积和
为α
• 单侧界值:在 u 右侧或 u 左侧的面积为α
Z0.05 Z0.01
单侧 1.64 2.33
双侧 1.96 2.58
六、正态分布的重要性
准差为4.8cm。已知身高数据服从正态分布。试求:
➢ 该地7岁男童身高在119cm~125cm者占该地男孩总数的百分比.
➢ 作标准变换:
u1
119
122.6 4.8
0.75
u2
125
122.6 4.8
0.5
➢ 查表得:
u1 0.75 0.2266
u2 0.5 1 0.5 1 0.3085 0.6915
i5 i!
i0 i!
P X 15 15 10i e10 0.9513
i0 i!
正态分布
(normal distribution )
❖ 又称Gauss分布( Gaussian distribution ) 是一个重要的连续型概率分布。
一、正态分布的定义
• 1.分布密度曲线呈对称的钟型曲线
3只小白鼠2生1死的概率
➢ P1=0.20.20.8=0.032 ➢ P2=0.20.80.2=0.032 ➢ P3=0.80.20.2=0.032
P=0.096
3只小白鼠1生2死的概率
❖P1=0.20.80.8=0.128 ❖P2=0.80.80.2=0.128 ❖P3=0.80.20.8=0.128
P=0.384
3只小白鼠均死亡的概率
❖ P=0.80.80.8=0.512
表 2.8 三只小白鼠存亡的排列和组合方式及其概率的计算
所有可能结果 每种结果的概率
死亡数
生存数 不同死亡数的概
甲、乙、丙
(1)
(2)
X
nX
CnX (1 率 )nX X
(3)
(4)
(5)
生生生
0.20.20.2=0.008
X~B(n,)。其中参数 n由实验者确定,
而常常是未知的。
如已知n=3,=0.8,则恰有1例阳性
的概率P(1)为:
P(1)
C31(1
)31
1
3! 1!(3 1)!
(1
0.8)310.81
0.096
二项分布的性质(一)
✓均数与标准差
n
p
n (1 )
p
(1 )
n
二项分布的性质(二)
二项分布逼近Poisson分布。且:
C
X n
(1
)nX
X
e x
X!
其中= n。n愈大,近似程度愈好。如果某些现象的 发生率甚少,而样本例数n甚多时,二项分布常用
Poisson分布来简化运算。
实例1
❖ 据以往经验,新生儿染色体异常率为1%, 试分别用二项分布及Poisson分布原理,求 100名新生儿中发生X例(X=0,l,2…)染色 体异常的概率。
正态分布。
Poisson分布示意图
Poisson分布的性质(四) ✓可加性
以较小的度量单位,观察某一现象的发生 数时,如果它呈Poisson分布,那么把若干 个小单位合并为一个大单位后,其总计数 亦呈Poisson分布。
Poisson分布的性质(五)
• Poisson分布是二项分布的极限形式
二项分布中,当很小,比如<0.05,而n很大,
1.0000
0.3679 0.3679 0.1839 0.0613 0.0153 0.0031 0.0005 0.0001 0.0000
1.0000
Poisson分布的应用条件
❖事件的发生是相互独立的, ❖事件发生的概率相等, ❖事件结果是二分类的(发生或不发生)。
实例2
• 设某池塘中,平均每毫升池塘水中有6 个细菌, 试计算由该池塘中随机抽取1ml水中,有4个细 菌数的概率。
PX
30
10000!
30!10000
30
!
0.00530
1 0.005 1000030
0.0006647
P X
65
65 i0
PX
i
65 i0
10000! 0.005i
i!10000 i!
1 0.005 10000i
0.983
Poisson 分布
➢常用于描述单位时间或单位空间中某罕见 事件的发生数的随机分布规律,可视为n很 大,π很小时二项分布的极限情形。
图形特征:取决于π与n 当π接近0.5时,图形是对称的;π离0.5愈 远,对称性愈差,但随着n的增大,分布 趋于对称。当n足够大,π不太靠近0或1, np和n(1-p)都大于5时,二项分布近似于正 态分布。
应用举例
➢据以往经验,用某药治疗小儿上呼吸道感 染、支气管炎,有效率为85%,今有5个患 者用该药治疗,问:① 至少3人有效的概率 为多少?② 最多1人有效的概率为多少?
① 至少3人有效的概率: P(X≥3)=P(3)+P(4)+P(5) P(3) 3!(55! 3)! (0.15)2 (0.85)3 0.138178125
P(4) 0.138178125
P(5) 0.855 0.443705313
则 P(X≥3)=0.138178125+0.391504688+0.443705313=0.973388126
k
最多为k次的概率:P(X k) P( X ) P(0) P(1) P(k) 0
最少为k次的概率: P( X
k)
P(X )
1
k 1
P(X )
X k
X 0
Poisson分布的性质(三)
✓ Poisson分布的形状取决于 的大小。
随着 的增大,分布逐渐趋于对称,
当 =20时已基本接近对称分布,近似
1.000
0
0.512
—————
1.000
0.5
0.4
0.3
0.2
0.1
0.0 0
1
2
3
x
π=0.8,n=3 二项分布示意图
二项分布的定义
➢从阳性率为π的总体中随机抽取含量为n 的样本,恰有X例阳性的概率为:
P(
X
)
C
X n
(1
)
nX
X
X=0,1,2,…,n
则称X服从参数为n和的二项分布,记为:
• 概率 概率是事物的客观属性,通过大量的试验得知其频率随着 试验次数的增大,而越来越趋于某稳定值,这就是事件的 概率。但有一些特殊情况下的事件的概率可以直接计算, 这种计算是以概率的古典定义为基础的。
随机事件与概率
• 随机变量 随机现象在一定的条件下的每一可能的结果ω都 对应着唯一的实数值ξ(ω),则称实数值变量ξ (ω)为一个随机变量。随机变量通常用希腊字 母ξ,η,ζ,…来表示(或用大写拉丁字母X,Y, Z,…来表示)。
0
3
0.008
生生死
0.20.20.8=0.032
生死生
0.20.80.2=0.032
1
死生生
0.80.20.2=0.032
2
0.096
生死死
0.20.80.8=0.128
死生死
0.80.20.8=0.128
2
死死生
0.80.80.2=0.128
1
0.384
死死死
0.80.80.8=0.512
3
—————
• X~N(0,1) 1.X<0,Φ(X)查标准正态分布表; 2.X>0,Φ(X)=1- Φ(-X) ,; 3.(x1, x2)范围内的面积: Φ(X2) - Φ(X1) • X~N(μ,σ2) 化成标准正态分布,再查标准正态分布表
例4.13 由160名7岁男童身高测量数据得均数为122.6cm,标
➢ 概率的乘法法则 :
几个独立事件同时发生的概率,等于各独立 事件的概率之积
➢ 概率的加法法则 :
互不相容事件和的概率等于各事件的概率之 和
介绍的主要分布
• 1 .二项分布 • 2.泊松分布 • 3.正态分布
二项分布 (binomial distribution)
❖二分类资料,观察对象的结局只有 相互对立的两种结果。
第四章 概率分布
随机事件与概率
• 随机事件 在试验的结果中,可能发生,也可能不发生的事件,称为 随机事件。通常用英文大写字母A、B、C…表示随机事 件。 每次试验的结果中,某事件一定发生,则这一事件 叫做必然事件,用字母U表示;相反地,如果某事件在试 验中一定不发生,则叫做不可能事件,用字母V表示。
• 解:由题意知λ=6,则有
P X 4 64 e6 0.1339
4!
实例3
• 某市急救中心平均每小时收到请求急救的呼叫为 10个,试计算该中心1小时内收到请求急救的呼 叫至少5次的概率和至多15次的概率。
• 解:由题意知λ=10,则有
P X 5 10i e10 1 4 10i e10 0.9707
例如
生存、死亡 阳性、阴性 发病、不发病 治愈、未愈
先看一个例子
▪ 已知:小白鼠接受某种毒物一定剂量时 死亡率=80% 生存率=20%
▪ 每只鼠独立做实验,相互不受影响 ▪ 若每组各用3只小白鼠(甲、乙、丙) ▪ 3只小白鼠的存亡方式符合二项分布
3只小白鼠均生存的概率
➢P=0.20.20.2=0.008
例如:放射性物质每分钟放射的脉冲数,每ml水 中大肠菌群数、每1万个细胞中有多少个发生突 变、某地每天的交通事故数
如果某事件的发生是完全随机的,则单位时间或单
位空间内,事件发生0次、l次、2次…的概率为:
P( X ) e x
X!
X=0,1,2,…
则称该事件的发生服从参数为的Poisson分布,记 为X~P ()。 = nπ为总体均数,X为单位时间或空
表 2.9
染色体异常数 X
(1)
0 1 2 3 4 5 6 7 ≥8 合计
例 2.14 中 P(X)的计算结果
二项分布,n=100,=0.01 Poisson 分布, = n=1
(2)
(3)
0.3660 0.3697 0.1849 0.0610 0.0149 0.0029 0.0005 0.0001 0.0000
② 最多1人有效的概率为: P(X ≤ 1)=P(0)+P(1)
P( X 1) P(0) P(1) 0.155 C51 (0.15)51 0.85 0.002227501
二项分布的应用条件
✓ 各观察单位只能有互相对立的一种结果,属于 二分类资料
✓ 已知发生某一结果(如阳性)的概率不变,其对 立结果(如阴性)的概率则为1-
✓ n次试验在相同条件下进行,且各观察单位的结 果互相独立
应用实例
• 保险公司为了决定保险金额数,估算公司的利润和破产的 风险,需要计算各种各样的概率。若根据寿命表知道,某 年龄保险者,一年中每个人死亡的概率等于0.005,现有 10000个这类人参加人寿保险,试求在未来一年中在这些 保险者里:
1. 有30人死亡的概率; 2. 死亡人数不超过65人的概率。 • 根据题意,以X 表示死亡人数
(u)
1
u2
e 2 u
2
标准正态分布曲线下面积表
• 标准正态分布曲线下,u左侧任一区间的面积可以
通过积分求得
u
(u)
1
u2
e 2 du
Fra Baidu bibliotek
2
• 为了应用方便,积分结果制成表(附表1),通过 查表可得到u值左侧的面积。
• 例:u=-2.58,u=-1.96,u=-2时对应曲线下的面积。
四、正态曲线下面积(概率)的计算
间内某事件的发生数,P(X)为事件数为X时的概率, e为自然对数的底。
Poisson分布的性质(一)
✓均数与方差
Poisson分布的方差2与均数 相等,均为 ,即: 2==
其中参数 即为总体均数,表示单位空间或时间内
事件平均发生的次数,又称强度参数。
Poisson分布的性质(二)
✓ 累计概率
• 2.密度函数为:
f (x)
1
( x )2
e 2 2
2
• 3.通常用表示
N(, 2)
x
二、正态分布的特征
• 1.正态曲线横轴上方均数处最高 • 2.正态分布以均数为中心,左右对称 • 3.两个参数:μ是位置参数,σ是变异参数 • 4.正态曲线下面积分布有一定的规律:曲线下
总面积等于1 ,在μ左右的任意个标准差范围内 面积相同 μ±1.96σ 范 围 内 的 面 积 是 95% , μ±2.58σ范围内的面积是99%