概率论与数理统计第3讲52265共45页
合集下载
概率论与数理统计课件 第三章1
0, 其他.
求 (1) 边缘概率密度 pX ( x), pY ( y);
(2) P{ X+Y 2}
y
(1,1)
y 1 x
2019/4/3
O x 1 x e2 x
第三章 多维随机变量及其分布
28
例3 设二维随机变量 ( X , Y ) 具有概率密度
Ce(3x4 y) , x 0, y 0,
(x, y)
2019/4/3
第三章 多维随机变量及其分布
23
3.说明
几何上, z p( x, y) 表示空间的一个曲面.
p( x, y)d x d y 1,
表示介于 p (x, y)和 xoy 平面之间的空间区域的 全部体积等于1.
P{( X ,Y )G} p( x, y) d x d y, G
19
2019/4/3
第三章 多维随机变量及其分布
20
2019/4/3
第三章 多维随机变量及其分布
21
四、二维连续型随机变量
1.定义
对于二维随机变量 ( X ,Y ) 的分布函数 F ( x, y), 如果存在非负的函数 p( x, y) 使对于任意 x, y 有
yx
F ( x, y)
p(u, v) d ud v ,
记 P{X xi , Y yj } pij , i, j 1, 2,
称此为二维离散型随机变量 ( X ,Y ) 的分布律, 或随机变量 X 和 Y 的联合分布律.
其中 pij 0,
pij 1.
i1 j1
2019/4/3
第三章 多维随机变量及其分布
13
二维随机变量 ( X,Y ) 的分布律也可表示为
1 ( arctan x)
概率论与数理统计(第3章)
F(x ,y) P{(X 剟x) I (Y y)} P{X 剟x ,Y y}
(3-1)
为二维随机变量 (X ,Y) 的联合分布函数,简称分布函数.
如果将二维随机变量 (X ,Y) 视为 xOy 平面上随机点的坐标,那
么分布函数 F(x ,y) 在点 (x ,y) 处的函数值 二维随机变量函数的分布
第3章 多维随机变量及其分布
在第2章,我们主要讨论了一维随机 变量及其分布问题.但在实际问题中,有 许多随机试验的结果,仅用一个随机变量 是无法表示出来的.研究这些随机试验, 需要引入多维随机变量的概念.因此,本 章将重点讨论二维随机变量及其分布,对 于三维及更多维的随机变量可依此类推.
arctan
y
.
因此,两个边缘分布函数分别为
FX
(x)
F(x
,
)
lim
y
F(x
,y)
1 π
π 2
arctan
x
,
FY
( y)
F( ,y)
lim
x
F(x ,y)
1 π
π 2
arctan
y
.
第3章 多维随机变量及其分布
3.2 二维离散型随机变量
3.2.1 二维离散型随机变量的概念与分布律
定义 1 若二维随机变量 (X ,Y) 所有可能取的值为有限对或可列无限 多对,则称 (X ,Y) 为二维离散型随机 变量.
解 由二维随机变量的分布函数的性质得
lim
x
y
F(x
,y)
lim
x y
A(B
arctan
x)(C
arctan
y)
A
B
π 2
《概率论与数理统计》课件 概率论与数理统计 3
F (x ,y) P((x ,y) Gxy ) 。
这时,点 ( X ,Y ) 落入任一矩形区域 G {(x ,y) | x1 X x2 ,y1 Y y2}(见图32)的概率,即可由概率的加法性质求得:
P(x1 x x2 ,y1 y y2 ) F (x2 ,y2 ) F (x1 ,y2 ) F (x2 ,y1) F (x1 ,y1) 。 (3-2)
F (x ,y) x y f (u ,v)dudv,得:
当 x 0 或者 y 0 时,都有 F (x ,y) 0 ;
当 x 0 ,y 0 时,有
F(x ,y)
x eudu
0
y 0
evdv
(eu
)
|0x
(ev ) |0y (1 ex )(1 e y )
。
所以 ( X ,Y ) 的联合分布函数为
第一节 二维随机变量及其分布
一、二维随机变量的概念
定义1 设 {} 是随机试验 E 的样本空间。若对于任意的 ,都有确定的 两个实数 X () 和Y () 与之对应,则称有序二元总体 ( X () ,Y ())为一个二维随
机变量(或称为二维随机向量),简记为 ( X ,Y ) ;并称 X 和 Y 是二维随机变量 ( X ,Y ) 的两个分量。
xi x yi y
y的那些 (i ,j) 求和。
例1 一个袋中装有 5 个球,其中 2 个红球,3 个白球。每次从中不放回地随机抽取 1
个,连续抽取两次。定义随机变量 X 和 Y 如下: 1,第一次抽到红球, 1,第二次取到红球;
X 0 ,第一次抽到白球, Y 0 ,第二次取到白球. 求:(1) ( X ,Y ) 的联合分布列;
布列或联合分布律,简称分布列或者分布律。
这时,点 ( X ,Y ) 落入任一矩形区域 G {(x ,y) | x1 X x2 ,y1 Y y2}(见图32)的概率,即可由概率的加法性质求得:
P(x1 x x2 ,y1 y y2 ) F (x2 ,y2 ) F (x1 ,y2 ) F (x2 ,y1) F (x1 ,y1) 。 (3-2)
F (x ,y) x y f (u ,v)dudv,得:
当 x 0 或者 y 0 时,都有 F (x ,y) 0 ;
当 x 0 ,y 0 时,有
F(x ,y)
x eudu
0
y 0
evdv
(eu
)
|0x
(ev ) |0y (1 ex )(1 e y )
。
所以 ( X ,Y ) 的联合分布函数为
第一节 二维随机变量及其分布
一、二维随机变量的概念
定义1 设 {} 是随机试验 E 的样本空间。若对于任意的 ,都有确定的 两个实数 X () 和Y () 与之对应,则称有序二元总体 ( X () ,Y ())为一个二维随
机变量(或称为二维随机向量),简记为 ( X ,Y ) ;并称 X 和 Y 是二维随机变量 ( X ,Y ) 的两个分量。
xi x yi y
y的那些 (i ,j) 求和。
例1 一个袋中装有 5 个球,其中 2 个红球,3 个白球。每次从中不放回地随机抽取 1
个,连续抽取两次。定义随机变量 X 和 Y 如下: 1,第一次抽到红球, 1,第二次取到红球;
X 0 ,第一次抽到白球, Y 0 ,第二次取到白球. 求:(1) ( X ,Y ) 的联合分布列;
布列或联合分布律,简称分布列或者分布律。
浙大概率论与数理统计课件_第三章多维随机变量及其分布
P{X=0, Y=3} 1 23 1 8
P{X=1,
Y=1}
3 1
1 2
1 2
2=3/8
P{X=2,
Y=1}
3 2
1 2
2
1 2
=3/8
P{X=3,
Y=0}
1
2
3
1
8.
XY 1 3 0 0 18 1 38 0 2 38 0 3 0 18
三、二维连续型随机变量
定义3 对于二维随机变量
x
dx
f x, ydy
fX x FX x
f x, ydy
( X,Y )关于Y 的边缘概率密度为
fY ( y )
f ( x, y )dx
y
例2 设(X,Y)的概率密度是
f
(
x,
y
)
cy(
2 0
x ), ,
0 x 1,0 y x 其它
求 (1) c的值; (2)两个边缘密度。 y
X ,Y 的分布函数 F x, y,如果 存在非负的函数 f x, y, 使对于
任意 x, y 有
F x, y y x f u,v dudv
则称 X ,Y 是连续型的二维随
机变量 , 函数 f x, y 称为二维
随机变量(X,Y )的概率密度 ,或 称为随机变量 X 和 Y 的联合概 率密度.
这一节里,我们就来探求这个问题 .
一、边缘分布函数
二维随机变量 (X,Y)作为一个整体, 具有分布函
数 F x, y, 而 X 和 Y 都是随机变量 ,也有各自的分 布函数, 分别记为 FX x, FY y, 依次称为二维随机
变量 (X,Y) 关于 X 和 Y的边缘分布函数.
茆诗松概率论与数理统计教程课件第三章 (3)
i 0
k
i 0
i 1
i!
e 1
2
i k 2
(k i )!
k
e 2
e
1
e k!
k! i k i 1 2 i 0 i! ( k i )!
e ( 1 2 ) k (1 2 ) k!
(1 2 )k ( 1 2 ) e k!
p( x, y )dxdy
| x y| z
dxdy
阴影部分面积
1 1 2 (1 z ) 2 2
2z z 2
所以Z=|X-Y|的密度函数为
pZ ( z ) FZ ' ( z ) 2(1 z ),
0 z 1
对某些常用的简单的函数g, 可利用“分布函数法” 导出pZ(z)和p(x,y)的关系式供我们直接使用.
解: 由题知
1 pX ( x ) e 2
x2 2
1 , pY ( y ) e 2
y2 2
,
x, y
所以由卷积公式有
1 pZ ( z ) pX ( x ) pY ( z x )dx e 2
x2 2
e
( z x )2 2
类似地, 我们可以求得n个独立变量的最大值和最小值的分 布函数.
例五. 设系统L由两个相互独立的子系统L1,L2连接而成,
连接的方式分别为:(1)串联, (2)并联, (3)备用(当系统 L1损坏时, 系统L2开始工作), 如图所示. 设L1和L2的寿 命分别为X,Y, 其概率密度分别为
e x , x 0 pX ( x ) 0, 其 它
2
k
i 0
i 1
i!
e 1
2
i k 2
(k i )!
k
e 2
e
1
e k!
k! i k i 1 2 i 0 i! ( k i )!
e ( 1 2 ) k (1 2 ) k!
(1 2 )k ( 1 2 ) e k!
p( x, y )dxdy
| x y| z
dxdy
阴影部分面积
1 1 2 (1 z ) 2 2
2z z 2
所以Z=|X-Y|的密度函数为
pZ ( z ) FZ ' ( z ) 2(1 z ),
0 z 1
对某些常用的简单的函数g, 可利用“分布函数法” 导出pZ(z)和p(x,y)的关系式供我们直接使用.
解: 由题知
1 pX ( x ) e 2
x2 2
1 , pY ( y ) e 2
y2 2
,
x, y
所以由卷积公式有
1 pZ ( z ) pX ( x ) pY ( z x )dx e 2
x2 2
e
( z x )2 2
类似地, 我们可以求得n个独立变量的最大值和最小值的分 布函数.
例五. 设系统L由两个相互独立的子系统L1,L2连接而成,
连接的方式分别为:(1)串联, (2)并联, (3)备用(当系统 L1损坏时, 系统L2开始工作), 如图所示. 设L1和L2的寿 命分别为X,Y, 其概率密度分别为
e x , x 0 pX ( x ) 0, 其 它
2
概率论与数理统计教程第3章
25 October 2013
第三章 多维随机变量及其分布
第4页
正态分布的可加性
若 X N( ),Y N( ), 且独立,
则 Z = X Y N(
注意: X Y 不服从 N( X Y N(
).
). ).
独立正态变量的线性组合仍为正态变量. (见下)
25 October 2013
(5) Cov(X, a) = 0.
(性质3.4.8) (性质3.4.9)
(6) Cov(aX, bY) = abCov(X, Y) .
25 October 2013
(7) Cov(X+Y, Z) = Cov(X, Z) + Cov(Y, Z). (性质3.4.10)
第三章 多维随机变量及其分布
第11页
第8页
讨论 X+Y 的方差
1. Var(XY) = Var(X)+ Var (Y) 2E[XE(X)][YE(Y)] 2. E[XE(X)][YE(Y)] = E(XY) E(X)E(Y) 3. 当X与Y独立时,E[XE(X)][YE(Y)] = 0. 4. 当X与Y独立时, Var(X Y) = Var(X)+ Var (Y) . 注意:以上命题反之不成立.
25 October 2013
第三章 多维随机变量及其分布
第1页
第三章 多维随机变量及其分布
§3.1 §3.2 §3.3 §3.4 §3.5 多维随机变量及其联合分布 边际分布与随机变量的独立性 多维随机变量函数的分布 多维随机变量的特征数 条件分布与条件期望
25 October 2013
第三章 多维随机变量及其分布
第2页
分布的可加性
[高等教育]概率论与数理统计第3讲
4
定义1.1 在不变的条件下, 重复进行n次试验, 事件A发 生的频率稳定地某一常数p附近摆动, 且一般 说来, n越大, 摆动幅度越小, 则称常数p为事件 A的概率, 记作P(A). 但这不是概率的数学上的定义, 而只是描述了 一个大数定律.
5
历史上的掷硬币试验
试验者 德.摩尔根 蒲丰 皮尔逊 皮尔逊 维尼 抛掷次数 正面出现次 正面出现频 数m 率m/n n 2048 4040 12000 24000 30000 1061 2048 6019 12012 14994 0.518 0.5069 0.5016 0.5005 0.4998
2955
3271 3722 16146
2889
3073 3509 15248
.56
51.56 51.47 51.48
49.44
48.44 48.53 48.52
8
概率的古典定义(概率的古典概型) 有一类试验的特点是: 1,每次试验只有有限种可能的试验结果 2,每次试验中,各基本事件出现的可能性完全 相同. 具这两个特点的试验称为古典概型试验. 在古典概型的试验中, 如果总共有n个可能的 试验结果, 因此每个基本事件发生的概率为 1/n, 如果事件A包含有m个基本事件, 则事件A 发生的概率则为m/n.
7
新生儿性别统计表
出生年份
新生儿 总数n 3670
新生儿分类数
男孩数m1 女孩数m2
频率(%)
男孩
51.31
女孩
48.69
1977
1883
1787
1978
1979
4250
4055
2177
2138
2073
1917
51.22
定义1.1 在不变的条件下, 重复进行n次试验, 事件A发 生的频率稳定地某一常数p附近摆动, 且一般 说来, n越大, 摆动幅度越小, 则称常数p为事件 A的概率, 记作P(A). 但这不是概率的数学上的定义, 而只是描述了 一个大数定律.
5
历史上的掷硬币试验
试验者 德.摩尔根 蒲丰 皮尔逊 皮尔逊 维尼 抛掷次数 正面出现次 正面出现频 数m 率m/n n 2048 4040 12000 24000 30000 1061 2048 6019 12012 14994 0.518 0.5069 0.5016 0.5005 0.4998
2955
3271 3722 16146
2889
3073 3509 15248
.56
51.56 51.47 51.48
49.44
48.44 48.53 48.52
8
概率的古典定义(概率的古典概型) 有一类试验的特点是: 1,每次试验只有有限种可能的试验结果 2,每次试验中,各基本事件出现的可能性完全 相同. 具这两个特点的试验称为古典概型试验. 在古典概型的试验中, 如果总共有n个可能的 试验结果, 因此每个基本事件发生的概率为 1/n, 如果事件A包含有m个基本事件, 则事件A 发生的概率则为m/n.
7
新生儿性别统计表
出生年份
新生儿 总数n 3670
新生儿分类数
男孩数m1 女孩数m2
频率(%)
男孩
51.31
女孩
48.69
1977
1883
1787
1978
1979
4250
4055
2177
2138
2073
1917
51.22
概率论与数理统计第四版第三章PPT课件
例2 设二维连续型随机变量( X , Y )具有概率密
度为:
ke(2x3y) x0,y0
f(x,y) 0
其它
1. 求常数 k ;
2. 求 F( x , y ) ;
3. 求 P{ X < Y }
休息 结束
解: 1. 求常数 k ;
y
ke(2x3y) x0,y0
f(x,y)
0
其它
x
Q f(u ,v)du dvF ( , )1
3) P{(X,Y)G} f (u,v)dudv G y
(X,Y)
G
x
休息 结束
4) 若 f ( x , y ) 在 ( x , y ) 处连续,则有:
2F( x, y) f( x, y)
xy
以上关于二维随机变量的讨论,可以 容易地推广到 n ( n > 2 )维随机变量的情 况。
休息 结束
第三章 多维随机变量及其分布
休息 结束
§3.1 二维随机变量
到现在为止,我们只讨论了一维随机变量 及其分布。 但有些随机现象用一个随机变量 来描述还不够,而需要用几个随机变量来描述。
休息 结束
在射箭时,命中点的位
置是由一对坐标( X, Y )来
确定的。
飞机的重心在空中的位置是
由三个随机变量( X,Y,Z )来
休息 结束
F(x2,y2)F(x1,y2)(F (x2,y1)F (x1,y1))
P{(X,Y)D} 0
y
( x1 , y2 ) ( x2 , y2 )
D
( x1 , y1 )
( x2 , y1 )
x
休息 结束
二维离散型随机变量的联合分布列 设二维离散型随机变量( X , Y )所有可
概率论与数理统计课件 第三章2
(2) 设连续型随机变量( X ,Y )的联合概率密度为 p( x, y), 边缘概率密度分别为 pX ( x), pY ( y),则有
X 和 Y 相互独立 p( x, y) pX ( x) pY ( y).
2019/4/3
第三章 多维随机变量及其分布
14
例1 设两个独立的随机变量 X 与Y 的分布律为
因此 ( X ,Y ) 的联合分布律为
Y X
2
4
1 0.18 0.12
3 0.42 0.28
2019/4/3
第三章 多维随机变量及其分布
16
例2 已知 ( X ,Y ) 的分布律为
( X ,Y ) (1,1) (1,2) (1,3) (2,1) (2,2)
111 1
pij
6
9 18
3
(1) 求 与 应满足的条件;
2019/4/3
第三章 多维随机变量及其分布
11
例2 设数 X 在区间 (0,1) 上随机地取值,当观察到 X x (0 x 1) 时,数 Y 在区间 (0, x) 上随机地取 值.求 Y 的概率密度 fY ( y).
2019/4/3
第三章 多维随机变量及其分布
12
三、随机变量的独立性
1.定义
3
2.二维正态分布
若二维随机变量 ( X,Y ) 具有概率密度
p( x, y)
1
e 1 2(1 ρ2
)
(
x
μ1 σ12
)2
2
ρ(
x
μ1 )( σ1σ2
y
μ2
)
(
y
μ2 σ22
)2
2πσ1σ2 1 ρ2
其中μ1, μ2 , σ1, σ2 , ρ 均为常数,且σ1 0, σ2 0, 1 ρ 1.
X 和 Y 相互独立 p( x, y) pX ( x) pY ( y).
2019/4/3
第三章 多维随机变量及其分布
14
例1 设两个独立的随机变量 X 与Y 的分布律为
因此 ( X ,Y ) 的联合分布律为
Y X
2
4
1 0.18 0.12
3 0.42 0.28
2019/4/3
第三章 多维随机变量及其分布
16
例2 已知 ( X ,Y ) 的分布律为
( X ,Y ) (1,1) (1,2) (1,3) (2,1) (2,2)
111 1
pij
6
9 18
3
(1) 求 与 应满足的条件;
2019/4/3
第三章 多维随机变量及其分布
11
例2 设数 X 在区间 (0,1) 上随机地取值,当观察到 X x (0 x 1) 时,数 Y 在区间 (0, x) 上随机地取 值.求 Y 的概率密度 fY ( y).
2019/4/3
第三章 多维随机变量及其分布
12
三、随机变量的独立性
1.定义
3
2.二维正态分布
若二维随机变量 ( X,Y ) 具有概率密度
p( x, y)
1
e 1 2(1 ρ2
)
(
x
μ1 σ12
)2
2
ρ(
x
μ1 )( σ1σ2
y
μ2
)
(
y
μ2 σ22
)2
2πσ1σ2 1 ρ2
其中μ1, μ2 , σ1, σ2 , ρ 均为常数,且σ1 0, σ2 0, 1 ρ 1.
概率论与数理统计 第三章课件
Y X
x1 x2 … xi …
y1 y2 … yj …
p11 p12 … p1j … p21 p22 … p2j … … … ……… pi1 pi2 … pi j … … … ………
概率论与数理统计 第三章
联合分布列的基本性质 (1) pij 0, i, j = 1, 2,… (非负性)
(2) pij = 1. (正则性)
xy
F(x,y)= p(u,v)dvdu --
则称 (X, Y) 为二维连续型随机变量。 称p(x, y) 为联合密度函数。
概率论与数理统计 第三章
联合密度函数的基本性质
(1) p(x, y) 0. (非负性)
(2)
p(x,y)dxdy1
(正则性)
- -
注意: P(X,Y) D p(x,y)dxdy
若X, Y是两个定义在同一个样本空间上的 随机变量,则称(X, Y) 是两维随机变量.
➢ 同理可定义 n 维随机变量 (随机向量).
概率论与数理统计 第三章
3.1.2 联合分布函数
定义3.1.2 (以下仅讨论两维随机变量)
任对实数 x 和 y, 称 F(x, y) = P( X x, Y y)
设随机变量 X 在 1,2,3 , 4 四个整数中等可 能地取值,另一个随机变量 Y 在 1到X 中等可能 地取一整数值。试求(X, Y)的联合分布列.
概率论与数理统计 第三章
3.1.4 联合密度函数
设二维随机变量(X, Y) 的分布函数为 F(x, y),若存在 非负可积函数 p(x, y),使得
F(, y) = F(x, ) =0, F(+, +) = 1. (3) F(x, y) 关于 x 和 y 分别右连续. (右连续性) (4) 当a<b, c<d 时,有 (非负性)
概率论与数理统计(茆诗松)第三章讲义
0 x y 0
1 xy ; dy = 2 2
1
1 x 0 2 dy = y ; 2 x 2 11 11 x 当 0 ≤ x < 2 , y ≥ 1 时, F ( x, y ) = ∫ dx ∫ dy = ;当 x ≥ 2 , y ≥ 1 时, F ( x, y ) = ∫ dx ∫ dy = 1 . 0 0 0 0 2 2 2
∫ ∫
+∞ +∞
−∞ −∞
p( x, y )dxdy = 1 .
二维连续随机变量的性质: (1) (X, Y ) 在区域 G 上取值的概率等于密度函数在 G 上的二重积分,P{( X , Y ) ∈ G} = ∫∫ p( x, y )dxdy ;
G
′′ ( x, y ) . (2)在密度函数 p (x, y) 的连续点处, p ( x, y ) = Fxy
§3.1
3.1.1 多维随机变量
多维随机变量及其联合分布
则称 (X1, X2, …, Xn) 是 n 维随机变量 定义 设 X1, X2, …, Xn 是定义在同一个样本空间Ω上的 n 个随机变量, 或随机向量(Random Vector) . 特别是当 X 与 Y 是定义在同一个样本空间Ω上的两个随机变量,则 (X, Y ) 是二维随机变量.在本章中 主要讨论二维随机变量,所得结论通常可以自然推广到一般的 n 维随机变量. 3.1.2 定义 联合分布函数
若二维随机变量 (X, Y ) 的全部可能取值是有限个或可列个,则称之为二维离散随机变量. 定义 设 X 的全部可能取值是 x1, x2, …,Y 的全部可能取值是 y1, y2, …,且 P{X = xi , Y = yj} = p(xi, yj) = pij , i, j = 1, 2, …, 称之为 (X, Y ) 的联合概率分布函数(Joint Probability Distribution Function) . 通常将联合概率分布写成表格形式,又称为联合分布列.
1 xy ; dy = 2 2
1
1 x 0 2 dy = y ; 2 x 2 11 11 x 当 0 ≤ x < 2 , y ≥ 1 时, F ( x, y ) = ∫ dx ∫ dy = ;当 x ≥ 2 , y ≥ 1 时, F ( x, y ) = ∫ dx ∫ dy = 1 . 0 0 0 0 2 2 2
∫ ∫
+∞ +∞
−∞ −∞
p( x, y )dxdy = 1 .
二维连续随机变量的性质: (1) (X, Y ) 在区域 G 上取值的概率等于密度函数在 G 上的二重积分,P{( X , Y ) ∈ G} = ∫∫ p( x, y )dxdy ;
G
′′ ( x, y ) . (2)在密度函数 p (x, y) 的连续点处, p ( x, y ) = Fxy
§3.1
3.1.1 多维随机变量
多维随机变量及其联合分布
则称 (X1, X2, …, Xn) 是 n 维随机变量 定义 设 X1, X2, …, Xn 是定义在同一个样本空间Ω上的 n 个随机变量, 或随机向量(Random Vector) . 特别是当 X 与 Y 是定义在同一个样本空间Ω上的两个随机变量,则 (X, Y ) 是二维随机变量.在本章中 主要讨论二维随机变量,所得结论通常可以自然推广到一般的 n 维随机变量. 3.1.2 定义 联合分布函数
若二维随机变量 (X, Y ) 的全部可能取值是有限个或可列个,则称之为二维离散随机变量. 定义 设 X 的全部可能取值是 x1, x2, …,Y 的全部可能取值是 y1, y2, …,且 P{X = xi , Y = yj} = p(xi, yj) = pij , i, j = 1, 2, …, 称之为 (X, Y ) 的联合概率分布函数(Joint Probability Distribution Function) . 通常将联合概率分布写成表格形式,又称为联合分布列.
概率论与数理统计(柴中林)第3讲
n
由公式
P ( B ) P ( Ai ) P ( B|Ai )
i 1
n
不难看出: “全部概率” P(B),可分成多 个 “部分概率” P( Ai B) 之和。 它的理论和实用意义在于: 在较复杂情况下,直接计算P(B)不容易, 但总可以适当地构造一组两两互斥的Ai , 使B 伴随着某个Ai 的出现而出现,且每个 P( Ai B) 容易计算。可用所有 P( Ai B) 之和计算 P(B)。
贝叶斯公式
P ( Ai | B)
P ( Ai ) P ( B|Ai )
P ( A ) P ( B|A )
j 1 i i
n
在贝叶斯公式中,P(Ai)和P(Ai |B)分别称为 原因的验前概率和验后概率。 P(Ai) ( i =1, 2,…, n ) 是在没有进一步的信息 (不知道事件B是否发生) 的情况下,人们对 诸事件发生可能性大小的认识。
代入数据计算,得 P(A | B)= 0.1066。 现在来分析一下结果的意义:
(1). 该试验对于诊断一个人是否患有癌症有无 意义? 如果不做试验,一个人患癌症的概率是 P(A)=0.005 。 若试验后呈阳性反应,则此人患癌症的概 率为 P(A|B)= 0.1066 。 概率从0.005增加到0.1066, 约增加了21倍。
解:设 A = {抽查的人患有癌症}, B = {试验结果是阳性}。
则 A 表示“抽查的人不患癌症”。 已知:
P( A) 0.005, P( A ) 0.995 , P( B | A) 0.95, P( B | A ) 0.04 。
求 P(A|B)。
由贝叶斯公式,得
P( A) P( B | A) P( A | B) , P( A) P( B | A) P( A ) P( B | A )
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6年总计 31394 16146 15248
频率(%) 男孩 女孩 51.31 48.69 51.22 48.78 52.73 47.27 50.56 49.44 51.56 48.44 51.47 48.53 51.48 48.52
8
概率的古典定义(概率的古典概型) 有一类试验的特点是: 1,每次试验只有有限种可能的试验结果 2,每次试验中,各基本事件出现的可能性完全 相同. 具这两个特点的试验称为古典概型试验. 在古典概型的试验中, 如果总共有n个可能的 试验结果, 因此每个基本事件发生的概率为 1/n, 如果事件A包含有m个基本事件, 则事件A 发生的概率则为m/n.
11
排列和组合 在古典概型的概率的计算中困难的是计算一 事件包含的基本事件的数目, 因此需要排列和 组合的知识. 乘法法则: 如果一件事情可以分为两步做, 第 一步有n种选择, 在第一步中的每一种选择中, 第二步有m种选择, 则整件事情共有
mn种选择
12
放回抽样
假设一副牌有52张, 将它们编号为1,2,…,52. 每次抽出一张观察后再放回去(这样下一次这 张牌仍有机会被抽到), 这叫放回抽样. 假设共 抽了5次, 共有多少种可能的抽法? 第一次有52种抽法, 在第一次的每一种抽法中, 第二次又有52种抽法, …, 因此抽5次共有
3
概率的统计定义
概率的统计定义并非严格的数学上的定义, 而 只是大数定律的一个描述. 在n次重复试验中, 如果事件A发生了m次, 则 m/n称为事件A发生的频率. 同样若事件B发生 了k次, 则事件B发生的频率为k/n. 如果A是必 然事件, 有m=n, 即必然事件的频率是1, 当然 不可能事件的频率为0. 如果A与B互不相容, 则事件A+B的频率为(m+k)/n, 它恰好等于两个 事件的频率的和m/n+k/n, 这称之为频率的可 加性.
一般地, 从N个元素中抽取n个(nN), 共有
ANn
N(N1)(Nn1)
N! 种Biblioteka 法 (Nn)!如果N n,即将所有元素排成,一 称列 为
全排列 ,记作
PN ANN N!
14
不放回抽样(组合)
如果从N个元素中不放回抽样n个, 但不关心 其顺序, 比如说(1,2,3)和(3,2,1),(2,3,1)被视作 一样, 则称为组合, 因此, 组合的数目要比排列 的数目小n!倍, 记作
CN n N nA nN !n
N! (Nn)n !!
15
书上例1 袋内装有5个白球, 3个黑球, 从中任
两个球, 计算取出的两个球都是白球的概率.
解 : 组成试验的基本事件总
数n
C
2 5
3
,
假设事件 A {取到两个白球 }, 则 A的
基本事件数
m
C
2 5
,则
P(A)
9
定义 1.2 若试验结果一共由n个基本事件E1,E2,…,En组 成, 并且这些事件的出现具有相同的可能性, 而事件A由其中某m个基本事件E1,E2,…,Em组 成, 则事件A的概率可以用下式计算:
P(A) 有 试利 验于 的 A的基基本本事事件件总 数m数 n
10
简单的例 掷一枚硬币的试验, 基本事件为正面和反面, 而且由于硬币的对称性, 因此出现正面和反面 的概率一样, 都是1/2. 掷一次骰子的试验, 基本事件有6个, 因此每个 基本事件的概率为1/6, 则 P{奇数点}=3/6=1/2, P{小于3}=P{1,2}=2/6=1/3 等等.
7
新生儿性别统计表
出生年份
新生儿 总数n
新生儿分类数
男孩数m1 女孩数m2
1977 3670 1883 1787
1978 4250 2177 2073
1979 4055 2138 1917
1980 5844 2955 2889
1981 6344 3271 3073
1982 7231 3722 3509
4
定义1.1 在不变的条件下, 重复进行n次试验, 事件A发 生的频率稳定地某一常数p附近摆动, 且一般 说来, n越大, 摆动幅度越小, 则称常数p为事件 A的概率, 记作P(A).
但这不是概率的数学上的定义, 而只是描述了 一个大数定律.
5
历史上的掷硬币试验
试验者 德.摩尔根
抛掷次数 正面出现次 正面出现频
概率论与数理统计
第3讲
本文件可从网址 上下载 (单击ppt讲义后选择'概率论'子目录)
1
概率
2
每一个事件都有它的发生概率 即给定事件A, 存在着一个正数P 与之对应, 称 之为事件A的概率, 记作P(A)或P{A}. 最高的发生概率为1, 表示必然发生. 最低的概率为0, 表示不可能发生. 而一般的随机事件的概率介于0与1之间. 这里只是概率的数学上的规定, 其实就是任何 一个事件到实数轴上的[0,1]区间的映射. 但怎样获得切合实际的一个事件的概率呢?
5252525252=525 种抽法. 一般地, 从n个元素中进行m次放回抽样, 则共 有nm种抽法.
13
不放回抽样(排列)
还是这52张牌, 每次抽出一张, 但不放回, 则第 二次抽时只有51张牌, 第三次就只有50张牌. 如果这样抽5次, 就共有
5251504948=52!/47! 种抽法
m n
C
2 5
C
2 8
5 4 1 2 1 2 8 7
5 0.357 14
16
例2 一批产品共200个, 废品有6个, 求(1)这批 产品的废品率; (2)任取3个恰有一个是废品 的概率;(3)任取3个全非废品的概率 解求的设概P(率A),,则P(A1), P(A0)分别表示(1),(2),(3)中所
n
数m
率m/n
2048
1061
0.518
蒲丰
4040
2048
0.5069
皮尔逊
12000
6019
0.5016
皮尔逊
24000
12019
0.5005
维尼
30000
14994
0.4998 6
概率的稳定性是概率的经验基础
但并不是说概率决定于经验. 一个事件发生的 概率完全决定于事件本身的结构, 指试验条件, 是先于试验而客观存在的. 概率的统计定义仅仅指出了事件的概率是客 观存在的, 但并不能用这个定义计算P(A). 实 际上, 人们是采取一次大量试验的频率或一系 列频率的平均值作为P(A)的近似值的.例如,对 一个妇产医院6年出生婴儿的调查中, 可以看 到生男孩的频率是稳定的, 约为0.515