第3.2 条件分布与二维随机变量的独立性
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例如,考虑某大学的全体学生,从其中随 机抽取一个学生,分别以X和Y 表示其体重和 身高 . 则X和Y都是随机变量,它们都有一定 的概率分布. 身高Y 体重X
的分布
身高Y 的分布
体重X
现在若限制1.7<Y<1.8(米), 在这个条件下 去求X的条件分布,这就意味着要从该校的学 生中把身高在1.7米和1.8米之间的那些人都挑 出来,然后在挑出的学生中求其体重的分布. 容易想象,这个分布与不加这个条件 时的分布会很不一样.
解: P(X>1|Y=y) 1 f X |Y ( x | y)dx
为此, 需求出 f X |Y ( x | y )
由于
e
x y y
fY ( y) f ( x, y)dx
0
e ,
于是对y>0,
y
e y
y 0 y
dx
e
y
[ ye
x y
]
0
f ( x, y ) e x y f X |Y ( x | y ) , x0 fY ( y ) y x y e 故对y>0, dx P(X>1|Y=y) 1 y
P( X x
i 1
i
|Y yj) 1
例1 一射手进行射击,击中目标的概率为 p,(0<p<1), 射击进行到击中目标两次为 止. 以X 表示首次击中目标所进行的射击次 数,以Y 表示总共进行的射击次数. 试求X 和Y的联合分布列及条件分布列. 解:依题意,{Y=n} 表示在第n次射击时击中 目标,且在前n-1次射击中有一次击中目标. {X=m}表示首次击中目标时射击了m次
则称X,Y相互独立 . 它表明,两个r.v相互独立时,它们的联合 分布函数等于两个边缘分布函数的乘积 .
若 (X,Y)是连续型r.v ,则上述独立性的 定义等价于: 对任意的 x, y, 有
f ( x, y) f X ( x) fY ( y)
则称X,Y相互独立 . 其中 f ( x, y )是X,Y的联合密度, f X ( x), fY ( y)分别是X的 边缘密度和Y 的边缘密度 .
例如,在条件分布中体重取大值的概 率会显著增加 .
一、离散型r.v的条件分布列 类似定义在X=xi条件下 实际上是第一章讲过的条件概率概念在 随机变量Y 的条件分布列. 另一种形式下的重复. 定义1 设 (X,Y) 是二维离散型随机变量, 对于固定的 j,若P(Y=yj)>0,则称 P ( X x i , Y y j ) pi j ,i=1,2, … P(X=xi|Y=yj)= P (Y y j ) p j
对于任意给定的值x(0<x<1),在X=x的条件 来自百度文库,Y的条件概率密度为
1 , fY | X ( y | x ) 1 x 0, x y 1 其它
X和Y的联合密度为
f ( x, y) f X ( x ) fY |X ( y | x )
1 , 0 x y 1 1 x 0, 其它
作为条件的那个r.v,认为取值是 为在Y=yj条件下随机变量X的条件分布列. 给定的,在此条件下求另一r.v的 概率分布.
条件分布列是一种概率分布列,它具有 概率分布列的一切性质. 正如条件概率是一 种概率,具有概率的一切性质.
例如:P ( X xi | Y y j ) 0, i=1,2, …
已知边缘密度、 条件密度,求 联合密度
于是得Y的概率密度为
fY ( y) f ( x, y)dx
y 1 dx ln( 1 y ), 0 1 x 0,
0 y 1 其它
随机变量的独立性是概率论中的一个重要概念 两随机变量独立的定义是: 设 X,Y是两个r.v,若对任意的x,y,有
我们来解释一下定义的含义:
f ( x, y ) 以 f X |Y ( x | y ) 为例 fY ( y )
将上式左边乘以 dx , 右边乘以 (dx dy)/dy 即得 f ( x, y)dxdy f X |Y ( x | y)dx fY ( y)dy
P{x X x dx, y Y y dy} P{ y Y y dy}
m 1 2 ………………. n-1 n
n次射击
击中
击中
m 1 2 ………………. n-1 n
n次射击 不论m(m<n)是多少, P(X=m,Y=n)都应等于
2
击中 每次击中目标的概率为 p
击中
P(X=m,Y=n)=?
n2
P ( X m, Y n) p (1 p)
2
由此得X和Y的联合分布列为
FX |Y (u | y) P ( X u | Y y)
f X |Y ( x | y)dx
u
例2 设(X,Y)的概率密度是 x y y e e , 0 x , 0 y f ( x, y ) y 0 , 其它
求 P(X>1|Y=y)
运用条件概率密度,我们可以在已知某 一随机变量值的条件下,定义与另一随机变 量有关的事件的条件概率.
即: 若(X,Y)是连续型r.v, 则对任一集合A, 特别,取 A (, u),
P ( X A | Y y) f X |Y ( x | y)dx
A
定义在已知 Y=y下,X的条件分布函数为
y
( x y )
dx e ,
y >0
即: xe x , x 0 f X ( x) 0, 其它
e y , y 0 fY ( y ) 0, 其它
若(X,Y)的概率密度为
2 , 0 x y ,0 y 1 f ( x, y ) 其它 0,
解: 设X为甲到达时刻,Y为乙到达时刻
以12时为起点,以分为单位,依题意,
X~U(15,45), Y~U(0,60)
解: 设X为甲到达时刻, Y为乙到达时刻
以12时为起点,以分为单位,依题意, X~U(15,45), Y~U(0,60) 1 1 , 15 x 45 , 0 x 60 f X ( x ) 30 fY ( y ) 60 0, 其它 0, 其它 由独立性 先到的人等待另一人 甲先到 1 到达的时间不超过5分钟 x 45,0 y 60 的概率 , 15 f ( x, y ) 的概率 1800 0, 其它 所求为P( |X-Y | 5) 及P(X<Y)
若 (X,Y)是离散型r.v ,则上述独立性的 定义等价于: 对(X,Y)的所有可能取值(xi, yj),有
P ( X xi , Y y j ) P ( X xi ) P (Y y j )
即
则称X和Y相互独立.
pij pi p j
例1 设(X,Y)的概率密度为
xe f ( x, y )
定义2 设X和Y的联合概率密度为 f (x,y), 边缘概率密度为 f X ( x), fY ( y),则对一切使
f X ( x) 0 的x , 定义已知 X=x下,Y 的条件
密度函数为
f ( x, y ) fY | X ( y | x ) f X ( x) 同样,对一切使 fY ( y) 0的 y, 定义 f ( x, y ) f X |Y ( x | y ) fY ( y ) 为已知 Y=y下,X的条件密度函数 .
P{x X x dx | y Y y dy}
f X |Y ( x | y)dx
P{x X x dx | y Y y dy}
f 换句话说,对很小的dx和 dy, X |Y ( x | y)dx
表示已知 Y取值于y和y+dy之间的条件下, X取值于x和x+dx之间的条件概率.
e
x y
e 1 y 1
例3 设(X,Y)服从单位圆上的均匀分布,概率 1 密度为 , x2 y2 1 f ( x , y ) 求 fY |X ( y | x )
0, 其它
解:X的边缘密度为
f X ( x)
当|x|<1时,有
2 1 x 2 , | x | 1 f ( x, y )dy 0, | x | 1
( x y )
, x 对一切x, y, 均有: 0, y 0 f ( x, y) f X ( x) fY ( y) 0, 其它 故X,Y 独立
( x y )
问X和Y是否独立?
解:X ( x) xe f 0
fY ( y) xe
0
dy xe x , x>0
P( X x, Y y) P ( X x ) P (Y y)
则称X,Y相互独立 . 两事件A,B独立的定义是: 若P(AB)=P(A)P(B) 则称事件A,B独立 .
用分布函数表示,即
设 X,Y是两个r.v,若对任意的x,y,有
F ( x, y) FX ( x)FY ( y)
第二讲 条件分布与随机变量的独立性
条件分布 在第一章中,我们介绍了条件概率的概念 .
在事件B发生的条件下事件A发生的条件概率 P ( AB) P ( A | B) P ( B) 推广到随机变量 设有两个r.v X,Y , 在给定Y取某个或某 些值的条件下,求X的概率分布. 这个分布就是条件分布.
2 n2
m 1 2
n m 1
P ( X m , Y n)
n m 1
(1 p)
n2
m=1,2, …
Y的边缘分布列是:
P{Y n} P ( X m, Y n) p (1 p)
2 m 1 m 1 n 1 n2
n 1
(n 1) p (1 p)
当m=1,2, …时,
P (Y n | X m )
P{ X m, Y n} P{ X m}
p (1 p) m 1 p(1 p)
2
n2
p(1 p)
n m 1
,
n=m+1,m+2, …
二、连续型r.v的条件分布 设(X,Y)是二维连续型r.v , 由于对任意 x, y, P(X=x)=0, P(Y=y)=0 ,所以不能直接 用条件概率公式得到条件分布,下面我们 直接给出条件概率密度的定义.
2
n2
n=2,3, …
于是可求得: 当n=2,3, …时,
P ( X m | Y n)
P{ X m, Y n} P{Y n}
2 n2
联合分布列 边缘分布列
p (1 p) 2 n2 (n 1) p (1 p) 1 , m=1,2, …,n-1 n1
f ( x , y) 1 fY |X ( y | x ) f X ( x ) (2 ) 1 x 2 1 , 2 1 x2 y 1 x2 2 1 x
例4 设r.vX在区间(0,1)均匀分布,当观察到 X=x(0<x<1)时,r.vY在区间(x,1)上均匀分布. 求Y 的概率密度. 解:依题意,X具有概率密度 1, 0 x 1 f X ( x) 0, 其它
P ( X m, Y n) p (1 p)
n2
n=2,3, …; m=1,2, …, n-1
为求条件分布,先求边缘分布.
X的边缘分布列是:
P{ X m}
(1 p) m 1 p p(1 p) 1 (1 p)
2
n m 1
p (1 p) p 2
情况又怎样?
解: f X ( x) 2dy 2(1 x), x
fY ( y) 2dx 2 y,
0 y
1
0<x<1
0<y<1
由于存在面积不为0的区域, f ( x , y ) f X ( x ) fY ( y ) 故X和Y不独立 .
例2 甲乙两人约定中午12时30分在某地会面. 如果甲来到的时间在12:15到12:45之间是均匀 分布. 乙独立地到达,而且到达时间在12:00到 13:00之间是均匀分布. 试求先到的人等待另一 人到达的时间不超过5分钟的概率. 又甲先到的 概率是多少?