2.条件分布&相互独立的随机变量
2-2-3随机变量的独立性,条件分布
x
FX Y ( x y) pX Y ( x y) d x
x
[ p(x, y)
pY ( y)]d x.
y
FY X ( y x) pY X ( y x) d y
y
[ p(x, y)
pX (x)]d y.
备份题
例1 设
(X,Y )
~
p( x,
y)
Cy(1 0,
x),
0 x 1,0 其 它.
则称X和Y相互独立.
例1 已知 ( X ,Y ) 的分布律为
( X ,Y ) (1,1) (1,2) (1,3) (2,1) (2,2)
111 1
pij
6
9 18
3
(1) 求与应满足的条件;
(2) 若 X 与 Y 相互独立,求 与 的值.
(2,3)
解 将 ( X ,Y ) 的分布律改写为
Y X
1
1
1
6
1
2
3
p• j P{Y yj } 1 2
2 1 9
1
9
3 pi• P{ X xi }
1
1
18
3
1
3
1
18
2
3
(1)由分布律的性质知
0,
0,
2
3
1,
故与应满足的条件是 : 0, 0 且 1 .
3
(2) 因为 X 与 Y 相互独立, 所以有
pij pi• p• j , (i 1,2; j 1,2,3)
xe(x y)dy xe x
0
x>0
pY ( y) 0 xe( x y)dx e y
y >0
即:
条件分布.
在第一章中,我们介绍了条件概率的概念 . )()()|(B P AB P B A P 在事件B 发生的条件下事件A 发生的条件概率 推广到随机变量设有两个r.v X ,Y , 在给定Y 取某个或某些值的条件下,求X 的概率分布.这个分布就是条件分布.例如,考虑某大学的全体学生,从其中随机抽取一个学生,分别以X和Y 表示其体重和身高 . 则X和Y都是随机变量,它们都有一定的概率分布.体重X 身高Y体重X的分布身高Y的分布现在若限制1.7<Y<1.8(米),在这个条件下去求X的条件分布,这就意味着要从该校的学生中把身高在1.7米和1.8米之间的那些人都挑出来,然后在挑出的学生中求其体重的分布.容易想象,这个分布与不加这个条件时的分布会很不一样.例如,在条件分布中体重取大值的概率会显著增加 .一、离散型r.v 的条件分布 实际上是第一章讲过的条件概率概念在另一种形式下的重复. 定义1 设 (X ,Y ) 是二维离散型随机变量,对于固定的 j ,若P (Y =y j )>0,则称 为在Y =y j 条件下随机变量X 的条件概率函数. P(X =x i |Y =y j )= )(),(j j i y Y P y Y x X P ===j j i p p ∙=,i =1,2, … 类似定义在X =x i 条件下随机变量Y 的条件概率函数.作为条件的那个r.v ,认为取值是 给定的,在此条件下求另一r.v 的概率分布.条件分布是一种概率分布,它具有概率分布的一切性质. 正如条件概率是一种概率,具有概率的一切性质.,0)|(≥==j i y Y x X P 例如: 1)|(1===∑∞=i j i y Y xX P i =1,2, …例1 一射手进行射击,击中目标的概率为 p ,(0<p <1), 射击进行到击中目标两次为 止. 以X 表示首次击中目标所进行的射击次数,以Y 表示总共进行的射击次数. 试求X 和Y 的联合分布及条件分布.解:依题意,{Y =n } 表示在第n 次射击时击中目标,且在前n -1次射击中有一次击中目标. {X =m }表示首次击中目标时射击了m 次n 次射击 击中2 n n-1 1 ……………….m 击中22)1(),(--===n p p n Y m X P n =2,3, …; m =1,2, …, n -1由此得X 和Y 的联合概率函数为 不论m (m <n )是多少,P (X =m ,Y =n )都应等于22)1(),(--===n p p n Y m X P n 次射击 击中 2 n n-1 1 ……………….m 击中每次击中目标的概率为 p P (X =m ,Y =n )=?为求条件分布,先求边缘分布. X 的边缘概率函数是:∑∞+=====1),(}{m n n Y m X P m X P m =1,2, …∑∞+=--=122)1(m n n p p ∑∞+=--=122)1(m n n p p )1(1)1(212p p p m ---=-+1)1(--=m p pY 的边缘概率函数是:∑-=====11),(}{n m n Y m X P n Y P n =2,3, …∑-=--=1122)1(n m n p p 22)1()1(---=n p p n于是可求得: )|(n Y m X P ==2222)1()1()1(-----=n n p p n p p ,11-=n 当n =2,3, …时,m =1,2, …,n -1 }{},{n Y P n Y m X P ====联合分布 边缘分布n =m +1,m +2, …当m =1,2, …时,}{},{m X P n Y m X P ====122)1()1(----=m n p p p p ,)1(1---=m n p p )|(m X n Y P ==二、连续型r.v的条件分布设(X,Y)是二维连续型r.v,由于对任意x, y, P(X=x)=0, P(Y=y)=0 ,所以不能直接用条件概率公式得到条件分布,下面我们直接给出条件概率密度的定义.)(),()|(|x f y x f x y f X X Y =定义2 设X 和Y 的联合概率密度为 f (x,y ),边缘概率密度为,则对一切使 )(),(y f x f Y X 0)(>x f X 的x , 定义已知 X =x 下,Y 的条件 密度函数为 同样,对一切使 的 y , 定义)(),()|(|y f y x f y x f Y Y X =0)(>y f Y 为已知 Y =y 下,X 的条件密度函数 .我们来解释一下定义的含义:将上式左边乘以 dx , 右边乘以 (dx dy )/dy 即得 dyy f dxdy y x f dx y x f Y Y X )(),()|(|=}{},{dy y Y y P dy y Y y dx x X x P +≤≤+≤≤+<≤≈}|{dy y Y y dx x X x P +<≤+≤≤=)(),()|(|y f y x f y x f Y Y X =以 为例dxy x f Y X )|(|}|{dy y Y y dx x X x P +<≤+≤≤≈换句话说,对很小的dx 和 dy ,表示已知 Y 取值于y 和y+dy 之间的条件下,X 取值于x 和x+dx 之间的条件概率.dx y x f Y X )|(|例2 设(X ,Y )服从单位圆上的均匀分布,概率密度为 ⎪⎩⎪⎨⎧≤+=其它,01,1),(22y x y x f π)|(|x y f X Y 求 ⎪⎩⎪⎨⎧>≤-==⎰∞∞-1||,01||,12),()(2x x x dy y x f x f X π解: (X ,Y ) 关于X 的边缘密度为当|x |<1时,有)(),()|(|x f y x f x y f X X Y =21)2(1x -=ππ,1212x-=2211x y x -≤≤--)|(|x y f X Y ⎪⎩⎪⎨⎧-≤≤---=取其它值y x y x x ,011,121222即 当|x |<1时,有X 作为已知变量这里是 y 的取值范围X 已知下Y 的条件密度前面,我们已经知道,二维正态分布的两个边缘密度仍是正态分布.可以证明,对二维正态分布,已知X=x下,Y 的条件分布,或者已知Y=y下,X的条件分布都仍是正态分布.留作练习.运用条件概率密度,我们可以在已知某一随机变量值的条件下,定义与另一随机变量有关的事件的条件概率.dx y x f y Y A X P AY X ⎰==∈)|()|(|定义在已知 Y =y 下,X 的条件分布函数为)|()|(|y Y u X P y u F Y X =≤=特别,取 ),,(u A -∞=dx y x f uY X ⎰∞-=)|(|即: 若(X ,Y )是连续型r.v , 则对任一集合A ,求 P (X >1|Y =y ) 例3 设(X ,Y )的概率密度是⎪⎩⎪⎨⎧∞<<∞<<=--其它,00,0,),(y x y e e y x f y y x 解: ⎰∞=1|)|(dxy x f Y X P (X >1|Y =y ) 为此, 需求出 )|(|y x f Y X由于于是对y >0,)(),()|(|y f y x f y x f Y Y X =⎰∞∞-=dxy x f y f Y ),()(⎰∞--=0dx ye eyy x ∞---=][yx yyey e,ye -=∞<<y 0,yeyx -=0>x 故对y >0,P (X >1|Y =y ) ⎰∞-=1dx ye y x ∞--=1y x eye 1-=例4 设数X 在区间(0,1)均匀分布,当观察到 X=x (0<x <1)时,数Y 在区间(x ,1)上随机地取值.求Y 的概率密度.解:依题意,X 具有概率密度⎩⎨⎧<<=其它,010,1)(x x f X 对于任意给定的值x (0<x <1),在X=x 的条件下,Y 的条件概率密度为⎪⎩⎪⎨⎧<<-=其它,01,11)|(|y x xx y f X YX 和Y 的联合密度为)|()(),(|x y f x f y x f X Y X =⎪⎩⎪⎨⎧<<<-=其它,010,11y x x 于是得Y 的概率密度为⎰∞∞-=dxy x f y f Y ),()(⎪⎩⎪⎨⎧<<--=-=⎰其它,010),1ln(110y y y dx x 已知边缘密度、条件密度,求 联合密度我们已经知道,设 (X ,Y )是连续型r.v ,若对任意的x,y ,有)()(),(y f x f y x f Y X =则称X ,Y 相互独立. 由条件密度的定义: 可知,当X 与Y 相互独立时,),()|(|y f x y f Y X Y = 也可用此条件判别二维连续型r.v (X ,Y )的两个分量X 与Y 是否相互独立.)(),()|(|x f y x f x y f X X Y =)(),()|(|y f y x f y x f Y Y X =)()|(|x f y x f X Y X =对离散型r.v 有类似的结论,请同学们自行给出.。
条件概率,条件分布,条件期望
FX Y ( x y )
x
y
f X Y ( x y ) d x [ f ( x , y ) fY ( y )]d x .
y
x
FY X ( y x )
说明
fY X ( y x ) d y [ f ( x , y ) f X ( x )]d y .
定义
设二维随机变量( X ,Y ) 的概率密度为
f ( x , y ), ( X ,Y ) 关于 Y 的边缘概率密度为 fY ( y ).若 f ( x, y) 对于固定的 y , fY ( y ) 0, 则称 为在Y y fY ( y ) 的条件下 X 的条件概率密度 , 记为 f ( x, y) f X Y ( x y) . fY ( y )
为在事件A发生的条件下事件B发生的条件概率.
二
条件分布
一、离散型随机变量的条件分布
问题
考虑一大群人, 从其中随机挑选一个人 , 分别 用 X 和 Y 记此人的体重和身高 , 则X 和 Y 都是随 机变量, 他们都有自己的分布 .
现在如果限制Y 取值从1.5 m 到1.6 m , 在这个限制下求X 的 分布 .
一 条件概率 (Conditional Probability) 条件概率是指在事件A发生的条 件下,另一事件B发生的概率,记用 P(B|A).
引例 从所有有两个孩子的家庭随机抽取一个家庭记录男 孩女孩的情况。
则试验所有可能的结果为(男孩记为“b”,女孩记为“g”) (b,b) (b,g) (g,b) (g,g) 设A={ 至少一个男孩}, B ={ 至少一个女孩}, 考虑在事件A发生的条件下,事件B发生的概率。
定义 设 ( X ,Y ) 是二维离散型随机变量 , 对于固定
条件分布律条件分布函数条件概率密度
§3条件分布
( ) 对于条件密度函数 fY X y x 也有类似的性质.
目 录 前一页 后一页 退 出
第三章 随机变量及其分布
例 3 设随机变(X量 ,Y)的概率密度为 §3条件分布
f(x,y) 1 0,,|其 y|<.x它 ,0<x<1,
试 ( 1 ) f X ( 求 x )f Y , ( y ) ; ( 2 ) : f X | Y ( x |y )f Y , |X ( y |x ) ;
- x < y < x, 其它。
(3)
P{X1|Y0} P{X
1 2
,Y
0}
2
P{Y 0} y
yx
(1
1) 2
1 2
2
3
1 11
4
01 1
x
2
2
目 录 前一页 后一页 退 出
第三章 随机变量及其分布
§3条件分布
例4
设二维随机变量 (X, Y )服从二元正态分布:
( ) (X, Y )~ N 1, 2, 12, 22, r
第三章 随机变量及其分布
§3条件分布
F X |Y (x |y ) l 0 iP m {X P { y x - ,y- < Y < Y y y } }
F(x,y)-F(x,y-) l i0m F Y(y)-F Y(y-)
F (x, y)
l yli 0 im 0 [- F m y[F -(xY xff(,Y(yy(uy ,)v)))d- -uF F dY v((xy,y-- -x))]/ff2 ]/Y(2u(,yy))dddy uF
3.2.1,2(边际分布,条件分布)
r
y
y
2 r 2 − y2 , | y |≤ r 2 ϕY ( y ) = π r 0, | y |> r
-r −
r 2 − y2
r 2 − y2
r x
-r
说明: ( X ,Y) 的联合分布是均匀分布, 说明: 的联合分布是均匀分布, 但边缘分布都不是均匀分布。 但边缘分布都不是均匀分布。
2× 2 P (ξ1 = 1, ξ 2 = 1) = = 0.16 5× 5
ξ1
ξ2
0 1
0 0.36 0.24 0.6
1 0.24 0.6 0.16 0.1 0.4
边际分布相同 联合分布却不相同
联合分布可决定边际分布 边际分布不能决定联合分布
−1 0 1 X ~ 1 1 1 , 例 已知 X ,Y 的分布分别为 4 2 4
∴ pη |ξ ( y | x ) =
pξη ( x , y )
pξ ( x ) 称 pη|ξ ( y | x) 为在 ξ = x 条件下, 连续随机变量 η 条件下 ,
的条件概率密度函数。 的条件概率密度函数 。
Fη|ξ
∫ ( y | x) =
y −∞
pξη ( x , v )dv pξ ( x )
解: 1) 不放回”取球方式 ) 不放回” “
3× 2 P (ξ1 = 0, ξ 2 = 0) = = 0.3 5× 4 3× 2 P (ξ1 = 0, ξ 2 = 1) = = 0.3 5× 4
2× 3 P (ξ 1 = 1, ξ 2 = 0) = = 0.3 5× 4
2×1 P (ξ1 = 1, ξ 2 = 1) = = 0.1 5× 4
p12 L p22 L M pm 2 L p•2 L
条件概率及条件分布知识点整理
条件概率及条件分布知识点整理
1. 条件概率
条件概率是指在已知某一事件发生的条件下,其他事件发生的概率。
用符号表示为 P(A|B),表示在事件 B 已经发生的情况下,事件 A 发生的概率。
条件概率的计算公式为:
P(A|B) = P(A∩B) / P(B)
其中,P(A∩B) 表示事件 A 和事件 B 同时发生的概率,P(B) 表示事件 B 发生的概率。
2. 条件分布
在概率论和统计学中,条件分布是指在给定某个条件下,随机变量的概率分布。
条件分布可以通过条件概率来计算。
给定随机变量 X 和随机变量 Y,条件分布可以表示为
P(X|Y=y),表示在事件 Y=y 发生的条件下,随机变量 X 的概率分布。
条件分布的计算公式为:
P(X|Y=y) = P(X∩Y=y) / P(Y=y)
其中,P(X∩Y=y) 表示随机变量 X 和事件 Y=y 同时发生的概率,P(Y=y) 表示事件 Y=y 发生的概率。
3. 应用
条件概率和条件分布在概率论和统计学中有广泛的应用。
一些
常见的应用包括:
- 贝叶斯定理:用于计算后验概率,即在已知观测数据的情况下,更新先验概率。
- 马尔科夫链:用于建模状态转移过程,在给定当前状态的情
况下,预测未来状态的概率分布。
- 事件独立性检验:通过计算条件概率是否等于边缘概率,来判断事件是否独立。
- 条件随机场:用于序列标注、自然语言处理等任务,通过建模给定条件下,序列输出的概率分布。
以上是关于条件概率和条件分布的简要介绍。
在实际应用中,我们可以根据具体问题选择适当的概率模型和方法来进行推断和计算。
第2节 条件分布与独立性
解 (1)若( X , Y ) ~ N (0,0,1,1, ), 则
X |Y ( x | y) ~ N ( y,1 2 );
Y | X ( y | x) ~ N ( x,1 ).
2
推广
(2) 设( X ,Y ) ~ N ( 1 , 2 , , , ), 则
.
对于任意给定 xi , 如果 P{ X xi } 0, 则在X xi的
性质:pi| j 0,
p
i
i| j
1;
p j|i 0,
p
j
j|i
1.
问题 : 联合分布、边缘分布和条件分布有什么关系?
联合分布、边缘分布和条件分布的关系 X Y
y1 p11 p21 pi 1
y2 p12 p22 pi 2
2. 连续型变量独立的定义
设两个连续型随机变量 X 和 Y 的联合密度和边缘 密度分别为 f ( x, y )和 f X ( x )与fY ( y ). 则
严格地说 , 连续型随机变量X与Y 相互独立是指 f ( x, y ) f X ( x ) fY ( y ) 在整个平面上几乎处处(即面积为0的区域除外)成立.
3. 一般型随机变量的条件分布 设 X 是一随机变量, A 是一随机事件, 则由如下条件 概率确定的函数
F ( x A) P X x A , x 称为在A 发生条件下 X的条件分布函数 .
二、随机变量的独立性
随机变量独立的直观含义
随机变量 X 和 Y 相互独立的直观含义是指它 们之间在概率上相互毫无影响, 也就是说 , 任何一 个的取值都不会影响到另一个取值的分布.
pi 1
yj p1 j p2 i pij
二维随机变量的条件分布
同理,对一切使
的 xi,称
为给定X=xi条件下Y的条件分布律. 概率论与数理统计
❖ 2.条件分布律 1.概念
➢ 例3.5.2 设随机变量(X, Y) 的联合分布律以及边缘分布律为
➢ 求(1)求在X=1的条件下, Y的条件分布律; (2)求在Y=0的条件下, X的条件分布律.
概率论与数理统计
9
❖ 2.条件分布律 1.概念
并称F( x A) 为事件A发生的条件下X的条件分布函数.
概率论与数理统计
3
❖ 1.条件分布函数
1.概念
➢
例3.5.1 设X 服从区间(0, 1)上的均匀分布,求在
发生的条件下
X
的条件分布函数 F
x
X
1 2
.
x
1
2
➢ 解 X的概率密度函数以及分布函数分别为
1, 0 x 1, f ( x) 0, 其他,
➢ 例3.5.2求(1)求在X=1的条件下, Y的条件分布律; (2)求在Y=0的 条件下, X的条件分布律.
➢ 解 (1) 求在X=1的条件下, Y的条件分布律
P(Y 0 | X 1) P( X 1,Y 0) 0.030 6 P( X 1) 0.045 9
P(Y 1 | X 1) P( X 1,Y 1) 0.010 2 P( X 1) 0.045 9
下Y 的条件概率密度为
fY|X ( y | x)
f (x, y) .
fX (x)
➢ 注:在 fX|Y ( x | y) 中y固定, x变动, 是x的函数; 而在 fY|X ( y | x) 中x
固定y变动,是y的函数. 比如,当X和Y分别表示人的身高(单
位:厘米)与体重(单位:kg)时 fX|Y ( x | 60) 刻画了体重为60kg的
条件分布及其独立性
分析
设(X Y)是连续型随机向量 分布函数和密度函数分别为 F(x y)和f(x y) 我们希望考虑在Yy的条件下X的条件分布
由于{Yy}是一个零概率事件
P{X x|Y y} P{X x,Y y} P{Y y}
(328)
的分子、分母均为0 因而直接根据条件概率定义来考虑X的
(320)
对给定的x和y 如果事件{Xx}与事件{Yy}独立 则有
此时
F(x y) P{Xx Yy}P{Xx}P{Yy} FX(x)FY(y)
F(x|Yy)FX(x)
(321)
一、条件分布与独立性的一般概念
条件分布函数 对每个给定的实数x 我们记条件概率P{Xx|A}为F(x|A)
条件分布函数 对每个给定的实数x 我们记条件概率P{Xx|A}为F(x|A)
并称F(x|A)(x)为在A发生的条件下X的条件分布函数 设A{Yy} 且P{Yy}0 则有
F(x|Y y) P{X x,Y y} F(x,y) P{Y y} FY (y)
(1) pi|j 0 (2) pi| j 1 i
二、离散型随机变量的条件概率分布与独立性
条件概率分布
设(X Y)是二维离散型随机向量 其概率分布为
P{Xxi Yyj}pij i j1 2 则由条件概率公式 当P{Yyj}0时 有
P{X
xi |Yຫໍສະໝຸດ 1 x2 , π 0,
| x|1, 其他.
于是 对一切x(|x|1) 有
fY|X (y| x)
f (x, y) fX (x)
2
1, 1 x2 0,
| y| 1 x2, 其他.
例38(2) 设(X Y)是在D{(x y)|x2y21}上服从均匀分布 的随机向量 求fX|Y (x|y)
条件分布定义及其在随机过程中的应用
条件分布定义及其在随机过程中的应用在概率论中,条件分布是指在给定一些信息或事件时,随机变量的概率分布。
简单地说,条件分布是指事件发生的条件下,其他事件发生的概率。
条件分布在随机过程中有很多应用,本文将对条件分布的定义及其在随机过程中的应用进行深入讨论。
一、条件分布的定义条件分布的定义可以由条件概率来推导。
设A、B是两个事件,且P(B)>0,则在事件B发生的条件下事件A的条件概率为:P(A|B) = P(AB) / P(B)其中,P(AB)表示事件A和B同时发生的概率,P(B)表示事件B发生的概率。
如果X和Y是两个随机变量,P(Y=y)>0,则在Y=y的条件下X的条件概率为:P(X=x|Y=y) = P(X=x,Y=y) / P(Y=y)其中,P(X=x,Y=y)表示X=x和Y=y同时发生的概率,P(Y=y)表示随机变量Y=y的概率。
进一步地,可以得到X的条件分布函数:F(x|Y=y) = P(X≤x|Y=y)X的条件概率密度函数f(x|Y=y)则由条件分布函数求导得到:f(x|Y=y) = d/dx F(x|Y=y)二、条件分布的特性条件分布具有以下一些特性:1. 相互独立性:如果X和Y是独立的,则P(X=x|Y=y) =P(X=x)。
2. 概率归一性:条件概率和等于1,即∑ P(X=x|Y=y) = 1。
3. 乘法公式:由条件概率的定义可以得到乘法公式:P(X=x,Y=y) = P(Y=y|X=x)P(X=x)4. 全期望公式:设X和Y是两个随机变量,则:E(X) = E[E(X|Y)]其中,E(X|Y)表示在Y条件下X的期望。
三、条件分布的应用条件分布在随机过程中有很多应用,本节将讨论其中的一些应用。
1. 马尔可夫性质在马尔可夫链中,当前状态只与前一状态有关,在这种情况下,当前状态的条件分布只与前一状态有关。
具体地说,可以得到下面的等式:P(Xn+1 = j|Xn=i,Xn-1=k,Xn-2=l,…,X0) = P(Xn+1=j|Xn=i)其中,Xn表示第n个状态,Xn+1表示第n+1个状态,i、j、k、l是两个状态之间的节点。
条件分布简介
j 1,2,.
条件分布
一、离散随机变量的条件分布律
定义:
P{X xi ,Y y j } pij , i, j 1, 2,.
若对固定的yj , P{Y y j} 0, 则条件概率
P{X x | Y y } P{X xi ,Y y j } pij , i 1,2,.
i
j
P{Y y j}
p• j
称为在 Y y j 条件下随机变量 X 的条件分布律.
条件分布
一、离散型随机变量的条件分布律
Note
很显然,条件分布律也是分布律,即满足
1 P{X xi | Y y j } pij p• j 0
pij
2
P{X xi | Y y j }
i1
i1
p• j
•pj 1 p• j
条件分布律的意义在于,将随机变量在二维点集的取值 问题转化为在一维点集的取值.
条件分布
例1
解 由题意,X, Y 所有可能的取值均为 0, 1, 2.
22 22 16
P{X 0,Y 0}
34 81
P{X 0,Y 1} 222 C1 2 16
34
81
221 4
P{X 0,Y 2}
第三章 多维随机变量及其概率分布
第三节 条件分布
条件分布
前例中的产品抽样问题,昆虫产卵问题的研究都用到了乘法公式 来求联合分布律:
pij P{X xi ,Y y j } P{Y y j | X xi }P{X xi}
这里的条件概率实际上就是条件分布律.
若( X, Y ) 的分布已知,求在 X = x 的条件下 Y 的条件分布, 或在 Y = y 的条件下 X 的条件分布.
P{Y 0}
考研数学《概率论与数理统计》知识点总结
考研数学《概率论与数理统计》知识点总结引言《概率论与数理统计》是考研数学中的一个重要分支,它不仅要求学生掌握理论知识,还要求能够运用这些知识解决实际问题。
本文档旨在对《概率论与数理统计》的核心知识点进行总结,帮助考生系统复习。
第一部分:概率论基础1. 随机事件与样本空间随机事件:在一定条件下可能发生也可能不发生的事件。
样本空间:所有可能结果的集合。
2. 概率的定义古典定义:适用于有限样本空间,每个样本点等可能发生。
频率定义:长期频率的极限。
主观定义:基于个人信念或偏好。
3. 概率的性质非负性:概率值非负。
归一性:所有事件的概率之和为1。
加法定理:互斥事件概率的和。
4. 条件概率与独立性条件概率:已知一个事件发生的情况下,另一个事件发生的概率。
独立性:两个事件同时发生的概率等于各自概率的乘积。
5. 随机变量及其分布离散型随机变量:可能取有限个或可数无限个值。
连续型随机变量:可能取无限连续区间内的任何值。
分布函数:随机变量取值小于或等于某个值的概率。
第二部分:随机变量及其分布1. 离散型随机变量的分布概率质量函数:描述离散型随机变量取特定值的概率。
常见分布:二项分布、泊松分布、几何分布等。
2. 连续型随机变量的分布概率密度函数:描述连续型随机变量在某区间的概率密度。
常见分布:均匀分布、正态分布、指数分布等。
3. 多维随机变量及其分布联合分布:描述多个随机变量联合取值的概率。
边缘分布:从联合分布中得到的单一随机变量的分布。
条件分布:给定一个随机变量的条件下,另一个随机变量的分布。
第三部分:数理统计基础1. 数理统计的基本概念总体与样本:总体是研究对象的全体,样本是总体中所抽取的一部分。
统计量:根据样本数据计算得到的量。
2. 参数估计点估计:用样本统计量估计总体参数的单个值。
区间估计:在一定概率下,总体参数落在某个区间的估计。
3. 假设检验原假设与备择假设:研究问题中的两个对立假设。
检验统计量:用于决定是否拒绝原假设的量。
概率论-边缘分布、条件分布
解: (1) 所求概率分布律为 P{ i | 2} i 0,1,2,3 于是 P{ 0 | 2} P{ 0, 2} 10 100 1
P{ 2} 210 210 10 同理 P{ 1 | 2} 60 100 3
210 210 5
(1) 已知抽取的4件产品中有2件二等品,求一等品件数的概率分布.
(2) 已知抽取的4件产品中有1件一等品,求二等品件数的概率分布.
0 1 2 3 p j
0
1
2
3
0
0 10/210 20/210
0 15/210 60/210 30/210
3/210 30/210 30/210 0
2/210 5/210 0
0
5/210 50/210 100/210 50/210
4
pi
则随机变量 的边缘概率分布律为
P{ xi } pij pi i 1,2,, n, j1
同理随机变量 的边缘概率分布律为
P{ y j } pij p j j 1,2,, m,
i
3、边缘分布函数
若二随机变量( , )的联合分布函数为F ( x, y) ,则称 随机变量 或 的分布函数 F ( x) 或F ( y) 为F ( x, y) 的 边缘分布函数。
类似地,当 pi 0时,在 xi 条件下 的条件分布律为
P(
yj
|
xi )
P( xi , y j ) P( xi )
pij pi
j 1,2,
续例1 已知10件产品中有3件一等品,5件二等品,2件三等品,现
从这批产品中任意抽出4 件, 求其中一等品件数 及二等品件 数 的联合分布列. 求随机变量 (或 )的分布列.
0
条件分布律
条件分布律条件分布律是概率论中的一条重要定律,它定义了两个事件之间联系的概率在另一个事件给出条件后,有何变化。
这表明,当一个事件指定给出另一个事件时,概率也会随之变化。
条件分布律的应用非常广泛,它可以帮助我们研究特定条件下的不同概率。
条件分布律又称作Bayes定理,它是概率论中一项重要的定理,用来计算后验概率。
也就是说,在某个条件下,一个事件的发生的概率的计算,往往需要依赖其他信息。
该定理包括一个叫做“条件概率”的概念,也就是说,一个事件发生的概率可以从已知信息中独立出来,或者从已知概率中计算出来。
条件分布律的应用主要在以下几种情形中:1)用来计算一系列给定参数的概率;2)用来计算已知条件下不同概率的值;3)用来计算一定条件下的后验概率,也就是根据证据推断结果的概率;4)用来提高判断的准确性。
条件分布律也被称为“贝叶斯定理”或“贝叶斯公式”,它是概率论中的一种定理,它允许我们以某个事件发生的概率为前提,来推断另一个事件发生的概率。
其数学公式为:P(A|B)=P(A)P(B|A)/P(B)。
在条件分布律中,P(A|B)表示给定B发生的条件下,A发生的概率,P(A)表示事件A发生的概率,P(B|A)表示A发生的条件下,B发生的概率,P(B)表示事件B发生的概率。
条件分布律的应用广泛,在医学领域尤其如此。
例如,在研究肿瘤时,将条件分布律应用于可以给出确切结果的检测标准,使得现有的数据能够更客观准确地表达出来,从而使医务人员更好地判断患者的病情和预后。
另外,条件分布律还可以帮助进行疾病预测和疾病分类,提高疾病靶向治疗的效果。
此外,条件分布律在机器学习领域也得到了广泛应用。
例如,在文本分类中,条件分布律可以用于计算文本中某个词出现的概率,从而实现对文本的准确分类。
同样,还可以用条件分布律来应用在语义分析和文本推理中,以及机器学习中的分类性算法等。
综上所述,条件分布律是概率论中重要的定理,它可以帮助我们计算出不同条件下各种事件发生的概率,从而为我们提供了实际的应用价值。
y对于x的的条件分布律
y对于x的的条件分布律
条件分布律是指在给定某一条件下随机变量的分布情况。
对于
随机变量Y在给定随机变量X的条件下的条件分布律,可以表示为
P(Y=y|X=x),即在已知X的取值为x的情况下,Y取值为y的概率。
这里需要注意的是,条件分布律是在给定X的取值的情况下,对Y
的分布进行描述,因此对于不同的X的取值,条件分布律可能会有
所不同。
在实际问题中,条件分布律可以帮助我们理解在某种条件约束
下随机变量的分布情况,例如在某种特定条件下事件发生的概率。
这对于统计分析、概率推断以及决策制定都具有重要意义。
在计算条件分布律时,我们可以利用贝叶斯公式来进行计算,
即P(Y=y|X=x) = P(X=x|Y=y) P(Y=y) / P(X=x),其中P(X=x|Y=y)
为Y在给定X的条件下的概率,P(Y=y)为Y的边际分布,P(X=x)为
X的边际分布。
需要注意的是,在实际问题中,计算条件分布律可能需要利用
大量的数据进行统计推断,同时也需要考虑到样本的代表性和条件
的合理性,以避免出现错误的推断结果。
总之,对于随机变量Y在给定随机变量X的条件下的条件分布律,我们需要考虑到条件的合理性、计算的方法以及实际问题的应用,以确保得到准确有效的结果。
样本联合密度函数
样本联合密度函数样本联合密度函数是用于描述多个随机变量联合分布特征的函数。
它可以用于描述多个变量之间的关系、相互作用以及其概率分布情况。
具体而言,对于两个随机变量X和Y,样本联合密度函数可以表示为f(x,y),其中x和y分别表示X和Y的取值。
在实际应用中,样本联合密度函数可以根据具体问题的要求进行建模和推导。
以下是一些常见的样本联合密度函数及其应用。
1.多变量正态分布:多变量正态分布是一种常见的联合分布形式,其样本联合密度函数可以表示为:f(x) = (2π)^(-k/2) ,Σ,^(-1/2) exp(-1/2 (x - μ)' Σ^(-1) (x - μ))其中,x是一个k维向量,μ是一个k维向量表示均值,Σ是一个k×k协方差矩阵。
多变量正态分布在金融领域的风险度量、图像处理中的模式识别、天气预测等领域有广泛应用。
2.边缘分布:样本的边缘分布是指从联合分布中单独考虑其中一个变量的概率分布。
对于样本联合密度函数f(x,y),x的边缘密度函数可以通过积分得到:f(x) = ∫f(x, y) dy。
边缘分布在实际应用中经常使用,例如用于分析其中一个变量的概率分布特征、进行参数估计等。
3.条件分布:样本的条件分布是指在给定其中一个变量的取值的条件下,其他变量的概率分布。
对于样本联合密度函数f(x,y),在已知x的条件下,y的条件密度函数可以表示为:f(y,x)=f(x,y)/f(x)。
条件分布在实际应用中用于给定一些观测值时对未知变量进行预测、分类问题中的条件概率等。
4.相关性分析:相关性分析在金融风险管理中的资产组合分散度、市场营销中不同因素之间的相关性等方面都具有重要作用。
综上所述,样本联合密度函数是用于描述多个随机变量联合分布特征的函数。
它在统计学和概率论中有着广泛的应用,可以用于求解多变量的联合概率密度函数、边缘分布、条件分布以及相关性分析等。
对于不同的实际问题,可以根据具体需求建立适当的样本联合密度函数模型。
概率论中的联合分布与条件分布-教案
概率论中的联合分布与条件分布-教案一、引言1.1概率论基础1.1.1概率论起源:17世纪,研究赌博问题引发概率论诞生。
1.1.2概率论发展:20世纪,概率论在物理学、生物学、经济学等领域广泛应用。
1.1.3概率论重要性:为统计学、数据科学等领域提供理论基础。
1.1.4概率论与实际生活:例如天气预报、股票市场分析等。
1.2联合分布与条件分布的定义1.2.1联合分布定义:描述两个或多个随机变量同时取值的概率分布。
1.2.2条件分布定义:在已知一个随机变量取值的条件下,另一个随机变量的概率分布。
1.2.3联合分布与条件分布的关系:条件分布可以通过联合分布计算得出。
1.2.4实际应用:例如在医学研究中,联合分布可以用来研究两个基因同时出现的概率,条件分布可以用来研究在已知一个基因表达的情况下,另一个基因表达的概率。
1.3教学目标1.3.1理解联合分布与条件分布的概念。
1.3.2掌握联合分布与条件分布的计算方法。
1.3.3能够应用联合分布与条件分布解决实际问题。
1.3.4培养学生的逻辑思维能力和数据分析能力。
二、知识点讲解2.1联合分布2.1.1二维随机变量的联合分布:描述两个随机变量同时取值的概率分布。
2.1.2联合分布函数:表示随机变量X和Y的联合分布。
2.1.3联合概率密度函数:对于连续型随机变量,描述其在某一区域内的概率。
2.1.4联合分布的应用:例如在金融领域,分析两只股票的价格变动关系。
2.2条件分布2.2.1条件概率:在已知事件B发生的条件下,事件A发生的概率。
2.2.2条件分布函数:表示在随机变量Y取某一值的条件下,随机变量X的分布。
2.2.3条件概率密度函数:对于连续型随机变量,描述在已知Y 取某一值的条件下,X的概率分布。
2.2.4条件分布的应用:例如在医学领域,研究在已知患者年龄的条件下,患病概率的变化。
2.3联合分布与条件分布的关系2.3.1联合分布与条件分布的公式:通过联合分布计算条件分布。
条件分布
X 的取值有 1, 2, 3, 4; Y 的取值有 1, 2, 3, 4
相应的分布律有16个,现分别计算两个: 1 P ( X 1, Y 1) 12 4 P ( X 1 Y 1) 25 P (Y 1) 25 48
P ( X 2, Y 1) 6 8 P ( X 2 Y 1) 25 P (Y 1) 25 48 1
1 2 1 1 2 e
Hale Waihona Puke 122(1 )
[
x 1
1
y 2
2
]2
显然它也是服从正态分布:
结论:
1 N ( 1 ( y 2 ), (1 2 ) 12 ) 2
正态分布的边缘分布及条件分布仍服从正态分布.
17
例 4. 设 (X,Y) 的概率密度为:
12
解: (1) 由已知的 f ( x, y ) 可知:
当 0 x 1时
f X ( x)
f ( x, y) dy
x
0
3 xdy 3 x 2
y
1
B(1,1)
当 x 0 或 y 1时
f X ( x) 0
X 的边缘概率密度为:
0
A(1, 0)
x
3 x2 f X ( x) 0
1 x2 y 1 x2
即 当 | x | < 1 时,有:
fY |X ( y | x )
1 2 1 x2 0
1 x2 y 1 x2 y 取其它值
21
故对 y > 0
f ( x, y ) e x y , f X |Y ( x | y ) y fY ( y )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
f ( x , y )dy
例3 设(X,Y)在圆域 x 2 + y 2 ≤ 1上服从均匀分布, 上服从均匀分布, 问X与Y是否相互独立? 是否相互独立? 解 依题意知(X,Y)的概率密度为
1 f ( x, y) = π 0 x2 + y2 ≤ 1
f x ( x) =
+∞ ∫−∞
Q
f ( x , y ) ≠ f X ( x ) fY ( y )
∴ X , Y 不相互独立 .
对二维正态分布
2 若 ( X , Y ) ~ N ( µ 1 , µ 2 , σ 12 , σ 2 , ρ ),
则
Q
2 X ~ N ( µ 1 , σ 12 ), Y ~ N ( µ 2 , σ 2 )
∞
x ∫− x 1dy, 0 < x < 1, = 2 x , 0 < x < 1, = 0 , 其它 . 其它. 0, 1
y= x
1
x
−∞
f ( x , y )dy
0
y = −x
− 1 < y < 0, 0 ≤ y < 1, 其它 .
fY ( y ) =
∫
∞ −∞
1 dx = 1 + y , ∫− y 1 f ( x , y ) dx = ∫ 1 dx = 1 − y , y 0,
f ( x , y ) = f X ( x ) fY ( y ) ⇔
ρ = 0.
∴ X 和 Y 相互独立 ⇔ ρ = 0.
以上关于二维随机变量的一些概念, 以上关于二维随机变量的一些概念,包括 分布函数、 分布函数、概率密度函数、 概率密度函数、边缘分布、 边缘分布、条件 分布、 分布、独立性等概念, 独立性等概念,容易推广到n维随机变 量的情形。 量的情形。
练习: 练习:设区域D由
y=
1 , y = 0, x = 1, x = e 2 x
所围, 所围,
(X,Y)在D上服从均匀分布, 上服从均匀分布,求X的边缘密度函数。 的边缘密度函数。
解:S ( D ) = ∫ ( ∫ dy )dx = 2
e2 1 0 1 x
1 ( x, y) ∈ D ∴ f ( x, y) = 2 其他 0 故 f X ( x ) = ∫− ∞
∞
1 1 ∫0x dy 1 < x < e 2 f ( x , y )dy = 2 其他 0
1 = 2 x 0
1 < x < e2 其他
3.3 条件分布
一、离散型随机变量的条件分布
考虑一大群人 , 从其中随机挑选一个人 , 分别 用 X 和 Y 记此人的体重和身高 , 则X 和 Y 都是随 机变量 , 他们都有自己的分布 . 现在如果限制 Y的取值从1.6 m 到1.7 m, 在这
其中j = 1, 2,L.
二、连续型随机变量的条件分布 设 (X,Y) 是二维连续型 是二维 连续型 r.v , 由于对任意 x, y, P(X=x)=0, P(Y=y)=0 ,所以不能直接 用条件概率公式得到条件分布, 用条件概率公式得到条件分布,下面我们 直接给出条件概率密度函数的定义.
定义2 设X和Y的联合概率密度为 f (x,y), 边缘概率密度为 f X ( x ), fY ( y ),则对一切使
定义:设 F ( x, y ) 和 FX ( x )、FY ( y ) 分别是 ( X , Y ) 的 分布函数及边缘分布函数 , 若对任意 x, y 有
P { X ≤ x , Y ≤ y} = P { X ≤ x }P {Y ≤ y},
即
F ( x , y ) = FX ( x ) FY ( y )
f ( x , y )dy
2 2 ⋅ 1 − x = π 0
1− x 2 1 ∫− 1− x 2 dy − 1 ≤ x ≤ 1 = π 0 其它
其它
−1≤ x ≤ 1 其它
同理可得
2 2 ⋅ 1− y f y ( y) = π 0
−1 ≤ y ≤ 过的条件概率概念在另 一种形式下的重复.
定义1 设 ( X ,Y ) 是二维离散型随机变量 , 对于固定
的 j , 若 P {Y = y j } > 0, 则称 P{ X = x i Y = y j } = P { X = x i ,Y = y j } P {Y = y j } = pij p• j ,
显然
f ( x, y) ≠ fx ( x)⋅ f y ( y)
由定理知, X与Y在圆域 x 2 + y 2 ≤ 1上不 相互独立。 相互独立。
解:f X ( x ) = ∫
例4 : 设 ( X , Y ) 的概率密度为 1, 0 < x < 1, y < x , f ( x, y) = y 其它 0, 是否独立? 问: X , Y 是否独立 ?
∫−∞
x
f ( x, y) d x. fY ( y )
同理定义在 X = x 的条件下 Y 的条件分布函数为
y −∞
f ( x, y) d y. f X ( x)
例:设二维随机变量 ( X ,Y ) 在区域 x2 + y2 ≤ 1 上服从均匀分布, 求条件概率密度 f X Y (x y).
解 由题意知随机变量 ( X ,Y ) 的概率密度为
为在Y = y j 条件下随机变量 X 的条件分布律 .
其中i = 1, 2,L.
对于固定的 i , 若 P { X = x i } > 0, 则称 P {Y = y j X = x i } = P { X = x i ,Y = y j } P{ X = x i } = pij pi • ,
为在X = x i 条件下随机变量 Y 的条件分布律 .
称
∫−∞ f X Y ( x y ) d x = ∫−∞
x x
f ( x, y) d x 为在 Y = y 的 fY ( y )
条件下, X 的条件分布函数 , 记为 P { X ≤ x Y = y } 或 FX Y ( x y ), 即 FX Y ( x y ) = P{ X ≤ x Y = y } = FY X ( y x ) = P {Y ≤ y X = x } = ∫
则称 X 和 Y 是相互独立的 .
3.4.2 离散型随机变量的情形 定理 3.1 离散型随机变量相互独立的等价条件 设(X,Y)是二维离散型随机变量, 是二维离散型随机变量,则X和Y相互 独立的充分必要条件是
Pij = Pi • × P• j
对一切的 i, j 都成立。 都成立。
例1: 已知 (X,Y) 的分布律如下表 的分布律如下表, 如下表,判断 二维离散型随机变量 (X,Y) 的独立性。 的独立性。
3.4.3. 连续型随机变量的情形 定理 3.2 连续型随机变量相互独立的等价条件 设(X,Y)的概率密度函数为 f ( x , y ) ,X和Y 的边缘密度函数分别为 f x ( x ), f y ( y ) 则X与Y相互独立的充分必要条件是
f ( x, y) = f x ( x) ⋅ f y ( y)
f X ( x ) > 0 的x , 定义已知 X=x下,Y 的条件
密度函数为
f ( x, y ) fY | X ( y | x ) = f X ( x)
同样, 同样,对一切使 fY ( y ) > 0 的 y, 定义 f ( x, y) f X |Y ( x | y ) = fY ( y ) 为已知 Y=y下,X的条件密度函数 .
1 π , x 2 + y 2 ≤ 1, f ( x, y) = 0, 其它, 而Y的边缘概率密度为
fY ( y ) = ∫
∞
−∞
2 1 − y 1 2 2 d 1 , − 1 ≤ y ≤ 1, x = − y ∫− 1− y 2 f ( x, y)d x = π π 0, 其他 .
X y 1 2 3 4 p• j
因
1 1/4 0 0 0 1/4
2 1/8 1/8 0 0 1/4
3
4
pi•
1/12 1/16 25/48 1/12 1/16 13/48 1/12 1/16 0 1/4 1/16 1/4 7/48 3/48 1
1 25 1 p1• ⋅ p•1 = × ≠ = p11 ,故X与Y不独立。 不独立。 4 48 4
几乎处处成立.
例2 设随机变量(X,Y)的概率密度为
解:f X ( x ) = ∫
3 2 xy 0 ≤ x < 2,0 ≤ y < 1 f ( x, y) = 2 0 其它 证明 X与Y相互独立。 相互独立。
∞
x 13 2 ∫ xy dy, 0 < x < 2, = , 0 < x < 2, = 02 2 其它. 0 , 其它 . 0, 23 2 2 +∞ 3 y , 0 < y < 1, xy dx 0 ≤ y < 1 ∫0 = fY ( y ) = ∫ f ( x, y )dx = 2 −∞ 其他. 0, 0 其他 Q f ( x , y ) = f X ( x ) fY ( y ) ∴ X , Y 相互独立 .
于是当 − 1 < y < 1 时, 有
f (x, y) f X Y (x y) = fY ( y)
1π 1 2 2 , − 1− y ≤ x ≤ 1− y , = = (2 π) 1− y2 2 1− y2 0, 其他.
3.4 两个随机变量的相互独立性
在第一章, 在第一章,我们引进了两个事件的独立性的 概念, 概念,即若事件A与事件B满足P(AB)=P(A)P(B), 则称A与B是独立的。 是独立的。 现在, 现在,我们把这个概念引进到随机变量上来。 我们把这个概念引进到随机变量上来。