第2章概率统计回顾2.1概率与条件概率
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
© 陈强,《计量经济学及Stata应用》,2014年。请勿上传或散发。
第2章 概率统计回顾
2.1 概率与条件概率
1.概率
什么是概率?天气预报明天70%概率下雨?
含义:如果有100天的天气预报都报了70%的概率明天降雨,则大约有70天会下雨。
1
2
“概率”为在大量重复实验下,事件发生的频率趋向的某个稳定值。记事件“下雨”为A ,其发生的“概率”(probability)为P()A 。
2.条件概率
例 已知明天会出太阳,下雨的概率有多大?
记事件“出太阳”为B ,则在出太阳条件下降雨的“条件概率”(conditional probability)为
P()
P()P()
A B A B B
(2.1)
3
其中,“ ”表示事件的交集(intersection),故P()A B 为“太阳雨”的概率,参见图2.1。
图2.1 条件概率示意图
4
例 股市崩盘的可能性为无条件概率;在已知经济已陷入严重衰退的情况下,股市崩盘的可能性为条件概率。
3.独立事件
如果条件概率等于无条件概率,即P()P()A B A ,即B 是否发生不影响A 的发生,则称A , B 为相互独立的随机事件。
5
此时,P()
P()P()
P()
A B A B A B ≡= ,故
P()P()P()A B A B = (2.2)
也可将此式作为独立事件的定义。
4.全概率公式
如果事件组{}12,,,(2)n B B B n ≥ 两两互不相容; ()0(1,,)i P B i n >∀= ;
且12n B B B 为必然事件 (即在12,,,n B B B 中必然
有某个i B 发生,
“ ”表示事件的并集,union),
6
则对任何事件A (无论A 与{}12,,,n B B B 是否有任何关系),都有
1P()P()P()n
i i i A B A B ==∑ (2.3)
全概率公式把世界分成了n 个可能的情形,再把每种情况下的条件概率“加权平均”而汇总成无条件概率(权重为每种情形发生的概率)。
该公式有助于理解“迭代期望定律”(Law of Iterated Expectation )。
7
2.2 分布与条件分布 1.离散型概率分布
假设随机变量X 的可能取值为{}12,,,,k x x x ,其对应概率为{}12,,,,k p p p ,即(P )k k p X x ≡=,则称X 为离散型随机变量,其分布律可以表示为
1212k k X x x x p
p p p
(2.4)
其中,0k
p ≥,1k k
p =∑。
8
2.连续型概率分布
连续型随机变量可以取任意实数,其“概率密度函数”(probability density function ,简记pdf)()f x 满足, (i)()0,f x x ≥∀; (ii)()d 1f x x +∞
-∞
=⎰;
(iii) X 落入区间[,]a b 的概率为()()d b
a P a X
b f x x ≤≤=⎰。 定义“累积分布函数”(cumulative distribution function ,简记cdf):
()P()()d x
F x X x f t t -∞≡-∞<≤=⎰ (2.5)
9
其中,t 为积分变量。()F x 度量从-∞至x ,概念密度函数()f t 曲线下的面积。
3.多维随机向量的概率分布
为研究变量间关系,常同时..考虑两个或多个随机变量,即“随机向量”(random vector)。
二维连续型随机向量(,)X Y 的“联合密度函数”(joint pdf)(,)f x y 满足,
(i)(,)0,,f x y x y ≥∀;
10
(ii)(,)d d 1f x y x y +∞+∞
-∞-∞
=⎰⎰;
(iii)(,)X Y 落入平面某区域D 的概率为
{}P (,)(,)d d D
X Y D f x y x y
∈=⎰⎰。
二维随机向量的联合密度函数就像倒扣的草帽。落入平面某区域D 的概率就是此草帽下在区域D 之上的体积。
n 维连续型随机向量12(,,,)n X X X 可由联合密度函数12(,,,)n f x x x 来描述。
11
从二维联合密度(,)f x y ,可计算X 的(一维)边缘密度函数(marginal pdf):
()(,)d x f x f x y y +∞
-∞=⎰ (2.6)
即给定X ,把所有Y 取值的可能性都“加”起来(积分的本质就是加总)。
类似地,可计算Y 的(一维)边缘密度函数:
()(,)d y f y f x y x +∞-∞
=⎰
(2.7)
12
定义二维随机向量(,)X Y 的累积分布函数为:
(,)P(;)(,)d d x
y
F x y X x Y y f t s t s -∞-∞
≡-∞<≤-∞<≤=⎰
⎰ (2.8)
4.条件分布
“条件分布”(conditional distribution )对于计量经济学至关重要。
考虑在X x =条件下Y 的条件分布,记为Y X x =。