第2章概率统计回顾2.1概率与条件概率

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

© 陈强,《计量经济学及Stata应用》,2014年。请勿上传或散发。

第2章 概率统计回顾

2.1 概率与条件概率

1.概率

什么是概率?天气预报明天70%概率下雨?

含义:如果有100天的天气预报都报了70%的概率明天降雨,则大约有70天会下雨。

1

2

“概率”为在大量重复实验下,事件发生的频率趋向的某个稳定值。记事件“下雨”为A ,其发生的“概率”(probability)为P()A 。

2.条件概率

例 已知明天会出太阳,下雨的概率有多大?

记事件“出太阳”为B ,则在出太阳条件下降雨的“条件概率”(conditional probability)为

P()

P()P()

A B A B B

(2.1)

3

其中,“ ”表示事件的交集(intersection),故P()A B 为“太阳雨”的概率,参见图2.1。

图2.1 条件概率示意图

4

例 股市崩盘的可能性为无条件概率;在已知经济已陷入严重衰退的情况下,股市崩盘的可能性为条件概率。

3.独立事件

如果条件概率等于无条件概率,即P()P()A B A ,即B 是否发生不影响A 的发生,则称A , B 为相互独立的随机事件。

5

此时,P()

P()P()

P()

A B A B A B ≡= ,故

P()P()P()A B A B = (2.2)

也可将此式作为独立事件的定义。

4.全概率公式

如果事件组{}12,,,(2)n B B B n ≥ 两两互不相容; ()0(1,,)i P B i n >∀= ;

且12n B B B 为必然事件 (即在12,,,n B B B 中必然

有某个i B 发生,

“ ”表示事件的并集,union),

6

则对任何事件A (无论A 与{}12,,,n B B B 是否有任何关系),都有

1P()P()P()n

i i i A B A B ==∑ (2.3)

全概率公式把世界分成了n 个可能的情形,再把每种情况下的条件概率“加权平均”而汇总成无条件概率(权重为每种情形发生的概率)。

该公式有助于理解“迭代期望定律”(Law of Iterated Expectation )。

7

2.2 分布与条件分布 1.离散型概率分布

假设随机变量X 的可能取值为{}12,,,,k x x x ,其对应概率为{}12,,,,k p p p ,即(P )k k p X x ≡=,则称X 为离散型随机变量,其分布律可以表示为

1212k k X x x x p

p p p

(2.4)

其中,0k

p ≥,1k k

p =∑。

8

2.连续型概率分布

连续型随机变量可以取任意实数,其“概率密度函数”(probability density function ,简记pdf)()f x 满足, (i)()0,f x x ≥∀; (ii)()d 1f x x +∞

-∞

=⎰;

(iii) X 落入区间[,]a b 的概率为()()d b

a P a X

b f x x ≤≤=⎰。 定义“累积分布函数”(cumulative distribution function ,简记cdf):

()P()()d x

F x X x f t t -∞≡-∞<≤=⎰ (2.5)

9

其中,t 为积分变量。()F x 度量从-∞至x ,概念密度函数()f t 曲线下的面积。

3.多维随机向量的概率分布

为研究变量间关系,常同时..考虑两个或多个随机变量,即“随机向量”(random vector)。

二维连续型随机向量(,)X Y 的“联合密度函数”(joint pdf)(,)f x y 满足,

(i)(,)0,,f x y x y ≥∀;

10

(ii)(,)d d 1f x y x y +∞+∞

-∞-∞

=⎰⎰;

(iii)(,)X Y 落入平面某区域D 的概率为

{}P (,)(,)d d D

X Y D f x y x y

∈=⎰⎰。

二维随机向量的联合密度函数就像倒扣的草帽。落入平面某区域D 的概率就是此草帽下在区域D 之上的体积。

n 维连续型随机向量12(,,,)n X X X 可由联合密度函数12(,,,)n f x x x 来描述。

11

从二维联合密度(,)f x y ,可计算X 的(一维)边缘密度函数(marginal pdf):

()(,)d x f x f x y y +∞

-∞=⎰ (2.6)

即给定X ,把所有Y 取值的可能性都“加”起来(积分的本质就是加总)。

类似地,可计算Y 的(一维)边缘密度函数:

()(,)d y f y f x y x +∞-∞

=⎰

(2.7)

12

定义二维随机向量(,)X Y 的累积分布函数为:

(,)P(;)(,)d d x

y

F x y X x Y y f t s t s -∞-∞

≡-∞<≤-∞<≤=⎰

⎰ (2.8)

4.条件分布

“条件分布”(conditional distribution )对于计量经济学至关重要。

考虑在X x =条件下Y 的条件分布,记为Y X x =。

相关文档
最新文档