常用概率分布之间的关系及应用研究_陶会强
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 概率分布间关系的讨论
侯文[ 4] 将通常的概率论与数理统计教程中涉及 的分布之间的关系分为以下四种 :极限关系 , 变换 关系 , 独立同分布随机变量和的分布以及一些特殊 情形 .所谓的极限关系是指当分布中的某个参数趋 向某个值时 , 一个随机变量的概率分布逼近另一个 随机变量的概率分布 , 也就是说两个随机变量通过 渐近分布这个纽带联系起来 .变换关系指对一个随 机变量进行函数变换而得到新的随机变量 , 新的随 机变量和原随机变量之间通过分布建立联系 .独立 同分布随机变量和的分布是指一些特殊的分布 , 当
收稿日期 :2011-04-06 作者简介 :陶会强(1981 -), 男 , 河南驻马店人 , 华东师范大学硕士生 , 黄淮学院数学科学系助教 , 主要研究概率论等 .
· 76 ·
怀化学院学报 2011 年 5 月
有个独立的随机变量同分布于 这些特殊的分 布时 , 它们的和服从同一个分布或者一种新的常见分布 . 而特殊情形是指通过将一个随机变量概率分布中的 参数取特定的值 , 来得到一个新的分布 , 即新分布 是原概率分布的特殊情况 .
在此 , 本文将文 [ 4] 的两条主线 , 即贝努利试 验过程和泊松过程作为其中两条副线 , 主要原因是 贝努利试验过程和泊松过程是初等概率论学习中最 重要的两个过程 , 从中获得的概率模型和概率分布 都是概率统计学的最基础的内容 .但是 , 由于贝努 利试验过程和泊松过程都是描述离散型的概率分布 , 而中心极限定理建立了很多离散型随机变量分布和 连续型的正态分布之间的关系 , 所以本文在此引入 第三条副线 :中心极限定理 . 2.3 三个中心分布
指数分布之间的关系 .
2.4.3 关于中心极限定理的说明
由林德贝格 -勒维中心极限定理可知 , 对于具
有可加性且期望 、方差存在的分布来说 , 其分布都依 分布收敛于正态分布 , 因此以下具有可加性的分布都 收敛的正态分布 , 现列举如下 :
1)设 X1 , X2 , …, Xn ~ B(1 , p), 且相互独立 , 则
(1)均匀分布 :X ~ U(a , b);(2)指数分布 :X ~ Exp(θ);(3)正态分布 :X ~ N(μ, σ2);(4)Γ分布 :X ~ Ga(α, λ);(5)χ2 分布 :X ~ χ2(n);(6)柯西分布 : X ~ C(λ, α);(7)t 分布 :X ~ t (n);(8)F 分布 :X ~ F(m , n);(9)β 分布 :X ~ Beta(α, β);(10)瑞利 分 布 :X ~ R(σ2);(11)对数正态分布 :X ~ LN(μ, σ2).
3.4 简化运算 例 :设总体 X ~ Exp(θ), 其概率密度为 f(x)=
1θexp{- θx }, x ≥0 , θ>0 , X 1 , X2 , … , Xn 为其一个
∑ 样本
,问
2n θi =1
Xi
服从什么分布
?
解 :由 Xi
~
Exp(θ)可得
,
Xi θ
~
Exp(1);
由指 数 分 布 和 伽 玛 分 布 的 关 系 可 知 ,
5)若 T ~ t (n), 则 T 2 ~ F(1 , n), 这说明了 t 分 布与 F 分布之间的关系 .
6)若 X
~
F(2
,
2), 则1
X +X
~
U(0 , 1), 这说明了
F 分布与均匀分布之间的关系 .
7)X ~ Exp(λ), 则 Y =[ X +1] ~ Ge(p), 其中 p =1 -e-λ, 这说明了离散型的几何分布和连续型的
3)≤
30500 -90000 90000 ×1 3(1
×1 -1
33)}
≈ Υ(5 2 2)- Υ(-5 2 2)=0.995
· 78 ·
怀化学院学报 2011 年 5 月
3.3 检验的等价性
由于 t 分布的平方是F 分布 , 所以在一元线性回 归模型中关于回归系数的 t 检验与方 差分析(F 检 验)是等价的 .
B(90 000 , 1 3), 由中心极限定理得 :
P{29500 < X ≤30500}
= P{29n5p0(01--npp)<
X -np np(1 -p
)≤
30n5p0(01 --npp)}
=
P{
29500 -90000 90000 ×1 3(1
×1 -1
33)<
X -90000 ×1 3 90000 ×1 3(1 -1
2.4.1 在图 1 中 , 用 “
图 1 分 布关系图
” 表 示变换 关系 , 用 2.4.2 在文 [ 4] 的关系图的基础上 , 增加了以下
“ ” 表示极限关系 , 用 “ ” 表示独立同分布 几种关系 :
的和 , 用 “ ” 表示特殊情形下的分布关系 。
1)若 X ~ π(λ1), Y ~ π(λ2), 且 X , Y 相互独立 ,
关键词 :随机变量 ; 概率分布 ; 关系 ; 应用 中图分类号 :O211.5 文献标识码 :A 文章编号 :1671-9743 (2011) 05 -0075 -04
引 言
随机变量的概率分布是概率论和数理统计教学 中的最基本的概念 , 在一般的教学过程中一般都是 孤立地阐述各种概率分布 , 导致学生无法建立常用 概率分布之间的联系 .宗序平[ 1] 讨论了常见连续分 布和标准正态分布之间的关系 , 汪磊[ 2] 讨论了常见 连续分布和均匀分布之间的关系 , 庄光明[ 3] 讨论了 基于贝努利试验的概率分布及其应用 , 侯文[ 4] 分析 并建立了常用概率分布间的关系 .笔者基于侯文建 立的常用概率分布间的关系 , 在此基础上从另一个 角度进行了分析和补充 , 并举例说明了其应用 , 以 便于学生加深理解并灵活运用 .本文对常用 6 种离 散型概率分布和 11 种连续型概率分布的关系加以讨 论 , 第一部分主要介绍本文主要讨论的概率分布以 及符号 ;第二部分主要讨论并建立和补充了常见概 率分布间关系并加以说明和阐述 ;第三部分主要讨 论了概率分布间关系的具体应用 , 并举例说明 ;第 四部分主要对此研究内容进行总结和展望 .
第 30 卷第 5 期 2 0 1 1 年 5 月
怀化学院学报
Vol.30.No.5
JOURNAL OF HUAIHUA UNIVERSITY M ay , 2 0 1 1
常用概率分布之间的关系及应用研究
陶会强
(华东师范大学 , 上海 201100 ; 黄淮学院 , 河南 驻马店 463000)
本文在文 [ 4] 的研究基础上从另一个角度来剖 析这些分布之间的 关系 , 并补 充一些常用的 关系 , 并建立新的关系图表 .在此基础上 , 给出一些关于 概率分布之间关系的应用 . 2.1 三条主线
通常的概率论与数理统计教程一般涉及离散型 和连续型两种类型的随机变量 , 也是学习概率论与 数理统计的两个主要的随机变量的类型 .所以 , 本 文从离散型和连续型各自内部的关系和两个类型之 间的关 系三条 主线出 发来 建立概 率分布 之间的 关 系 .在学习的过程中 , 大部分的学 生比较难于建立 分布之间的关系 , 尤其是两类分布之间的关系 , 这 也是本文选取这三条主线的主要原因 . 2.2 三条副线
n
n
则 X = ∑Xi ~ Γ(∑ αi , λ), 所以 Γ(α, λ)分布当 α
i =1
i =1
比较大时 , 近似于 N(λα, λα2 ).
3 具体应用
3.1 模型的近似 对 N 件产品进行无放回抽样 , 若 N 件产品中有
M 次品 , 先从中随机地抽取 n 件产品 , 则在这 n 件产 品中出现的次品数 X 是随机变量 , 服从超几何分布 . 而有放回抽样可看做二项分布 , 此时 , 容易 验证 :若
摘 要 :随机变量的概率分布是概率论和数理统计教学中 的最基本的 概念 , 在一般 的教学 过程中一 般都是 孤立 地阐述各种概率分布 .为使学生建立起常用 概率分布之间以及离 散型和连 续型概 率分布 之间的 联系 , 对常 用 6 种离 散型概率分布和 11 种连续型概率分布 的关系加以讨论 , 在侯文建立的概率分布的关系图的基础 上 , 从另一个 角度归 纳并补充了常用概率分布之间的关系 .并在 讨论它们关系的基 础上 , 建立起 分布间的 关系图 来进一 步阐述 , 以 加深 理解.在此基础上 , 对概率分布之间关系的 应用加以举例说明 .
第 30 卷第 5 期 陶会强 :常用概率分布之间的关系及应用研究
· 77 ·
则 X |X +Y
~
B(n
,
λ1
λ1 +
λ2 ),
说明了
泊松分布与
二
项分布的关系 .
2)若 X ~ Nb(r , p), 则 P(X =k)=Ckk+r-1 pr(1
-p)k =r +r kP(Y = r), 其中 Y ~ B(r +k , p).这 说明了二项分布与负二项分布之间的关系 .
3)若 X , Y 独立同分布与 χ2(n), 则 nX -Y ~ 2 XY
t(n), 这说明了 χ2(n)分布与 t(n)分布的关系 . 4)若 X ~ N(0 , 1), Y ~ N(0 , 1), 且 X , Y 相互独
立 , 则|XY |服从柯西分布 , 这说明了正态分布与柯西 分布之间的关系 .
的冲击 , 纵摇角大于 3°的概率为p =1 3 , 若船舶遭受
了90 000 次波浪冲击 , 问其中有29 500 ~ 30 500 次纵
摇角大于 3°的概率是多少 ?
解 :设 A ={纵摇角大于 3°}, P(A)=p =1 3 , X
表示在90 000 次波浪冲击中 A 发生的次数 , 则 X ~
Xi θ
3.2 近似计算
由泊松定理可知 , 二项分布可由泊松分布近似 ,
从而二项分布的概率值可由泊松分布近似 .同样地 ,
由中心极限定理可知 , 具有可加性且期望 、方差存在
的分布收敛于正态分布 , 从而这些分布的概率值可由
正态分布概率值近似 .现举例如下 :
ຫໍສະໝຸດ Baidu
例 :一船舶在某海区航行 , 已知每遭受一次波浪
Nli※m∞
M N
=p(废品率), 在
n
,
p 保持不变的条件下 , Nli※m∞
C C k n-k M N-M CnN
=Cknpk (1 -p)n -k
, 即二项分布是超几何分布
的极限分布 .从而 , 当 N n 时 , 无放回抽样与有放
回抽样差别不大 .在这种情形下 , 可将抽样看作贝努
利试验 , 用二项分布来刻画其概率分布 .
r
∑Xi ~ Nb(r , p), 所以 Nb(r , p)当 r 较大时近似于
i =1
N (pr , r(1p-2 p))
4)设 X ~ χ2(n), Y ~ χ2(m), 且相互独立 , 则 X
+Y ~ χ2(m +n), 所以 χ2 (n) L N (n , 2n).
5)设 X1 , X2 , …, Xn 相互独立 , 且服从 Γ(αi , λ),
1 常用的一维概率分布[ 5]
1.1 离散型 (1)两点分布 :X ~ B(1 , p);(2)二项分布 :X ~
B(n , p);(3)泊松分布 :X ~ P(λ);(4)几何分布 :X ~ Ge(p);(5)超几何分布 :X ~ h(n , M , N);(6)负 二项分布 :X ~ Nb(r , p) 1.2 连续型
∑n
X = Xi ~ B(n , p), 所以 X
L
N(np , np(1 -
i =1
p)).
2)设 X1 , X2 , …, Xn ~ P(λ), 且相互独立 , 则 X
∑n
= Xi ~ P(nλ), 所以 X
L
N(nλ, nλ).
i =1
3)X1 , X2 , …, Xr ~ Ge(p), 其相互独立 , 则 X =
图 1 中 , 离散型的二项分布和连续型的正态分 布和伽玛分布这三个分布扮演着中心分布的角色 . 本文之所以以二项分布 , 正态分布和伽玛分布为中 心 , 而不以侯文[ 4] 的正态分布和指数分布主要是因 为二项分布是离散型随机变量的中心 , 而指数分布 只是伽玛分布的一个特殊情况 , 而且伽玛分布推广 出许多分布 . 2.4 分布关系图
侯文[ 4] 将通常的概率论与数理统计教程中涉及 的分布之间的关系分为以下四种 :极限关系 , 变换 关系 , 独立同分布随机变量和的分布以及一些特殊 情形 .所谓的极限关系是指当分布中的某个参数趋 向某个值时 , 一个随机变量的概率分布逼近另一个 随机变量的概率分布 , 也就是说两个随机变量通过 渐近分布这个纽带联系起来 .变换关系指对一个随 机变量进行函数变换而得到新的随机变量 , 新的随 机变量和原随机变量之间通过分布建立联系 .独立 同分布随机变量和的分布是指一些特殊的分布 , 当
收稿日期 :2011-04-06 作者简介 :陶会强(1981 -), 男 , 河南驻马店人 , 华东师范大学硕士生 , 黄淮学院数学科学系助教 , 主要研究概率论等 .
· 76 ·
怀化学院学报 2011 年 5 月
有个独立的随机变量同分布于 这些特殊的分 布时 , 它们的和服从同一个分布或者一种新的常见分布 . 而特殊情形是指通过将一个随机变量概率分布中的 参数取特定的值 , 来得到一个新的分布 , 即新分布 是原概率分布的特殊情况 .
在此 , 本文将文 [ 4] 的两条主线 , 即贝努利试 验过程和泊松过程作为其中两条副线 , 主要原因是 贝努利试验过程和泊松过程是初等概率论学习中最 重要的两个过程 , 从中获得的概率模型和概率分布 都是概率统计学的最基础的内容 .但是 , 由于贝努 利试验过程和泊松过程都是描述离散型的概率分布 , 而中心极限定理建立了很多离散型随机变量分布和 连续型的正态分布之间的关系 , 所以本文在此引入 第三条副线 :中心极限定理 . 2.3 三个中心分布
指数分布之间的关系 .
2.4.3 关于中心极限定理的说明
由林德贝格 -勒维中心极限定理可知 , 对于具
有可加性且期望 、方差存在的分布来说 , 其分布都依 分布收敛于正态分布 , 因此以下具有可加性的分布都 收敛的正态分布 , 现列举如下 :
1)设 X1 , X2 , …, Xn ~ B(1 , p), 且相互独立 , 则
(1)均匀分布 :X ~ U(a , b);(2)指数分布 :X ~ Exp(θ);(3)正态分布 :X ~ N(μ, σ2);(4)Γ分布 :X ~ Ga(α, λ);(5)χ2 分布 :X ~ χ2(n);(6)柯西分布 : X ~ C(λ, α);(7)t 分布 :X ~ t (n);(8)F 分布 :X ~ F(m , n);(9)β 分布 :X ~ Beta(α, β);(10)瑞利 分 布 :X ~ R(σ2);(11)对数正态分布 :X ~ LN(μ, σ2).
3.4 简化运算 例 :设总体 X ~ Exp(θ), 其概率密度为 f(x)=
1θexp{- θx }, x ≥0 , θ>0 , X 1 , X2 , … , Xn 为其一个
∑ 样本
,问
2n θi =1
Xi
服从什么分布
?
解 :由 Xi
~
Exp(θ)可得
,
Xi θ
~
Exp(1);
由指 数 分 布 和 伽 玛 分 布 的 关 系 可 知 ,
5)若 T ~ t (n), 则 T 2 ~ F(1 , n), 这说明了 t 分 布与 F 分布之间的关系 .
6)若 X
~
F(2
,
2), 则1
X +X
~
U(0 , 1), 这说明了
F 分布与均匀分布之间的关系 .
7)X ~ Exp(λ), 则 Y =[ X +1] ~ Ge(p), 其中 p =1 -e-λ, 这说明了离散型的几何分布和连续型的
3)≤
30500 -90000 90000 ×1 3(1
×1 -1
33)}
≈ Υ(5 2 2)- Υ(-5 2 2)=0.995
· 78 ·
怀化学院学报 2011 年 5 月
3.3 检验的等价性
由于 t 分布的平方是F 分布 , 所以在一元线性回 归模型中关于回归系数的 t 检验与方 差分析(F 检 验)是等价的 .
B(90 000 , 1 3), 由中心极限定理得 :
P{29500 < X ≤30500}
= P{29n5p0(01--npp)<
X -np np(1 -p
)≤
30n5p0(01 --npp)}
=
P{
29500 -90000 90000 ×1 3(1
×1 -1
33)<
X -90000 ×1 3 90000 ×1 3(1 -1
2.4.1 在图 1 中 , 用 “
图 1 分 布关系图
” 表 示变换 关系 , 用 2.4.2 在文 [ 4] 的关系图的基础上 , 增加了以下
“ ” 表示极限关系 , 用 “ ” 表示独立同分布 几种关系 :
的和 , 用 “ ” 表示特殊情形下的分布关系 。
1)若 X ~ π(λ1), Y ~ π(λ2), 且 X , Y 相互独立 ,
关键词 :随机变量 ; 概率分布 ; 关系 ; 应用 中图分类号 :O211.5 文献标识码 :A 文章编号 :1671-9743 (2011) 05 -0075 -04
引 言
随机变量的概率分布是概率论和数理统计教学 中的最基本的概念 , 在一般的教学过程中一般都是 孤立地阐述各种概率分布 , 导致学生无法建立常用 概率分布之间的联系 .宗序平[ 1] 讨论了常见连续分 布和标准正态分布之间的关系 , 汪磊[ 2] 讨论了常见 连续分布和均匀分布之间的关系 , 庄光明[ 3] 讨论了 基于贝努利试验的概率分布及其应用 , 侯文[ 4] 分析 并建立了常用概率分布间的关系 .笔者基于侯文建 立的常用概率分布间的关系 , 在此基础上从另一个 角度进行了分析和补充 , 并举例说明了其应用 , 以 便于学生加深理解并灵活运用 .本文对常用 6 种离 散型概率分布和 11 种连续型概率分布的关系加以讨 论 , 第一部分主要介绍本文主要讨论的概率分布以 及符号 ;第二部分主要讨论并建立和补充了常见概 率分布间关系并加以说明和阐述 ;第三部分主要讨 论了概率分布间关系的具体应用 , 并举例说明 ;第 四部分主要对此研究内容进行总结和展望 .
第 30 卷第 5 期 2 0 1 1 年 5 月
怀化学院学报
Vol.30.No.5
JOURNAL OF HUAIHUA UNIVERSITY M ay , 2 0 1 1
常用概率分布之间的关系及应用研究
陶会强
(华东师范大学 , 上海 201100 ; 黄淮学院 , 河南 驻马店 463000)
本文在文 [ 4] 的研究基础上从另一个角度来剖 析这些分布之间的 关系 , 并补 充一些常用的 关系 , 并建立新的关系图表 .在此基础上 , 给出一些关于 概率分布之间关系的应用 . 2.1 三条主线
通常的概率论与数理统计教程一般涉及离散型 和连续型两种类型的随机变量 , 也是学习概率论与 数理统计的两个主要的随机变量的类型 .所以 , 本 文从离散型和连续型各自内部的关系和两个类型之 间的关 系三条 主线出 发来 建立概 率分布 之间的 关 系 .在学习的过程中 , 大部分的学 生比较难于建立 分布之间的关系 , 尤其是两类分布之间的关系 , 这 也是本文选取这三条主线的主要原因 . 2.2 三条副线
n
n
则 X = ∑Xi ~ Γ(∑ αi , λ), 所以 Γ(α, λ)分布当 α
i =1
i =1
比较大时 , 近似于 N(λα, λα2 ).
3 具体应用
3.1 模型的近似 对 N 件产品进行无放回抽样 , 若 N 件产品中有
M 次品 , 先从中随机地抽取 n 件产品 , 则在这 n 件产 品中出现的次品数 X 是随机变量 , 服从超几何分布 . 而有放回抽样可看做二项分布 , 此时 , 容易 验证 :若
摘 要 :随机变量的概率分布是概率论和数理统计教学中 的最基本的 概念 , 在一般 的教学 过程中一 般都是 孤立 地阐述各种概率分布 .为使学生建立起常用 概率分布之间以及离 散型和连 续型概 率分布 之间的 联系 , 对常 用 6 种离 散型概率分布和 11 种连续型概率分布 的关系加以讨论 , 在侯文建立的概率分布的关系图的基础 上 , 从另一个 角度归 纳并补充了常用概率分布之间的关系 .并在 讨论它们关系的基 础上 , 建立起 分布间的 关系图 来进一 步阐述 , 以 加深 理解.在此基础上 , 对概率分布之间关系的 应用加以举例说明 .
第 30 卷第 5 期 陶会强 :常用概率分布之间的关系及应用研究
· 77 ·
则 X |X +Y
~
B(n
,
λ1
λ1 +
λ2 ),
说明了
泊松分布与
二
项分布的关系 .
2)若 X ~ Nb(r , p), 则 P(X =k)=Ckk+r-1 pr(1
-p)k =r +r kP(Y = r), 其中 Y ~ B(r +k , p).这 说明了二项分布与负二项分布之间的关系 .
3)若 X , Y 独立同分布与 χ2(n), 则 nX -Y ~ 2 XY
t(n), 这说明了 χ2(n)分布与 t(n)分布的关系 . 4)若 X ~ N(0 , 1), Y ~ N(0 , 1), 且 X , Y 相互独
立 , 则|XY |服从柯西分布 , 这说明了正态分布与柯西 分布之间的关系 .
的冲击 , 纵摇角大于 3°的概率为p =1 3 , 若船舶遭受
了90 000 次波浪冲击 , 问其中有29 500 ~ 30 500 次纵
摇角大于 3°的概率是多少 ?
解 :设 A ={纵摇角大于 3°}, P(A)=p =1 3 , X
表示在90 000 次波浪冲击中 A 发生的次数 , 则 X ~
Xi θ
3.2 近似计算
由泊松定理可知 , 二项分布可由泊松分布近似 ,
从而二项分布的概率值可由泊松分布近似 .同样地 ,
由中心极限定理可知 , 具有可加性且期望 、方差存在
的分布收敛于正态分布 , 从而这些分布的概率值可由
正态分布概率值近似 .现举例如下 :
ຫໍສະໝຸດ Baidu
例 :一船舶在某海区航行 , 已知每遭受一次波浪
Nli※m∞
M N
=p(废品率), 在
n
,
p 保持不变的条件下 , Nli※m∞
C C k n-k M N-M CnN
=Cknpk (1 -p)n -k
, 即二项分布是超几何分布
的极限分布 .从而 , 当 N n 时 , 无放回抽样与有放
回抽样差别不大 .在这种情形下 , 可将抽样看作贝努
利试验 , 用二项分布来刻画其概率分布 .
r
∑Xi ~ Nb(r , p), 所以 Nb(r , p)当 r 较大时近似于
i =1
N (pr , r(1p-2 p))
4)设 X ~ χ2(n), Y ~ χ2(m), 且相互独立 , 则 X
+Y ~ χ2(m +n), 所以 χ2 (n) L N (n , 2n).
5)设 X1 , X2 , …, Xn 相互独立 , 且服从 Γ(αi , λ),
1 常用的一维概率分布[ 5]
1.1 离散型 (1)两点分布 :X ~ B(1 , p);(2)二项分布 :X ~
B(n , p);(3)泊松分布 :X ~ P(λ);(4)几何分布 :X ~ Ge(p);(5)超几何分布 :X ~ h(n , M , N);(6)负 二项分布 :X ~ Nb(r , p) 1.2 连续型
∑n
X = Xi ~ B(n , p), 所以 X
L
N(np , np(1 -
i =1
p)).
2)设 X1 , X2 , …, Xn ~ P(λ), 且相互独立 , 则 X
∑n
= Xi ~ P(nλ), 所以 X
L
N(nλ, nλ).
i =1
3)X1 , X2 , …, Xr ~ Ge(p), 其相互独立 , 则 X =
图 1 中 , 离散型的二项分布和连续型的正态分 布和伽玛分布这三个分布扮演着中心分布的角色 . 本文之所以以二项分布 , 正态分布和伽玛分布为中 心 , 而不以侯文[ 4] 的正态分布和指数分布主要是因 为二项分布是离散型随机变量的中心 , 而指数分布 只是伽玛分布的一个特殊情况 , 而且伽玛分布推广 出许多分布 . 2.4 分布关系图