依概率收敛与弱大数定律

合集下载

23个大数定律

23个大数定律

23个大数定律大数定律是概率论中的一组重要定理,用于描述在随机试验中大量重复进行时的规律性现象。

以下是23个大数定律的简要介绍。

1. 大数定律:随着试验次数的增加,随机变量的平均值会趋近于其期望值。

2. 弱大数定律:对于独立同分布的随机变量序列,其平均值收敛于期望值的概率为1。

3. 辛钦大数定律:对于独立同分布的随机变量序列,其平均值以概率1收敛于期望值。

4. 伯努利大数定律:在一系列独立的伯努利试验中,事件发生的频率趋近于其概率。

5. 泊松大数定律:对于独立同分布的泊松随机变量序列,其平均值以概率1收敛于其参数。

6. 中心极限定理:大量独立同分布的随机变量的和趋近于正态分布。

7. 林德伯格-列维定理:对于独立同分布的随机变量序列,其和的标准化形式以概率1收敛于标准正态分布。

8. 稳定中心极限定理:对于独立同分布的随机变量序列,其和的标准化形式以概率1收敛于稳定分布。

9. 辛钦大数定律的弱形式:对于独立同分布的随机变量序列,其平均值收敛于期望值的概率为1。

10. 多重大数定律:对于多个随机变量序列,其平均值以概率1收敛于各自的期望值。

11. 大数定律的强形式:对于独立同分布的随机变量序列,其平均值收敛于期望值的概率为1。

12. 独立非同分布大数定律:对于独立非同分布的随机变量序列,其平均值以概率1收敛于各自的期望值。

13. 独立同分布大数定律的弱形式:对于独立同分布的随机变量序列,其平均值收敛于期望值的概率为1。

14. 辛钦大数定律的强形式:对于独立同分布的随机变量序列,其平均值收敛于期望值的概率为1。

15. 大数定律的加法形式:对于独立同分布的随机变量序列,其和以概率1收敛于各自的期望值之和。

16. 大数定律的乘法形式:对于独立同分布的随机变量序列,其乘积以概率1收敛于各自的期望值之积。

17. 大数定律的极限形式:对于独立同分布的随机变量序列,其平均值以概率1收敛于期望值的极限。

18. 大数定律的收敛速度:随着试验次数的增加,随机变量的平均值与期望值之间的差异逐渐减小。

四种大数定律

四种大数定律

四种大数定律导语:大数定律是概率论中的重要概念,它描述了在重复进行某个实验的过程中,随着实验次数的增加,实验结果会趋近于某个稳定值的现象。

本文将介绍四种常见的大数定律。

一、大数定律之弱大数定律弱大数定律,也称为大数定律的弱收敛形式,是概率论中最早被发现和证明的大数定律之一。

它指出,对于独立随机变量序列X1, X2, ..., Xn,如果这些随机变量的数学期望存在且相等,那么对于任意给定的正数ε,有lim(n→∞)P(|(X1+X2+...+Xn)/n-μ|<ε)=1,即随着样本容量的增加,样本均值趋近于总体均值。

例如,我们进行了n次掷硬币的实验,正面朝上的概率为p。

根据弱大数定律,当n趋向于无穷大时,正面朝上的频率将逐渐收敛于p。

二、大数定律之强大数定律强大数定律是大数定律中的一种更为强大的形式,也称为大数定律的强收敛形式。

它指出,对于独立同分布的随机变量序列X1, X2, ..., Xn,如果这些随机变量的数学期望存在且相等,那么对于任意给定的正数ε,有lim(n→∞)P(|(X1+X2+...+Xn)/n-μ|≤ε)=1,即样本均值几乎以概率1收敛于总体均值。

以赌场为例,假设我们进行了n次抛硬币的实验,正面朝上的概率为p。

根据强大数定律,当n趋向于无穷大时,正面朝上的频率几乎以概率1收敛于p。

三、大数定律之伯努利大数定律伯努利大数定律是大数定律中的一种特殊形式,适用于二项分布的随机变量序列。

它指出,对于独立同分布的伯努利试验序列X1, X2, ..., Xn,如果这些随机变量的概率p存在且相等,那么对于任意给定的正数ε,有lim(n→∞)P(|(X1+X2+...+Xn)/n-p|≤ε)=1,即样本均值几乎以概率1收敛于总体均值p。

以制造业为例,假设我们对某个产品进行了n次质量检测,不合格的概率为p。

根据伯努利大数定律,当n趋向于无穷大时,不合格品的比例几乎以概率1收敛于p。

四、大数定律之中心极限定理中心极限定理是大数定律中的一种重要形式,它描述了随机变量序列的和在一定条件下服从近似正态分布的现象。

依概率收敛 大数定律 中心极限定理

依概率收敛 大数定律 中心极限定理

依概率收敛大数定律中心极限定理依概率收敛、大数定律和中心极限定理是概率论中重要的三个定理,它们在统计学、经济学、物理学等领域有着广泛的应用。

本文将分别介绍这三个定理的定义、原理和应用。

一、依概率收敛1.1 定义依概率收敛是指,对于一组随机变量序列X1,X2,...,Xn,...,如果对于任意给定的正数ε>0,都有:lim P(|Xn-X|≥ε)=0(n→∞)其中,X为常数,则称随机变量序列{Xn}依概率收敛于X。

1.2 原理依概率收敛是弱收敛的一种形式。

它表示当样本容量趋近于无限大时,样本均值与总体均值之间的差距会越来越小,并最终趋于零。

1.3 应用依概率收敛在经济学和金融学中有着广泛的应用。

例如,在股票市场上,当投资者持有股票时,他们通常希望股票价格能够稳定增长。

而依概率收敛则可以帮助投资者预测股票价格的未来趋势,从而制定出更为科学合理的投资策略。

二、大数定律2.1 定义大数定律是指,对于一组独立同分布的随机变量序列X1,X2,...,Xn,...,如果E(Xi)=μ,则对于任意给定的正数ε>0,都有:lim P(|(X1+X2+...+Xn)/n-μ|≥ε)=0(n→∞)其中,μ为总体均值,则称随机变量序列{Xn}满足大数定律。

2.2 原理大数定律是概率论中最基本也是最重要的一条定理。

它表明当样本容量越来越大时,样本均值会越来越接近总体均值。

换句话说,当样本容量充分大时,样本均值就可以代表总体均值。

2.3 应用大数定律在统计学中有着广泛的应用。

例如,在进行人口普查或调查时,如果样本容量太小,则无法准确地反映总体情况。

而通过应用大数定律可以帮助我们确定一个合适的样本容量范围,并保证调查结果的准确性和可靠性。

三、中心极限定理3.1 定义中心极限定理是指,对于一组独立同分布的随机变量序列X1,X2,...,Xn,...,如果E(Xi)=μ,Var(Xi)=σ²,则随机变量序列:Zn=(X1+X2+...+Xn-μn)/σ√n近似服从标准正态分布,则称随机变量序列{Xn}满足中心极限定理。

大数定律的四种证法

大数定律的四种证法

对于一般人来说,大数定律的非严格表述是这样的:X_1,...,X_n是独立同分布随机变量序列,均值为u,S_n=X_1+...+X_n,则S_n/n收敛到u.如果说“弱大数定律”,上述收敛是指依概率收敛(in probability),如果说“强大数定律”,上述收敛是指几乎必然收敛(almost surely/with probability one)。

大数定律通俗一点来讲,就是样本数量很大的时候,样本均值和真实均值充分接近。

这一结论与中心极限定理一起,成为现代概率论、统计学、理论科学和社会科学的基石之一,重要性在本人看来甚至不弱于微积分。

(有趣的是,虽然大数定律的表述和证明都依赖现代数学知识,但其结论最早出现在微积分出现之前。

而且在生活中,即使没有微积分的知识也可以应用。

例如,没有学过微积分的学生也可以轻松利用excel或计算器计算样本均值等统计量,从而应用于社会科学。

)最早的大数定律的表述可以追朔到公元1500年左右的意大利数学家Cardano。

1713年,著名数学家James (Jacob) Bernouli正式提出并证明了最初的大数定律。

不过当时现代概率论还没有建立起来,测度论、实分析的工具还没有出现,因此当时的大数定律是以“独立事件的概率”作为对象的。

后来,历代数学家如Poisson(“大数定律”的名字来自于他)、Chebyshev、Markov、Khinchin(“强大数定律”的名字来自于他)、Borel、Cantelli等都对大数定律的发展做出了贡献。

直到1930年,现代概率论奠基人、数学大师Kolgomorov才真正证明了最后的强大数定律。

下面均假设X, X_1,...,X_n是独立同分布随机变量序列,均值为u。

独立同分布随机变量和的大数定律常有的表现形式有以下几种。

初等概率论(1). 带方差的弱大数定律:若E(X^2)小于无穷,则S_n/n-u依概率收敛到0。

证明方法:Chebyshev不等式即可得到。

5-1依概率收敛 5-2大数定律 5-3中心极限定理

5-1依概率收敛 5-2大数定律 5-3中心极限定理

§5.1依概率收敛 5.2 大数定律
一、大数定律的客观背景
大量的随机现象中平均结果的稳定性
大量抛掷硬币 正面出现频率
生产过程中的 字母使用频率 废品率
……
概率论应用于实际的一个重要原则是所谓“实
际推断原理”,即认为:概率接近于0的事件 (小概率事件)在个别(一次)试验中“实际 上是不可能发生的”;反之认为概率接近于1的 事件(大概率事件),在一次试验中当作是 “实际上必然的”。
2.棣莫佛-拉普拉斯定理
Zn
X k E ( X k ) X k k k 1 k 1 k 1 k 1 D( X k )
k 1 n
n
n
n
n

Bn
近似服从标准正态分布N(0,1)。
225 225
t2
2
225
20 X 270 20 1 P{ } e 2 4 / 3 15 15 225 2 (4 / 3) 1 2 0.908-1 0.816

4/ 3
dt
例2 一家电器同时收到20个噪声电器Vk(k=1,2,…,20), 设它们是相互独立的随机变量,且都在区间(0,10)上 服从均匀分布。记 V Vk
N ( np , np (1 )) .
4.例题 例1 掷一颗骰子1620次,求“六点”出现的次数 X 在250~290之间的概率? 解 X ~ b(1620, 1 ) 6 D( X ) np (1 p ) 225 E ( X ) np 270
P{250 X 290} P{ 250 270 X 270 290 270}
注意
证明切比雪夫大数定律主要的数学工 具是切比雪夫不等式.

简述大数定律的内容

简述大数定律的内容

简述大数定律的内容
大数定律是概率论中的一个重要理论,描述了随着样本数量的增加,随机变量的平均值将趋近于其数学期望。

大数定律可分为两种形式:弱大数定律和强大数定律。

弱大数定律(也称为大数定律的辛钦版本)指出,对于独立同分布的随机变量序列,它们的平均值将以概率1收敛于数学期望。

换句话说,当样本数量足够大时,随机变量的平均值与其数学期望之间的差距将会非常小。

强大数定律(也称为大数定律的伯努利版本)则更加严格,它要求随机变量序列必须满足独立同分布的条件,并且序列的方差有限。

在这种情况下,随机变量的平均值将以概率1收敛于其数学期望。

这意味着,随着样本数量的增加,随机变量的平均值将无限接近于其数学期望。

大数定律的重要性在于它提供了理论基础,支持我们在实践中使用样本平均值来估计总体平均值。

例如,当我们进行市场调查或者进行统计抽样时,我们往往只能获取到一部分样本数据,而无法获得整个总体的数据。

通过大数定律,我们可以确信,随着样本数量的增加,我们得到的样本平均值将越来越接近总体平均值。

除了在统计学中的应用,大数定律还在金融、经济学等领域有重要的应用。

例如,股票市场的波动性可以用大数定律来解释,即当交易者数量足够大时,市场价格将趋于公允价格。

此外,大数定律还可以应用于风险管理,通过对大量的风险数据进行分析,可以帮助我们更好地评估和控制风险。

总之,大数定律是概率论中的一个基本理论,它描述了随机变量序列的平均值在样本数量增加时趋于稳定的性质。

该定律在统计学和其他学科中有广泛的应用,为我们提供了在有限的样本数据中进行推断和预测的理论依据。

依概率收敛和大数定律的关系

依概率收敛和大数定律的关系

依概率收敛和大数定律的关系引言:在概率论与数理统计中,依概率收敛和大数定律是两个重要的概念。

它们在研究随机现象时具有重要的理论和应用价值。

本文将从概念的解释、关系的阐述和实际应用的角度,探讨依概率收敛和大数定律之间的密切联系。

一、依概率收敛和大数定律的概念解释1. 依概率收敛:依概率收敛是指在概率论中,随机变量序列在概率意义下逐渐接近一个确定的常数。

具体来说,对于随机变量序列{X₁, X₂, ... , Xₙ},如果对于任意给定的正数ε>0,当n趋向于无穷大时,有P(|Xₙ-α|>ε)→0,其中α为一个确定的常数,就称随机变量序列{Xₙ}依概率收敛于α。

2. 大数定律:大数定律是指随机现象中,随机变量序列的平均值在概率意义下逐渐接近其数学期望。

具体来说,对于随机变量序列{X₁, X₂, ... , Xₙ},如果对于任意给定的正数ε>0,当n趋向于无穷大时,有P(|(X₁+X₂+...+Xₙ)/n-μ|>ε)→0,其中μ为随机变量的数学期望,就称随机变量序列的平均值依概率收敛于μ。

二、依概率收敛和大数定律的关系阐述依概率收敛和大数定律都是研究随机变量序列的收敛性质,两者之间存在密切的联系。

1. 依概率收敛是大数定律的一种特殊情况:依概率收敛是大数定律的一种特殊情况,即当随机变量序列的平均值依概率收敛于其数学期望时,也可以说该随机变量序列依概率收敛于其数学期望。

2. 大数定律是依概率收敛的一种具体表现形式:大数定律是依概率收敛的一种具体表现形式,即随着随机变量序列的增大,其平均值趋近于数学期望的概率趋近于1。

可以说大数定律是依概率收敛的一种具体应用。

三、依概率收敛和大数定律的实际应用1. 统计学中的样本均值:在统计学中,大数定律的一个重要应用是样本均值的稳定性。

根据大数定律,当样本容量足够大时,样本均值将以很高的概率接近总体均值,从而可以用样本均值来估计总体均值。

2. 金融领域中的股票收益率:在金融领域中,大数定律被广泛应用于股票收益率的研究。

依概率收敛与弱大数定律

依概率收敛与弱大数定律

§ 2依概率收敛与弱大数定律、依概率收敛 、弱大数定律一、依概率收敛尽管分布函数完全反映了随机变量取值的分布规律,但是两个不同的随机变量可以有相同的分布函数.例如,向区间[0,1]上随机等可能投点,3表示落点的位置,定义则E 和n 具有相同的分布函数0,x 0, *1/2, 0 兰 x v 1, 1,x > 1F(x)八人 - I •(2)如果定义 n = , n —1,贝U n',但1 n-尸1.这表明分布函数收敛性并不能反映随机变量序列取值之间的接近程度.为此需要引入另外的收敛性nimW(3)=1,则称 n 依概率收敛(convergenee in probability)于,记作 n性,只要n 充分大, n 与 的取值就可以任意接近系,我们有下面的定理定理1设和n 是定义在概率空间(Q ,F, P)上的随机变量序列证1.设F 和F n 分别是 和n 的分布函数,x 表示F 的连续点.任意给定£ >0,(",c - [0,05] c -(05,]C)门三[0,05]c -(05,](1)定义1设•和n 是定义在同一概率空间(Q ,F, P)上的随机变量序列.如果对任意£ >0,(3)注定义1要求所有和n 的定义域相同n 卩》可直观地理解为:除去极小的可能从上面例子可以看岀由n '并不能导岀n关于这两种收敛性之间的关产_P T1.如果 n,则2. 如果dn— e, e 为常数,贝UnP一;e(_x — ;) =( _X — , n _X)( _x — n X)5(仁X)(「_;)因此F(x—U)M F n(x)+P(S —P令n^x ,由于-n----------------------- 、-,故P(±n —乏s)兰P(| =n —耳二幼T 0,从而-;)Tim F n(x) F(x j . (4) 类似地(n _X)=( n -X, _X ;) ( ;_X, X )』(乜X 亠:.)(::n _ ;)从而F n(X"F(X ;) P( - n - ;)lim F n(x) _F(x )n i-连接⑷(5)两式,对任意£ >0,有-)< ljm F n (x)F(x n厂因此对任意名>0,有P(| n -C|—沪P( n -C ;) P( n "_ ;)= 1-P( n C ;) P( n ^C-;)=1-F n(C 「0) F n(C- ;) > 0,定理证毕.例1设{ -n}独立同分布,都为[0, a]上的均匀分布,人=max{冷,二2,…tn}.求证(5)由于F在x点连续,令£ T 0,就得lim F n(x) =F(x)F ,即nnim:F n(x)= 1, X ::CX(n TX ).证 由定理1,只须证明 n的分布函数Gn(x) > D(x —a),其中D (x-a)是在a 点的退化分布函数.从第二章知道:若 h 的分布函数为F(x),则耳n的分布函数为G n (x)=[F(x)].现在的分布函数为0, x<0, x/a, 0 乞 x :: a,则 P( E = n )=1.F(x)=1,x - a.故[0,G n (x)二(x/a)n ,x ::: 00 _ x ::: a0,1,kx _ a T D(x-a)=」,x :: a证毕.依概率收敛有许多性质类似于微积分中数列极限的性质 的证题方法.大部分性质放在习题中留给读者自己证明 F 面仅举两个例子说明这类问题2设和n 是定义在概率空间(Q ,F, P)上的随机变量序列.求证: 1. 2.(-OO , OO ) 上的连续函数,则 f ( n ) * f()从而1.任意给定£ >0 ,我们有(I-I - ;/2) (I n - | - ;/2)P(IP(I-;/2) • P(| n-r.|_ ;/2)■T 口 ,并注意到上式左方与n 无关,得P(F 一 F 王和=0.进一步oOoO- I 0) =P( (I - I-1/n))P(| - 1-1/ n)n =1nm=0即 P( E =n )=1.2.任意给定,存在M>0,使得P(I E rM) _P(I E I - M/2)": ; /4.(6)由于 n P「,故存在 N 1—1,当 n-N 1 时,p (「n-〕-M/2)「/4,因此-0,4 / 8P(| n |_M)乞 P(| n 一 j_ M /2) P(| j_M /2):::;/ 4 i / 4 = ; / 2(7)又因f (x)在(-g 产)上连续,从而在[-M, M ]上一致连续.对给定的£ >0,存在S >0,当|x-y|< S 时,|f (x)- f (y)|< £ .这样p (|f(g) —f(©l = E 兰P(|J —竺⑧ +P(I ®|A M)+P(| 舱 M).(8)对上面的S ,存在N2^1,当门王N2时,p (| — /4结合⑹⑺(8) (9)式,当n —max(N1,N 2)时,P(|f( n ) —f( )|- ):I4;I2:I4=;从而f ( n )卩'f().为了进一步讨论依概率收敛的条件,我们给岀下列切比雪夫不等式 (第三章§ 2)的推广.定理2 (马尔科夫不等式)设E 是定义在概率空间 (Q , F, P)上的随机变量,f (x)是[0, g )上非负单调不减函数,则对任意x >0,":Ef(| ]) P(|E | > x)f(x)证 当Ef(| E |)=g 时,(10)式显然成立.设Ef(| E |)<g ,E 的分布函数为 F(x).因f (x)单调不减,故 |y| >x 时,f(|y|) -f(x),从而Ef(| |) f (x)|2定理3 n 卩'当且仅当 E 1 * n _ f -0.匚 | ; - |21 | ; - |2(9)(10)P(| ■ | x)y| xdF(y) <|y| xf(|y|)f(x)dF(y) 1 f(x)」(|y|)dF(y)证充分性:注意到f (x)=在[0,g ]上非负单调不减 对任意£ >0,由定理2P(|必要性:设n-的分布函数是 F n (X ).对任意£ >0,E I21| n - I _2 2 xx二 |x|2dF n (x) |x|2dF n (x)|x|:::;1 . x 2 |x|_;1 . x 2-|xdF n (X )牙 P(「n -〕—;)虫=1 +名© - q 2P2 由于 n : 在(11)式两边先令n is ,再让£— 0,即得证E1 11二、弱大数定律考虑随机试验 E 中的事件A ,假设其发生的概率为 p (0 < p <1),现在独立重复地做试验n 次——n 重贝努里试验.令A 在第i 次试验中出现 A 在第i 次试验中不出现Sn_种意义下收敛于)概率 p.我们想知道 n 与p 之间的差究竟有多大果成立.事实上,当0 < p <1,S n p nP( n =1) = P( 1=1, - , n =1)= , SnnP( n =0) = P( 1=0, - , n =0)=( p),S n它们都不为零.而在第一种情况,取£ <1-p ,不论n 多大,| n -p|=1-p >S A£ <p,则有 I n -p|= p > £ .Sn S n然而,当n 充分大后,事件{ n =1}和{ n =0}发生的可能性都很小望当n 充分大以后,岀现{| n -p| — £ }的可能性可以任意地小.这一事实最早由贝努里发现2□0X-—dF n (x) 一 1 X (11)则 P( i =1)=p, P( i =0)=1-p.nS n 八ii 二是做试验E n 次后A 发生的次数,可能值 0,1,2,…,n,视S nS n试验结果而定.熟知E n =p.在第一章§ 1中曾经指岀: 当nr ::时频率n "稳定到"(在某首先应该意识到不可能期望对任意给定的0< £ <1,当n 充分大时,|S nn-p| - £对所有试验结£ ;在第二种情况,取.一般来说,自然地希定理6(辛钦大数定律)设{ n }是定义在概率空间(Q , F, P )上的独立同分布随机变量序列,定理4(贝努里大数定律)设{ -n }是一列独立同分布的随机变量, P (b=i )=p, p ( -n =0) = 1-p,nS n =瓦 E i0 < p <1,记 i 2继贝努里之后,人们一直试图对一般的随机变量建立类似的结果 定义2设{ n }是定义在概率空间 (Q , F, P )上的随机变量序列,如果存在常数列 { an }和{ b n }使得1 n k _b n --------------------- ' 0a n k- , (n"), 则称{ n }服从弱大数定律(weak law of large numbers ),简称{ n }服从大数定律1 nE -n^n, Var -n.如果n 2 ©ST 。

概率收敛与弱大数定律.doc

概率收敛与弱大数定律.doc

概率收敛与弱大数定律.2概率收敛与弱大数定律一、概率趋同第二,弱大数定律虽然分布函数完全反映了随机变量的值的分布规律,但是两个不同的随机变量可以有相同的分布函数。

例如,间隔[0,1]上的随机和其他可能的投掷点,ω表示投掷点的位置和定义。

(1) ξ和η具有相同的分布函数F(x)=(2)如果定义为n,那么,然而,这表明分布函数的收敛性并不反映随机变量序列的值之间的紧密性。

因此,需要额外的收敛。

定义1定义为相同概率空间(ω,F,P)上的随机变量序列。

如果ε0,=0,(3)或=1为任意值,则称概率收敛,并记为。

注定义1要求所有的和域都是相同的。

可以直观地理解为:除了极小的可能性之外,只要n足够大,和的值就可以任意接近。

从上面的例子可以看出,不能从。

关于两个收敛之间的关系,我们有以下定理。

定理1将和设置为概率空间(ω,F,P)中定义的随机变量序列。

1.如果,那么。

2.如果c是常数,那么。

证据1。

将f sum分别设置为sum的分布函数。

x表示F的连续点,给定ε0,(,f (x .使n→∞,由于,因此,使F(x. (4)是类似的,所以n→∞,所以。

(5)连接两个方程(4) (5)。

对于任何ε0,都有f (x,因为f在x点是连续的,使ε→0,这样,即2。

如果,那么。

所以对于任何ε 0,都有=1 (n→∞)。

定理的证明是完整的。

例1假设{}个独立的同分布,它们都是[0,a]上的均匀分布。

证据。

定理1给出了证明,这是一个只需要证明的分布函数,其中D(x-一、概率趋同第二,弱大数定律虽然分布函数完全反映了随机变量的值的分布规律,但是两个不同的随机变量可以有相同的分布函数。

例如,间隔[0,1]上的随机和其他可能的投掷点,ω表示投掷点的位置和定义。

(1) ξ和η具有相同的分布函数F(x)=(2)如果定义为n,那么,然而,这表明分布函数的收敛性并不反映随机变量序列的值之间的紧密性。

因此,需要额外的收敛。

定义1定义为相同概率空间(ω,F,P)上的随机变量序列。

大数定律的四种证法

大数定律的四种证法

对于一般人来说,大数定律的非严格表述是这样的:X_1,...,X_n是独立同分布随机变量序列,均值为u,S_n=X_1+...+X_n,则S_n/n收敛到u.如果说“弱大数定律”,上述收敛是指依概率收敛(in probability),如果说“强大数定律”,上述收敛是指几乎必然收敛(almost surely/with probability one)。

大数定律通俗一点来讲,就是样本数量很大的时候,样本均值和真实均值充分接近。

这一结论与中心极限定理一起,成为现代概率论、统计学、理论科学和社会科学的基石之一,重要性在本人看来甚至不弱于微积分。

(有趣的是,虽然大数定律的表述和证明都依赖现代数学知识,但其结论最早出现在微积分出现之前。

而且在生活中,即使没有微积分的知识也可以应用。

例如,没有学过微积分的学生也可以轻松利用excel或计算器计算样本均值等统计量,从而应用于社会科学。

)最早的大数定律的表述可以追朔到公元1500年左右的意大利数学家Cardano。

1713年,著名数学家James (Jacob) Bernouli正式提出并证明了最初的大数定律。

不过当时现代概率论还没有建立起来,测度论、实分析的工具还没有出现,因此当时的大数定律是以“独立事件的概率”作为对象的。

后来,历代数学家如Poisson(“大数定律”的名字来自于他)、Chebyshev、Markov、Khinchin(“强大数定律”的名字来自于他)、Borel、Cantelli等都对大数定律的发展做出了贡献。

直到1930年,现代概率论奠基人、数学大师Kolgomorov才真正证明了最后的强大数定律。

下面均假设X, X_1,...,X_n是独立同分布随机变量序列,均值为u。

独立同分布随机变量和的大数定律常有的表现形式有以下几种。

初等概率论(1). 带方差的弱大数定律:若E(X^2)小于无穷,则S_n/n-u依概率收敛到0。

证明方法:Chebyshev不等式即可得到。

ch5-1-1依概率收敛与大数定律

ch5-1-1依概率收敛与大数定律
某种意义下

(1 + 2 + ⋯ + )
=


() = ()
依概率收敛与大数定律
大数定律的定义
一类收敛现象
1,2, ⋯ , ⋯为一随机变量序列,常常有

1


→ ∞ 在某种意义下收敛
=1
随机变量序列在某些意义下的收敛规律,习惯称之为大数定律
依概率收敛与大数定律




1

普通数列收敛时,当项数充分大,必然落入小区间,依概率收敛
时,无论项数多大,都有落到小区间以外的可能性.
依概率收敛与大数定律
伯努利(Bernoulli)大数定律
为重伯努利试验中发生的次数,且() = ,则对∀ > 0,有
→∞

−| <

ε) = 1
(1 + 2 + ⋯ + )
Lim (|ത −E(ത )| < ε) = 1
→∞1来自.ത = ෍

=1

依概率收敛与大数定律
几个著名的大数定律
名 称
结 论

1
(෍ ) = 0
→∞ 2
ഥn-E(X
ഥn)|﹤ Ɛ )=1
Lim P (|X
n ∞
Cov(Xi, Xj)=0,i≠j,
且D(Xn)<C(有界)
=


概率的频率解释:频率





Lim (|
() = ( )
依概率收敛于真实概率.
依概率收敛与大数定律
切比雪夫大数定律
若随机变量序列1, 2 , ⋯ , , ⋯相互独立,且() = , () = 2

三个大数定律的区别与联系

三个大数定律的区别与联系

大数定律是概率论中的一类重要定理,描述了随机变量序列的算术平均值在一定条件下向其数学期望收敛的性质。

通常提到的大数定律有三种主要类型:弱大数定律、强大数定律和伯努利大数定律。

这三种大数定律的区别与联系如下:1. 弱大数定律(Weak Law of Large Numbers, WLLN):-也称为“依概率收敛”(convergence in probability)。

-声明对于任意给定的正数ε,当样本数量趋于无穷时,随机变量序列的算术平均值与真实均值之间的差距小于ε的概率趋近于1。

-这意味着当我们取样足够多时,算术平均值几乎总是在真实均值附近。

2. 强大数定律(Strong Law of Large Numbers, SLLN):-也称为“几乎确定收敛”(almost sure convergence)或“以概率为1收敛”、“几乎处处收敛”。

-强调的是随着样本数量趋于无穷,算术平均值等于真实均值的事件发生的概率为1。

-这比弱大数定律更强,因为它表明了在无限次重复试验下,算术平均值收敛到真实均值几乎是必然的。

3. 伯努利大数定律(Bernoulli's Law of Large Numbers):-是最早的大数定律,由雅各布·伯努利提出。

-描述了一组独立同分布的伯努利实验在大量重复后,成功次数的比例接近于成功的先验概率。

三者的关系在于它们都涉及到随机变量序列的算术平均值与真实均值之间的关系,但强度不同。

弱大数定律是最弱的形式,它只保证了算术平均值以某种概率接近真实均值;强大数定律则更强,它保证了在几乎所有可能的实验结果中,算术平均值会收敛到真实均值;而伯努利大数定律是一个特例,针对的是特定类型的随机变量序列。

依概率收敛与弱大数定律

依概率收敛与弱大数定律

§2 依概率收敛与弱大数定律一、依概率收敛 二、弱大数定律一、依概率收敛尽管分布函数完全反映了随机变量取值得分布规律, 但就是两个不同得随机变量可以有相同得分布函数、 例如, 向区间[0,1]上随机等可能投点,ω表示落点得位置,定义ξω(),,=⎧⎨⎩10ωω∈∈[,.](.,]005051 ηω(),,=⎧⎨⎩01 ωω∈∈[,.](.,]005051、 (1) 则ξ与η具有相同得分布函数F(x)=⎪⎩⎪⎨⎧,1,2/1,0 .1,10,0≥<≤<x x x(2)如果定义ξξn =, n ≥1, 则ξηn d −→−, 但||ξηn -≡1、 这表明分布函数收敛性并不能反映随机变量序列取值之间得接近程度、 为此需要引入另外得收敛性、定义1 设ξ与ξn 就是定义在同一概率空间 (Ω,F, P)上得随机变量序列、 如果对任意ε>0,lim (||)n n P →∞-≥ξξε=0, (3)或lim (||)n n P →∞-<ξξε=1,')3(则称ξn 依概率收敛(convergence in probability)于ξ,记作ξnP−→−ξ、 注 定义1要求所有ξ与ξn 得定义域相同、ξn P−→−ξ可直观地理解为:除去极小得可能性,只要n 充分大,ξn 与ξ得取值就可以任意接近、从上面例子可以瞧出, 由ξn d −→−ξ并不能导出ξn P−→−ξ、 关于这两种收敛性之间得关系,我们有下面得定理、定理1 设ξ与ξn 就是定义在概率空间 (Ω,F, P)上得随机变量序列、1、 如果ξn P −→−ξ, 则 ξn d−→−ξ、 2、 如果ξn dc −→−, c 为常数,则ξn Pc −→−、 证 1、 设F 与F n 分别就是ξ与ξn 得分布函数,x 表示F 得连续点、 任意给定ε>0,(ξεξεξξεξ≤-=≤-≤≤->x x x x x n n )(,)(,)Y⊆≤-≥()()ξξξεn n x Y ,因此F(x -≤+-≥εξξε)()()F x P n n 、令n →∞, 由于ξn P −→−ξ, 故P P n n ()(||)ξξεξξε-≥≤-≥→0, 从而 F(x-≤→∞ε)lim ()n n F x 、 (4)类似地()(,)(,)ξξξεξξεn n n x x x x x ≤=≤≤+≤>+Y⊆≤+-≥()()ξεξξεx n Y ,从而F x F x P n n ()()()≤++-≥εξξε、令n →∞, 得lim ()()n n F x F x →∞≤+ε、 (5)连接(4) (5)两式,对任意ε>0, 有F(x-≤→∞ε)lim ()n n F x ≤lim ()()n n F x F x →∞≤+ε、由于F 在x 点连续,令ε→0, 就得lim ()()n n F x F x →∞=, 即ξn d−→−ξ、 2、 如果ξn dc −→−,则 lim (),,n n F x →∞=⎧⎨⎩01 x cx c <≥、因此对任意ε>0,有)()(1)()()|(|εξεξεξεξεξ-≤++<-=-≤++≥=≥-c P c P c P c P c P n n n n n=1-+-+-→F c F c n n ()(),εε00 (n →∞)、定理证毕、例1 设{ξn }独立同分布,都为[0, a]上得均匀分布, ηξξξn n =max{,,,}12Λ、求证ηn Pa −→−、证 由定理1, 只须证明ηn 得分布函数G x D x a n W()()−→−-, 其中D(x-a)就是在a 点得退化分布函数、从第二章知道:若ξk 得分布函数为F(x), 则ηn 得分布函数为G x F x n n()[()]=、 现在ξk 得分布函数为F(x)=⎪⎩⎪⎨⎧,1,/,0a x .,0,0a x a x x ≥<≤<故G x x a n n (),(/),,=⎧⎨⎪⎩⎪01 x x a x a <≤<≥00 → D(x-a)=01,,⎧⎨⎩x ax a <≥(n →∞)、证毕、依概率收敛有许多性质类似于微积分中数列极限得性质, 下面仅举两个例子说明这类问题得证题方法、 大部分性质放在习题中留给读者自己证明、例2 设ξ与ξn 就是定义在概率空间 (Ω,F, P)上得随机变量序列、 求证:1、 若ξn P −→−ξ,ξn P −→−η, 则P(ξ=η)=1、 2、 若ξn P −→−ξ, f 就是 (-∞, ∞) 上得连续函数,则f (ξn )Pf −→−()ξ、 证 1、 任意给定ε>0,我们有(|ξηεξξεξηε-≥⊆-≥-≥|)(||/)(||/)n n 22Y ,从而P(|ξηεξξεξηε-≥≤-≥+-≥|)(||/)(||/)P P n n 22、由ξn P −→−ξ,ξn P−→−η, 并注意到上式左方与n 无关, 得P(|ξηε-≥|)=0、 进一步, P(|ξηξηξη->=-≥≤-≥=∞=∞∑|)((||/))(||/)01111P n P n n n Y =0,即P(ξ=η)=1、2、 任意给定εε,'>0,存在M>0, 使得P(|ξ|≥≤M)P(|ξ|≥<'M /)/24ε、(6)由于ξn P−→−ξ, 故存在N 11≥, 当n ≥N 1时, P (||/)/ξξεn M -≥<'24, 因此2/4/4/)2/|(|)2/|(|)|(|εεεξξξξ'='+'<≥+≥-≤≥M P M P M P n n (7)又因f (x) 在 (-∞,∞)上连续,从而在[-M, M]上一致连续、 对给定得ε>0, 存在δ>0, 当|x-y|<δ时,|f (x)-f (y)|<ε、 这样P(|()()|)(||)(||)(||)f f P P M P M n n n ξξεξξδξξ-≥≤-≥+≥+≥、 (8)对上面得δ, 存在N 21≥, 当n ≥N 2时,P (||)/ξξδεn -≥<'4、(9)结合(6) (7) (8) (9)式, 当n ≥max(,)N N 12时,P(|f f n ()()|)///ξξεεεεε-≥<'+'+'='424,从而 f (ξn )Pf −→−()ξ、 为了进一步讨论依概率收敛得条件,我们给出下列切比雪夫不等式(第三章§2)得推广、 定理2 (马尔科夫不等式) 设ξ就是定义在概率空间 (Ω, F, P)上得随机变量,f (x)就是[0, ∞) 上非负单调不减函数,则对任意x >0,P(|ξ| > x)≤Ef f x (||)()ξ、(10)证 当Ef(|ξ|)=∞时,(10)式显然成立、 设Ef(|ξ|)<∞,ξ得分布函数为F(x)、 因f (x) 单调不减,故 |y| >x 时, f(|y f x |)()≥,从而⎰⎰>>≤=>xy xy y dF x f y f y dF x P ||||)()(|)(|)()|(|ξ⎰+∞∞-≤)(|)(|)(1y dF y f x f)(|)(|x f Ef ξ=、定理3 ξn P−→−ξ 当且仅当 E ||||ξξξξn n -+-221→0、 证 充分性:注意到f (x)=x x 221+在[0, ∞]上非负单调不减, 对任意ε>0, 由定理2P(|ξξεεεξξξξn n n E ->≤+-+-|)||||112222→0,即ξnP−→−ξ、必要性:设ξn-ξ得分布函数就是F xn()、对任意ε>0,)(1)(1)(1||1||||22||222222xdFxxxdFxxxdFxxEnxnxnnn⎰⎰⎰≥<∞∞-+++=+=-+-εεξξξξ≤++≥⎰εεε221dF xnx()|\=εεξξε221++-≥Pn(||)、(11)由于ξnP−→−ξ, 在(11)式两边先令n→∞, 再让ε→0,即得证E||||ξξξξnn-+-221→0、二、弱大数定律考虑随机试验E中得事件A,假设其发生得概率为p (0 < p <1), 现在独立重复地做试验n次——n重贝努里试验、令ξi =⎧⎨⎩1,,次试验中不出现在第次试验中出现在第iAiA, 1≤≤i n、则P(ξi=1)=p, P(ξi=0)=1-p、S n iin==∑ξ1就是做试验E n次后A发生得次数,可能值0,1,2,…,n, 视试验结果而定、熟知E Snn=p、在第一章§1中曾经指出: 当∞→n时频率nSn"稳定到"(在某种意义下收敛于)概率p、我们想知道Snn与p之间得差究竟有多大、首先应该意识到不可能期望对任意给定得0<ε<1, 当n充分大时, |Snn-p|≤ε对所有试验结果成立、事实上,当0 < p <1,P(Snn=1)=P(ξ1=1,…,ξn=1)=pn,P(Snn=0)=P(ξ1=0,…,ξn=0)=(1-pn),它们都不为零、而在第一种情况,取ε<1-p,不论n多大,|Snn-p|=1-p >ε; 在第二种情况,取ε<p, 则有|Snn-p|= p >ε、然而,当n充分大后,事件{Snn=1}与{Snn=0}发生得可能性都很小、一般来说,自然地希望当n充分大以后,出现{|Snn-p|≥ε}得可能性可以任意地小、这一事实最早由贝努里发现、定理4 (贝努里大数定律) 设{ξn }就是一列独立同分布得随机变量,P(ξn =1)=p,P(ξn =0)=1-p, 0 < p <1, 记S n ii n==∑ξ1, 则S n nP p −→−、 继贝努里之后,人们一直试图对一般得随机变量建立类似得结果、定义2 设{ξn }就是定义在概率空间 (Ω, F, P)上得随机变量序列,如果存在常数列{a n }与{b n }使得101a b n k n Pk n ξ-−→−=∑, (n →∞),(12)则称{ξn }服从弱大数定律( weak law of large numbers), 简称{ξn }服从大数定律、定理5 (切比雪夫大数定律) 设{ξn }就是定义在概率空间 (Ω,F, P)上得独立随机变量序列,E ξn =μn , Var ξn =σn 2、 如果10221n k k n σ=∑→,则{ξn }服从弱大数定律,即11011n n k k n k Pk n ξμ-−→−==∑∑、证 考察随机变量11n k k n ξ=∑, 因E(11n k k n ξ=∑)=11n k k n μ=∑, Var(11n k k nξ=∑)=1221n kk n σ=∑,用第三章§2得切比雪夫不等式,得P(|11n k k k n ()|ξμ-=∑≥ε)≤12εVar(11n k k nξ=∑)=12ε(1221n k k n σ=∑)→0、 此即所证、注1 贝努里大数定律就是切比雪夫大数定律得特例、注2 如果条件“{ξn }独立”被“{ξn }两两不相关”所代替,定理5依然成立、 更一般地,由该定理得证明容易瞧出:如果取消条件“{ξn }独立”,但条件“1221n k k n σ=∑→0”改为“12n Var(ξk k n =∑1)→0”, 则定理5得结论仍然成立, 称为“马尔科夫大数定律”、如果{ξn }不仅独立,而且同分布,则可以改进定理5如下:定理6(辛钦大数定律) 设{ξn }就是定义在概率空间 (Ω, F, P)上得独立同分布随机变量序列,E|ξ1|<∞、 记E ξ1=μ,S n kk n==∑ξ1, 则{ξn }服从弱大数定律,即 S n n P−→−μ、证 分别令)(t f 与)(t f n为ξ1与S n / n 得特征函数、 既然{ξn }相互独立同分布,那么)(t f n =n n t f ))/((、 另外, E 1ξ=μ, 所以由泰勒展开式知)(t f =1+i )(t o t +μ,t →0、(13)对每个t ∈R,)/(n t f =1+i )/1(/n o n t +μ, n →∞,(14))(t f n =(1+i )/1(/n o n t +μ)n i t e →μ, n →∞、由于ei tμ恰好就是集中单点μ得退化分布得特征函数,运用第一节得逆极限定理即可知道S n n d /−→−μ、 再根据定理1得S n n P/−→−μ、 定理证毕、例2 设ξk 有分布列k k s s -⎛⎝ ⎫⎭⎪0505.., s<1 /2为常数,且{ξk }相互独立、 试证{ξk }服从弱大数定律、证 已知ξk 有分布列k k s s -⎛⎝ ⎫⎭⎪0505..,所以E ξk =0, Var ξk =k s2、 当s<1/ 2时,121n Var k k n ξ=∑=11022221211n k n n n s sk n s k n <=→=-=∑∑、另外, {ξk }又就是相互独立得,所以{ξk }服从切比雪夫大数定律,即11n k k nξ=∑P−→−0、 例3 设{ξk }相互独立, 密度都为 p(x)=20113/,,x x x ⎧⎨⎩≥<,求证{ξk }服从大数定律、证 {ξk }独立同分布, E ξk =xp x dx()-∞∞⎰=2, 所以{ξk }服从辛钦大数定律、例4 设{ξk }独立同分布, E ξk =μ, Var ξk =σ2、 令ξξn k k n n ==∑11, S n n k n k n 2211=-=∑()ξξ、求证:S n P 22−→−σ、 证S n nk n k n 2211=-=∑()ξξ=121n k n k n (()())ξμξμ---=∑=---=∑1221n k n k n()()ξμξμ、(15)由辛钦大数定律知 ξμn P −→−,从而()ξμn P -−→−20、 再因{(ξμk -)2)独立同分布,E(ξμk -)2=Var ξk =σ2, 故{(ξμk -)2)也服从辛钦大数定律,即∑μ-ξ=n1k 2k )(n 12P σ−→−、 由(15)式与依概率收敛得性质(习题18),S n P 22−→−σ、注 在数理统计中,ξn 称为样本均值,nn S n -12称为样本方差、 辛钦大数定律表明样本均值依概率收敛于总体均值、 上述例子则表明样本方差依概率收敛于总体方差、最后,给出随机变量序列得另一种收敛性概念、定义3 设ξ与n ξ, n ≥1, 就是定义在同一概率空间(Ω,F, P)上得随机变量序列,E ||ξr<∞,E||ξn r<∞, n ≥1, 0 < r <∞、 如果 E ||ξξn r-→0,(16)则称{ξn } r-阶平均收敛(convergence in the mean of order r)于ξ,记作ξξn Lr−→−、 如果存在0< r <∞, ξξn L r −→−, 令rx x f ||)(=,并对ξξn -应用马尔科夫不等式,可推出ξξn P−→−、 然而下例说明其逆不成立、 例5 定义P(ξn =n) =13log()n +,P(ξn =0) =1-13log()n +, n=1,2,…、 易知,ξn P −→−0, 但对任何 0 < r<∞,E ||log()ξn rrn n =+→∞3, (n →∞)、即0−→−rLn ξ不成立、。

依概率收敛通俗理解

依概率收敛通俗理解

依概率收敛通俗理解
《依概率收敛通俗理解》
嘿,咱今天来唠唠依概率收敛这个听起来有点玄乎的玩意儿。

其实吧,依概率收敛就好像是扔骰子。

你想啊,咱平时扔骰子,那点数可没准儿,每次扔出来都不一样。

但你要是扔个成百上千次,你就会发现,每个点数出现的次数大概会有个比例。

比如说,一点出现的概率可能是六分之一左右。

这就有点像依概率收敛了。

就好比有个同学,他平时考试成绩那叫一个波动啊,一会儿高一会儿低的。

但是呢,时间长了,你会发现他的平均成绩慢慢就稳定下来了。

可能大多数时候他就是在一个范围内波动,不会太离谱。

这就跟扔骰子似的,虽然每次具体的点数不确定,但总体上有个大概的趋势。

咱再回到扔骰子这事儿上啊,有时候你可能会连着好几次扔出同一个点数,就像那同学突然考了个特别高或特别低的成绩。

但从长远来看,这些偶尔的极端情况不会一直持续下去,最终还是会回到那个平均的概率分布上。

所以啊,依概率收敛就是这么个意思,虽然具体的某次结果可能很意外,但从大的方面、长时间来看,还是有个规律可循的,就像扔骰子的点数分布一样。

这下咱应该能比较通俗地理解了吧!嘿嘿!。

依概率收敛

依概率收敛
对于limfnx个随机变量xn对应的分布函是是极限函数也是随机变量序列汶心按分布收敛到x对应的分布函4在我们的定义中对分布函数序列称为弱收敛而对其随机变量序列贝u称为按分布收敛这只是两种场合下的不同名称本质都是一样的
吕泽锋 理学院
随即变量序列两种收敛方式
两种收敛: i) 依概率收敛:用于大数定律(大数定律讨论的就是依概率收敛) ii) 按分布收敛:用于中心极限定理.
中去,这就是上面的做法。
第三段:当n ,是极限函数x lim 1 0,而在分布函数中的第二段 n n
x 1 n 1,2... 包含了x 0的情况,所以
n
gx lim Fnx 1 n
所以其极限函数是:
g x
0 1
x0 x0
但是我们注意到在间断点处 x=0 不满足分布函数的右连续,因为:
g(x) g(a) ,
Xn a gXn ga P Xn a PgXn ga ,
现在 X n P a, 因此,对于任何 0
P Xn a n1,因此, n 时 1 PgXn ga P Xn a n1 , P gXn ga n1, P gXn ga n0 ,
或者说:Xn 对 X 的绝对偏差不小于一个任意小的给定量 的可能性将随着 n 增 大而越来越小,或者说绝对偏差 Xn X 小于一个任意给定量 的可能性将随 n
增大而越来越接近于 1,上述定义也等价于
p Xn X 1n
特别的当 X 为退化分布时,即 PX c 1 ,则称序列X n依概率收敛于 c
到一个极限函数是很苛刻的。很显然当 Fx 是直线上的连续函数,那么此时的
弱收敛就是点点收敛。
(3).对于 lim Fnx F x的理解,其中 Fnx 是第 n 个随机变量 Xn 对应的分布函 n

3.5 大数定律与中心极限定理详解

3.5  大数定律与中心极限定理详解

注意到当0p1时 必有 pq 1 4
故n只需满足如下不等式
P(| Yn np | 0.01 n )
n pq
pq
n(196)2 1 9604 4
2(0.01
n pq
)
1
因此所需要的抽样调查人数为 9604人
令 2(0.01
n pq
)
1
0.95
小结
林德贝格-列维中心极限定理
两个中心极限定理
隶莫佛-拉普拉斯定理
limP{|
n
1 n
n
i
i1
|
}1
(390)
说明
伯努利大数定律表明 当 n 很大时 事件发生的频率会“靠
近”其概率 而辛钦大数定律则表明 n 次观察的算术平均值
1 n
n
i
i1
会“靠近”它的期望值Ei
这为估计期望值提供了一条
实际可行的途径
三、中心极限定理
要解决的问题: 1.为何正态分布在概率论中占有极其重要
中心极限定理表明, 在相当一般的条件下, 当独立随机变量的个数增加时, 其和的分布趋于 正态分布.
n
10(
n 3
)
0(
n 3
)
0.95
从而
n 3
1.64
n25
补充例2 某车间有200台机床独立地工作着 设每台机床 开工率为06 开工时耗电1千瓦 问供电所至少要供多少电才 能以不小于999%的概率保证车间不会因供电不足而影响生 产
解 记X为200台机器中工作着的机器台数 则X是随机变 量 服从参数为200 06的二项分布 并且np120 npq48
的地位? 2.大样本统计推断的理论基础是什么?

§5.1依概率收敛

§5.1依概率收敛

1P{|f(Xn) –f(a)|< }P{|Xn-a|< }, (*)Βιβλιοθήκη 依题设,对 >0,有
lim
n
P{|Xn-a|<
}=1,
在(*)式中令n,对 >0,有
nlimP{|f(Xn)–f(a)|< }=1。
于是依定义,有
f Xn P f (a).
【评】若f(x)在点a连续,且Xn P a, 则f Xn P f a。
列收敛于一个实数是什么意义的问题。
在这个问题之后,还将讨论对于独立同分布序列{Xn},
前n项Xk的算术平均值
1 n
n k 1
X
k收敛于什么的问题。这就
是大数定律要讨论的主要内容。
n
另外,前n项Xk的和 k 1
X k 与算术平均值
1 n
n k 1
X k作为随机
变量,有各自的分布函数Gn(x)和Hn(x),则当n时,
第五章 极限定理
§5.1 依概率收敛 §5.2 大数定律 §5.3 中心极限定理
【导言】作为概率论部分的结束,本章讨论极限定理:
即大数定律和中心极限定理。首先回顾第一章内容。
在n次独立重复试验中,曾说过试验次数n充分大时,
事件A发生的频率fn(A)充分接近于A发生的概率P(A),
频率fn(A)“收敛”于概率P(A),“收敛”的意义是什么?
且当n时,有n20。则 X n n P 0.
【证】依切比雪夫不等式,对任意实数 >0,有
1 P
Xn n
1
2 n
2
,
上式中令n,任意实数 >0,有
lim P
n
Xn n
1,

依概率收敛的理解

依概率收敛的理解

依概率收敛的理解
概率收敛是指随着样本容量的增加,一组随机变量序列的概率趋于某个固定的值。


体来说,假设我们有一组随机变量序列{x1, x2, ..., xn, ...},而我们希望知道这个序
列的概率收敛情况,可以采用以下方式:
首先,我们定义一个目标随机变量Y,我们希望随着样本容量的增加,序列的概率趋
于Y。

具体地,我们定义概率极限lim P( |Xn - Y| > ε) = 0,其中ε是一个很小的正数,|Xn - Y|是Xn与Y的差的绝对值。

接下来,我们对序列进行研究,我们关注的是Xn的分布和期望。

如果序列Xn的期望
和方差都存在,且方差有限,那么我们可以应用切比雪夫不等式:
P( |Xn - E(Xn)| > ε ) ≤ Var(Xn)/ε^2
可以看出,假设ε是一个确定的正数,随着n的增加,Var(Xn)通常变小,则右侧的
表达式趋近于0,即概率P( |Xn - E(Xn)| > ε )趋近于0。

这是一种较弱的概率收敛情况。

如果Xn的分布是正态分布,我们还可以使用中心极限定理,即序列的和可以视为一组随机变量序列,其中每个随机变量是服从0均值单位方差的正态分布,利用这个定理,我
们可以得到:
概率收敛可以应用于很多问题,例如在大数定律中,当样本容量趋近于无穷大时,样
本均值的概率收敛到总体均值;在极大似然估计中,估计量的期望概率收敛于总体参数。

总体来说,概率收敛是一种可靠的数学方法,可以用来研究一组随机变量序列的收敛性质,为实际问题的解决提供了帮助。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§2 依概率收敛与弱大数定律一、依概率收敛 二、弱大数定律一、依概率收敛尽管分布函数完全反映了随机变量取值的分布规律, 但是两个不同的随机变量可以有相同的分布函数. 例如, 向区间[0,1]上随机等可能投点,ω表示落点的位置,定义ξω(),,=⎧⎨⎩10ωω∈∈[,.](.,]005051 ηω(),,=⎧⎨⎩01 ωω∈∈[,.](.,]005051. (1) 则ξ和η具有相同的分布函数F(x)=⎪⎩⎪⎨⎧,1,2/1,0 .1,10,0≥<≤<x x x(2)如果定义ξξn =, n ≥1, 则ξηn d −→−, 但||ξηn -≡1. 这表明分布函数收敛性并不能反映随机变量序列取值之间的接近程度. 为此需要引入另外的收敛性.定义1 设ξ和ξn 是定义在同一概率空间 (Ω,F, P)上的随机变量序列. 如果对任意ε>0,lim (||)n n P →∞-≥ξξε=0, (3)或lim (||)n n P →∞-<ξξε=1,')3(则称ξn 依概率收敛(convergence in probability)于ξ,记作ξnP−→−ξ. 注 定义1要求所有ξ和ξn 的定义域相同.ξn P−→−ξ可直观地理解为:除去极小的可能性,只要n 充分大,ξn 与ξ的取值就可以任意接近.从上面例子可以看出, 由ξn d −→−ξ并不能导出ξn P−→−ξ. 关于这两种收敛性之间的关系,我们有下面的定理.定理1 设ξ和ξn 是定义在概率空间 (Ω,F, P)上的随机变量序列.1. 如果ξn P −→−ξ, 则 ξn d−→−ξ. 2. 如果ξn dc −→−, c 为常数,则ξn Pc −→−. 证 1. 设F 和F n 分别是ξ和ξn 的分布函数,x 表示F 的连续点. 任意给定ε>0,(ξεξεξξεξ≤-=≤-≤≤->x x x x x n n )(,)(,)⊆≤-≥()()ξξξεn n x ,因此F(x -≤+-≥εξξε)()()F x P n n .令n →∞, 由于ξn P −→−ξ, 故P P n n ()(||)ξξεξξε-≥≤-≥→0, 从而 F(x-≤→∞ε)lim ()n n F x . (4)类似地()(,)(,)ξξξεξξεn n n x x x x x ≤=≤≤+≤>+⊆≤+-≥()()ξεξξεx n ,从而F x F x P n n ()()()≤++-≥εξξε.令n →∞, 得lim ()()n n F x F x →∞≤+ε. (5)连接(4) (5)两式,对任意ε>0, 有F(x-≤→∞ε)lim ()n n F x ≤lim ()()n n F x F x →∞≤+ε.由于F 在x 点连续,令ε→0, 就得lim ()()n n F x F x →∞=, 即ξn d−→−ξ. 2. 如果ξn dc −→−,则 lim (),,n n F x →∞=⎧⎨⎩01 x cx c <≥.因此对任意ε>0,有)()(1)()()|(|εξεξεξεξεξ-≤++<-=-≤++≥=≥-c P c P c P c P c P n n n n n=1-+-+-→F c F c n n ()(),εε00 (n →∞).定理证毕.例1 设{ξn }独立同分布,都为[0, a]上的均匀分布, ηξξξn n =max{,,,}12 .求证ηn Pa −→−.证 由定理1, 只须证明ηn 的分布函数G x D x a n W()()−→−-, 其中D(x-a)是在a 点的退化分布函数.从第二章知道:若ξk 的分布函数为F(x), 则ηn 的分布函数为G x F x n n()[()]=. 现在ξk 的分布函数为F(x)=⎪⎩⎪⎨⎧,1,/,0a x .,0,0a x a x x ≥<≤<故G x x a n n (),(/),,=⎧⎨⎪⎩⎪01 x x a x a <≤<≥00 → D(x-a)=01,,⎧⎨⎩x ax a <≥(n →∞).证毕.依概率收敛有许多性质类似于微积分中数列极限的性质, 下面仅举两个例子说明这类问题的证题方法. 大部分性质放在习题中留给读者自己证明.例2 设ξ和ξn 是定义在概率空间 (Ω,F, P)上的随机变量序列. 求证:1. 若ξn P −→−ξ,ξn P −→−η, 则P(ξ=η)=1. 2. 若ξn P −→−ξ, f 是 (-∞, ∞) 上的连续函数,则f (ξn )Pf −→−()ξ. 证 1. 任意给定ε>0,我们有(|ξηεξξεξηε-≥⊆-≥-≥|)(||/)(||/)n n 22 ,从而P(|ξηεξξεξηε-≥≤-≥+-≥|)(||/)(||/)P P n n 22.由ξn P −→−ξ,ξn P−→−η, 并注意到上式左方与n 无关, 得P(|ξηε-≥|)=0. 进一步, P(|ξηξηξη->=-≥≤-≥=∞=∞∑|)((||/))(||/)01111P n P n n n =0,即P(ξ=η)=1.2. 任意给定εε,'>0,存在M>0, 使得P(|ξ|≥≤M)P(|ξ|≥<'M /)/24ε.(6)由于ξn P−→−ξ, 故存在N 11≥, 当n ≥N 1时, P (||/)/ξξεn M -≥<'24, 因此2/4/4/)2/|(|)2/|(|)|(|εεεξξξξ'='+'<≥+≥-≤≥M P M P M P n n (7)又因f (x) 在 (-∞,∞)上连续,从而在[-M, M]上一致连续. 对给定的ε>0, 存在δ>0, 当|x-y|<δ时,|f (x)-f (y)|<ε. 这样P(|()()|)(||)(||)(||)f f P P M P M n n n ξξεξξδξξ-≥≤-≥+≥+≥. (8)对上面的δ, 存在N 21≥, 当n ≥N 2时,P (||)/ξξδεn -≥<'4.(9)结合(6) (7) (8) (9)式, 当n ≥max(,)N N 12时,P(|f f n ()()|)///ξξεεεεε-≥<'+'+'='424,从而 f (ξn )Pf −→−()ξ. 为了进一步讨论依概率收敛的条件,我们给出下列切比雪夫不等式(第三章§2)的推广. 定理2 (马尔科夫不等式) 设ξ是定义在概率空间 (Ω, F, P)上的随机变量,f (x)是[0, ∞) 上非负单调不减函数,则对任意x >0,P(|ξ| > x)≤Ef f x (||)()ξ.(10)证 当Ef(|ξ|)=∞时,(10)式显然成立. 设Ef(|ξ|)<∞,ξ的分布函数为F(x). 因f (x) 单调不减,故 |y| >x 时, f(|y f x |)()≥,从而⎰⎰>>≤=>xy xy y dF x f y f y dF x P ||||)()(|)(|)()|(|ξ⎰+∞∞-≤)(|)(|)(1y dF y f x f)(|)(|x f Ef ξ=.定理3 ξnP −→−ξ 当且仅当 E ||||ξξξξn n -+-221→0. 证 充分性:注意到f (x)=x x 221+在[0, ∞]上非负单调不减, 对任意ε>0, 由定理2P(|ξξεεεξξξξn n n E ->≤+-+-|)||||112222→0,即ξnP−→−ξ.必要性:设ξn-ξ的分布函数是F xn(). 对任意ε>0,)(1)(1)(1||1||||22||222222xdFxxxdFxxxdFxxEnxnxnnn⎰⎰⎰≥<∞∞-+++=+=-+-εεξξξξ≤++≥⎰εεε221dF xnx()|\=εεξξε221++-≥Pn(||). (11)由于ξnP−→−ξ, 在(11)式两边先令n→∞, 再让ε→0,即得证E||||ξξξξnn-+-221→0.二、弱大数定律考虑随机试验E中的事件A,假设其发生的概率为p (0 < p <1), 现在独立重复地做试验n次——n重贝努里试验. 令ξi =⎧⎨⎩1,,次试验中不出现在第次试验中出现在第iAiA, 1≤≤i n.则P(ξi=1)=p, P(ξi=0)=1-p. S n iin==∑ξ1是做试验E n次后A发生的次数,可能值0,1,2,…,n, 视试验结果而定. 熟知E Snn=p. 在第一章§1中曾经指出: 当∞→n时频率nSn"稳定到"(在某种意义下收敛于)概率p. 我们想知道Snn与p之间的差究竟有多大.首先应该意识到不可能期望对任意给定的0<ε<1, 当n充分大时, |Snn-p|≤ε对所有试验结果成立. 事实上,当0 < p <1,P(Snn=1)=P(ξ1=1,…,ξn=1)=pn,P(Snn=0)=P(ξ1=0,…,ξn=0)=(1-pn),它们都不为零. 而在第一种情况,取ε<1-p,不论n多大,|Snn-p|=1-p >ε; 在第二种情况,取ε<p, 则有|Snn-p|= p >ε.然而,当n充分大后,事件{Snn=1}和{Snn=0}发生的可能性都很小. 一般来说,自然地希望当n充分大以后,出现{|Snn-p|≥ε}的可能性可以任意地小. 这一事实最早由贝努里发现.定理4 (贝努里大数定律) 设{ξn }是一列独立同分布的随机变量,P(ξn =1)=p, P(ξn =0)=1-p,0 < p <1, 记S n ii n==∑ξ1, 则S n nP p −→−. 继贝努里之后,人们一直试图对一般的随机变量建立类似的结果.定义2 设{ξn }是定义在概率空间 (Ω, F, P)上的随机变量序列,如果存在常数列{a n }和{b n }使得101a b n k n Pk n ξ-−→−=∑, (n →∞),(12)则称{ξn }服从弱大数定律( weak law of large numbers), 简称{ξn }服从大数定律.定理5 (切比雪夫大数定律) 设{ξn }是定义在概率空间 (Ω,F, P)上的独立随机变量序列,E ξn =μn , Var ξn =σn 2. 如果10221n k k n σ=∑→,则{ξn }服从弱大数定律,即11011n n k k n k Pk n ξμ-−→−==∑∑.证 考察随机变量11n k k n ξ=∑, 因E(11n k k n ξ=∑)=11n k k n μ=∑, Var(11n k k nξ=∑)=1221n kk n σ=∑,用第三章§2的切比雪夫不等式,得P(|11n k k k n ()|ξμ-=∑≥ε)≤12εVar(11n k k nξ=∑)=12ε(1221n k k n σ=∑)→0. 此即所证.注1 贝努里大数定律是切比雪夫大数定律的特例.注2 如果条件“{ξn }独立”被“{ξn }两两不相关”所代替,定理5依然成立. 更一般地, 由该定理的证明容易看出:如果取消条件“{ξn }独立”,但条件“1221n k k n σ=∑→0”改为“12n Var(ξk k n =∑1)→0”, 则定理5的结论仍然成立, 称为“马尔科夫大数定律”.如果{ξn }不仅独立,而且同分布,则可以改进定理5如下:定理6(辛钦大数定律) 设{ξn }是定义在概率空间 (Ω, F, P)上的独立同分布随机变量序列,E|ξ1|<∞. 记E ξ1=μ,S n kk n==∑ξ1, 则{ξn }服从弱大数定律,即 S n n P−→−μ.证 分别令)(t f 与)(t f n 为ξ1与S n / n 的特征函数. 既然{ξn }相互独立同分布,那么)(t f n =n n t f ))/((. 另外, E 1ξ=μ, 所以由泰勒展开式知)(t f =1+i )(t o t +μ,t →0.(13)对每个t ∈R,)/(n t f =1+i )/1(/n o n t +μ, n →∞,(14))(t f n =(1+i )/1(/n o n t +μ)n i t e →μ, n →∞.由于ei tμ恰好是集中单点μ的退化分布的特征函数,运用第一节的逆极限定理即可知道S n n d /−→−μ. 再根据定理1得S n n P/−→−μ. 定理证毕.例2 设ξk 有分布列k k s s -⎛⎝ ⎫⎭⎪0505.., s<1 /2为常数,且{ξk }相互独立. 试证{ξk }服从弱大数定律. 证 已知ξk 有分布列k k s s -⎛⎝ ⎫⎭⎪0505..,所以E ξk =0, Var ξk =k s2. 当s<1/ 2时,121n Var k k n ξ=∑=11022221211n k n n n s sk n s k n <=→=-=∑∑.另外, {ξk }又是相互独立的,所以{ξk }服从切比雪夫大数定律,即11n k k nξ=∑P−→−0. 例3 设{ξk }相互独立, 密度都为 p(x)=20113/,,x x x ⎧⎨⎩≥<,求证{ξk }服从大数定律.证 {ξk }独立同分布, E ξk =xp x dx()-∞∞⎰=2, 所以{ξk }服从辛钦大数定律.例4 设{ξk }独立同分布, E ξk =μ, Var ξk =σ2. 令ξξn k k n n ==∑11, S n n k n k n 2211=-=∑()ξξ.求证: S n P22−→−σ. 证S n nk n k n 2211=-=∑()ξξ=121n k n k n (()())ξμξμ---=∑=---=∑1221n k n k n()()ξμξμ.(15)由辛钦大数定律知 ξμn P −→−,从而()ξμn P -−→−20. 再因{(ξμk -)2)独立同分布,E(ξμk -)2=Var ξk =σ2, 故{(ξμk -)2)也服从辛钦大数定律,即∑μ-ξ=n 1k 2k )(n 12P σ−→−. 由(15)式与依概率收敛的性质(习题18),S n P 22−→−σ.注 在数理统计中,ξn 称为样本均值,nn S n -12称为样本方差. 辛钦大数定律表明样本均值依概率收敛于总体均值. 上述例子则表明样本方差依概率收敛于总体方差.最后,给出随机变量序列的另一种收敛性概念.定义3 设ξ和n ξ, n ≥1, 是定义在同一概率空间(Ω,F, P)上的随机变量序列,E ||ξr<∞,E||ξn r<∞, n ≥1, 0 < r <∞. 如果 E ||ξξn r-→0,(16)则称{ξn } r-阶平均收敛(convergence in the mean of order r)于ξ,记作ξξn Lr−→−. 如果存在0< r <∞, ξξn L r −→−, 令rx x f ||)(=,并对ξξn -应用马尔科夫不等式,可推出ξξn P−→−. 然而下例说明其逆不成立. 例5 定义P(ξn =n) =13log()n +,P(ξn =0) =1-13log()n +, n=1,2,…. 易知,ξn P −→−0, 但对任何 0 < r<∞,E ||log()ξn rrn n =+→∞3, (n →∞).即0−→−rLn ξ不成立.。

相关文档
最新文档