实验四 大数定律与中心极限定理
大数定律和中心极限定理的r语言实验报告

大数定律和中心极限定理是概率论中的两个重要概念。
大数定律描述了在独立重复试验中,当试验次数趋于无穷时,某一事件发生的频率趋于其概率。
中心极限定理则指出,无论试验中的个体之间的差异有多大,当试验次数足够多时,试验结果的平均值将接近正态分布。
以下是一个简单的R语言实验报告,用于演示大数定律和中心极限定理。
大数定律和中心极限定理的R语言实验
实验目的:通过模拟实验,观察大数定律和中心极限定理的现象。
实验原理:
1.大数定律:在大量独立重复试验中,某一事件的相对频率趋近于该事件的概率。
2.中心极限定理:无论个体之间的差异有多大,当试验次数足够多时,试验结果的平均值将接近正态分布。
实验步骤:
1.生成1000个0到1之间的随机数,模拟1000次掷硬币试验(正面概率为0.5)。
2.计算正面朝上的频率。
3.使用R语言绘制频率直方图和正态分布曲线。
4.重复步骤1-3多次(例如100次),观察频率的稳定性。
5.计算100次试验中每次试验得分的平均值的频数分布,并绘制直方图和正态分布曲线。
实验结果:
1.正面朝上的频率逐渐稳定于0.5。
2.频率直方图接近正态分布。
3.平均值的频数分布也接近正态分布。
实验分析:
实验结果验证了大数定律和中心极限定理。
在大量独立重复试验中,正面朝上的频率趋近于0.5,符合大数定律。
同时,试验结果的平均值分布接近正态分布,符合中心极限定理。
结论:通过R语言模拟实验,我们观察到了大数定律和中心极限定理的现象,加深了对这两个定理的理解。
04 第四节 大数定理与中心极限定理

第四节 大数定理与中心极限定理概率论与数理统计是研究随机现象统计规律性的学科. 而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性. 例如, 大量的抛掷硬币的随机试验中, 正面出现频率; 在大量文字资料中, 字母使用频率; 工厂大量生产某种产品过程中, 产品的废品率等. 一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题.在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性. 这种稳定性就是我们将要讨论的大数定律的客观背景. 在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.内容分布图示★大数定理的引入 ★切比雪夫不等式 ★例1 ★例2 ★大数定理 ★推论 大数定律 ★中心极限定理的引入 ★林德伯格—勒维定理 ★棣莫佛—拉普拉斯定理★例3 ★例4 ★例5 ★例6 ★例7 ★例8★高尔顿钉板试验 中心极限定理 ★内容小结 ★课堂练习 ★习题4-4内容要点:一、依概率收敛与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性. 定义1 设 ,,,,21n X X X 是一个随机变量序列, a 为一个常数,若对于任意给定的正数ε,有 ,1}|{|lim =<-∞→εa X P n n 则称序列 ,,,,21n X X X 依概率收敛于a , 记为).(∞→−→−n a X Pn定理1 设,,b Y a X Pn P n −→−−→−又设函数),(y x g 在点),(b a 连续, 则),(),(b a g Y X g Pn n −→−.二、切比雪夫不等式定理2设随机变量X 有期望μ=)(X E 和方差2)(σ=X D ,则对于任给0>ε, 有22}|{|εσεμ≤≥-X P .上述不等式称切比雪夫不等式.注:(i) 由切比雪夫不等式可以看出,若2σ越小, 则事件}|)({|ε<-X E X的概率越大, 即, 随机变量X 集中在期望附近的可能性越大. 由此可见方差刻划了随机变量取值的离散程度.(ii) 当方差已知时,切比雪夫不等式给出了X 与它的期望的偏差不小于ε的概率的估计式.如取,3σε= 则有.111.09}3|)({|22≈≤≥-σσσX E X P故对任给的分布,只要期望和方差2σ存在, 则随机变量X 取值偏离)(X E 超过σ3的概率小于0.111.三、大数定理1.切比雪夫大数定律定理3 (切比雪夫大数定律)设 ,,,,21n X X X 是两两不相关的随机变量序列,它们数学期望和方差均存在, 且方差有共同的上界, 即,,2,1,)( =≤i K X D i 则对任意0>ε, 有1)(11lim 11=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-∑∑==∞→εn i i n i i n X E n X n P 注: 定理表明: 当n 很大时,随机变量序列}{n X 的算术平均值∑=ni i X n 11依概率收敛于其数学期望∑=ni i X E n 1)(1.2.伯努利大数定理定理4 (伯努利大数定律)设A n 是n 重伯努利试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率, 则对任意的0>ε, 有1lim =⎭⎬⎫⎩⎨⎧<-→∞εp n n P A n 或 0l i m =⎭⎬⎫⎩⎨⎧≥-→∞εp n n P A n . 注:(i) 伯努利大数定律是定理1的推论的一种特例, 它表明: 当重复试验次数n 充分大时, 事件A 发生的频率nn A依概率收敛于事件A 发生的概率p .定理以严格的数学形式表达了频率的稳定性. 在实际应用中, 当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii) 如果事件A 的概率很小,则由伯努利大数定律知事件A 发生的频率也是很小的,或者说事件A 很少发生. 即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛. 但应注意到,小概率事件与不可能事件是有区别的. 在多次试验中,小概率事件也可能发生.3.辛钦大数定理 定理5 (辛钦大数定律) 设随机变量 ,,,,21n X X X 相互独立, 服从同一分布,且具有数学期望,,2,1,)( ==i X E i μ 则对任意0>ε, 有11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμn i i n X n P . 注: (i) 定理不要求随机变量的方差存在;(ii) 伯努利大数定律是辛钦大数定律的特殊情况;(iii) 辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径. 例如, 要估计某地区的平均亩产量, 可收割某些有代表性的地块, 如n 块,计算其平均亩产量, 则当n 较大时,可用它作为整个地区平均亩产量的一个估计. 此类做法在实际应用中具有重要意义.四、中心极限定理在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的. 这类随机变量一般都服从或近似服从正态分布. 以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等. 其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响. 因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理定理6 (林德伯格—勒维) 设 ,,,,21n X X X 是独立同分布的随机变量序列, 且,,,2,1,)(,)(2n i X D X E i i ===σμ则 ⎰∑∞--=∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-x t n i i n dt e x n n X P 2/1221lim πσμ 注: 定理6表明: 当n 充分大时, n 个具有期望和方差的独立同分布的随机变量之和近似服从正态分布. 虽然在一般情况下, 我们很难求出n X X X +++ 21的分布的确切形式, 但当n 很大时, 可求出其近似分布. 由定理结论有.1),/,(~)1,0(~/1)1,0(~1211∑∑∑====⇒-⇒-n i i ni i ni i X n X n N X N nX n N n n X σμσμσμ近似近似故定理又可表述为: 均值为μ, 方差的02>σ的独立同分布的随机变量 ,,,,21n X X X 的算术平均值X , 当n 充分大时近似地服从均值为μ,方差为n /2σ的正态分布. 这一结果是数理统计中大样本统计推断的理论基础.2. 棣莫佛—拉普拉斯定理在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量n Y 服从参数p n ,)10(<<p 的二项分布, 则对任意x , 有)(21)1(lim 22x dt e x p np np Y P x tn n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--⎰∞--∞→π注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差设n μ为n 重贝努里试验中事件A 发生的频率, p 为每次试验中事件A 发生的概率,,1p q -=由棣莫佛—拉普拉斯定理,有⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-<-=⎭⎬⎫⎩⎨⎧<-pq n npqnp pq nP p n P n n εμεεμ .12-⎪⎪⎭⎫ ⎝⎛Φ=⎪⎪⎭⎫ ⎝⎛-Φ-⎪⎪⎭⎫ ⎝⎛Φ≈pq n pq n pq n εεε这个关系式可用解决用频率估计概率的计算问题:4. 李雅普诺夫定理定理8(李雅普诺夫定理) 设随机变量 ,,,,21n X X X 相互独立, 它们具有数学期望和方差: ,2,1,0)(,)(2=>==i X D X E kk k k σμ,记.122∑==nk k nB σ 若存在正数δ, 使得当∞→n 时,,0}|{|1122→-∑=++nk k knXE Bδδμ则随机变量之和∑=n k k X 1的标准化变量:nnk kn k kn k k n k k nk k n B X X D X E X Z ∑∑∑∑∑=====-=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-=11111μ的分布函数)(x F n 对于任意x , 满足).(21lim )(lim 2/112x dt e x B X P x F x t n n k k n k k n n n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤-=⎰∑∑∞--==∞→∞→πμ注:定理8表明, 在定理的条件下, 随机变量.11nnk kn k kn B X Z ∑∑==-=μ当n 很大时,近似地服从正态分布)1,0(N . 由此, 当n 很大时,∑∑==+=nk k n n nk k Z B X 11μ近似地服从正态分布⎪⎪⎭⎫ ⎝⎛∑=21,n n k k B N μ.这就是说,无论各个随机变量),2,1( =k X k 服从什么分布,只要满足定理的条件,那么它们的和∑=nk k X 1当n 很大时,就近似地服从正态分布.这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲:切比雪夫不等式例1 已知正常男性成人血液中, 每一毫升白细胞数平均是7300, 均方差是700. 利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.解设每毫升白细胞数为,X 依题意, ,7300=μ,70022=σ所求概率为}94005200{≤≤X P }73009400730073005200{-≤-≤-=X P }21002100{≤-≤-=μX P }.2100|{|≤-=μX P 由切比雪夫不等式22)2100/(1}2100|{|σμ-≥≤-X P 2)2100/700(1-=,9/89/11=-=即每毫升白细胞数在5200 ~ 9400之间的概率不小于8/9.例2 (讲义例1) 在每次试验中, 事件A 发生的概率为0.75, 利用切比雪夫不等式求: 事件A 出现的频率在0.74~0.76之间的概率至少为0.90?解 设X 为次试验中, 事件A 出现的次数, 则)75.0,(~n b X , ,75.0n =μ ,1875.025.075.02n n =⨯=σ所求为满足90.0}76.0/74.0{≥<<n X P 的最小的.n }76.0/74.0{<<n X P 可改写为}76.074.0{n X n P <<}01.075.001.0{n n X n P <-<-=}01.0|{|n X P <-=μ 在切比雪夫不等式中取,01.0n =ε 则}76.0/74.0{<<n X P }01.0|{|n X P <-=μ22)01.0/(1n σ-≥20001.0/1875.01n n -=n /18751-=依题意, 取n 使,9.0/18751≥-n 解得 ,18750)9.01/(1875=-≥n即n 取18750 时, 可以使得在n 次独立重复试验中, 事件A 出现的频率在76.0~74.0之间的概率至少为 0.90.中心极限定理例3 (讲义例2) 一盒同型号螺丝钉共有100个, 已知该型号的螺丝钉的重量是一个随机变量, 期望值是100g, 标准差是10g, 求一盒螺丝钉的重量超过10.2kg 的概率.解 设为第i 个螺丝钉的重量, ,100,,2,1 =i且它们之间独立同分布, 于是一盒螺丝钉的重量为,1001∑==i i X X且由,100)(==i X E μ,10)(==i X D σ,100=n 知,10000)(100)(=⨯=i X E X E ,100)(=X D由中心极限定理有⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧->-=>∑=n n nn X P X P n i iσμσμ10200}10200{1⎭⎬⎫⎩⎨⎧->-=100100001020010010000X p⎭⎬⎫⎩⎨⎧≤--=⎭⎬⎫⎩⎨⎧>-=2100100001210010000X P X P.02275.097725.01)2(1=-=Φ-≈例4 (讲义例3) 计算机在进行数学计算时, 遵从四舍五入原则. 为简单计. 现在对小数点后面第一位进行舍入运算, 则误差X 可以认为服从]5.0,5.0[-上的均匀分布. 若在一项计算中进行了100次数字计算, 求平均误差落在区间]20/3,20/3[-上的概率.解,100=n 用i X 表示第i 次运算中产生的误差.10021,,,X X X 相互独立, 都服从]5.0,5.0[-上的均匀分布,且,0)(=i X E ,12/1)var(=i X 100,,2,1 =i , 从而).1,0(~5312/100010010011001100N XX Y i ii i 近似∑∑===⨯-=故平均误差∑==10011001i i X X 落在⎥⎥⎦⎤⎢⎢⎣⎡-203,203上的概率为⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤-∑=20310012032032031001i iX P X P⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤-=∑=35331001i i X P )3()3(-Φ-Φ≈.9973.0=例5(讲义例4) 某车间有200台车床, 在生产期间由于需要检修、调换刀具、变换位置及调换工作等常需停车. 设开工率为0.6, 并设每台车床的工作是独立的, 且在开工时需电力1千瓦, 问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?解 对每台车床的观察作为一次试验, 每次试验观察台车床在某时刻是否工作, 工作的概率为0.6, 共进行200次试验. 用X 表示在某时刻工作着的车床数, 依题意, 有),6.0,200(~b X现在的问题是: 求满足999.0}{≥≤N X P 的最小的.N由定理3,)1(p np np X --近似服从),1,0(N 这里,120=np ,48)1(=-p np于是.48120}{⎪⎪⎭⎫⎝⎛-Φ≈≤N N X P 由,999.048120≥⎪⎪⎭⎫ ⎝⎛-ΦN 查正态分布函数表得,999.0)1.3(=Φ故,1.348120≥-N 从中解得,5.141≥N 即所求.142=N 也就是说, 应供应142千瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产.例6 (讲义例5) 某市保险公司开办一年人身保险业务, 被保险人每年需交付保险费160元, 若一年内发生重大人身事故, 其本人或家属可获2万元赔金. 已知该市人员一年内发生重大人身事故的概率为,005.0 现有5000人参加此项保险, 问保险公司一年内从此项业务所得到的总收益在20万到40万元之间的概率是多少?解记⎩⎨⎧=事故个被保险人未发生重大若第故个被保险人发生重大事若第i i X i ,0,1 )5000,,2,1( =i于是i X 均服从参数为005.0=p 的两点分布, 且,005.0}1{==i X p .25=np∑=50001i i X 是5000个被保险人中一年内发生重大人身事故的人数, 保险公司一年内从此项业务所得到的总收益为∑=⨯-⨯5000125000016.0i i X 万元.于是⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤-⨯≤∑=4025000016.02050001i i X P ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤=∑=302050001i i X P ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⨯-≤⨯-≤⨯-=∑=995.0252530995.02525995.025*********i i X P 6826.0)1()1(=-Φ-Φ≈例7 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1名家长, 2名家长来参加会议的概率分别0.05, 0.8, 0.15. 若学校共有400名学生, 设各学生参加会议的家长数相互独立, 且服从同一分布. 求参加会议的家长数X 超过450的概率.解以)400,,2,1( =k X k 记第k 个学生来参加会议的家长数, 则k X 的分布律为15.08.005.0210kk p X易知,1.1)(=k X E ,19.0)(=k X D ,400,,2,1 =k 而,4001∑==k k XX 由定理3, 随机变量),1,0(~19.04001.140019.04001.14004001N X Xk k近似⨯-=⨯-∑= 故⎭⎬⎫⎩⎨⎧⨯->⨯-=>19.04001.140045019.04001.1400}450{X P X P⎭⎬⎫⎩⎨⎧≤⨯--=147.119.04001.14001X P.1357.0)147.1(1=Φ-≈例8 设有1000人独立行动, 每个人能够按时进入掩蔽体的概率为0.9. 以95%概率估计, 在一次行动中, 至少有多少人能进入掩蔽体.解用i X 表示第i 人能够按时进入掩蔽体, 令.100021X X X S n +++=设至少有m 人能进入掩蔽体, 则要求,95.0}{≥≤n S m P ⎭⎬⎫⎩⎨⎧-≤⨯⨯⨯-=≤909001.09.010009.01000}{n n S m S m由中心极限定理, 有),1,0(~90900N S n 近似- 所以⎭⎬⎫⎩⎨⎧-≤-=≤9090090900}{n n S m P S m P ⎭⎬⎫⎩⎨⎧-<--=90900909001m S P n查正态分布数值表, 得 ,65.190900-=-m 故88435.88465.15900≈=-=m 人.课堂练习某地有甲、乙两个电影院竞争当地每天的1000名观众, 观众选择电影院是独立的和随机的,问: 每个电影院至少应设有多少个座位, 才能保证观众因缺少座位而离去的概率小于1%?。
大数定律与中心极限定理

的方差存在,且有共同的上界,即
Var( Xi ) c,i 1,2,
则 {Xn} 服从大数定律,即对任意的 0
lim
n
P
1
n i 1
Xi
1 n
n i 1
E( Xi )
1
成立.
定理3 (辛软大数定律)设 X1, X 2,X n , 为一列相互独立且相同分布的随机变量,若
Xi (i 1,2,) 的数学期望存在,则 {X n} 服从大数
例5.2.2 某工厂有 200 台同类型的机器,每台
机器工作时需要 50 kW 的电力。由于功率的原 因,每台机器的开工率为 0.75 ,各台机器是否 工作是相互独立的.问
(1)在任一时刻,恰有 144 至 160 台机器正在 工作的概率为多少?
(2)在任一时刻,需要至少供应多少电力才能 保证“因电力不足而使一些机器停工”的概率小于 0.01?
概率论与数理统计
二、中心极限定理
定理5.2.1 (独立同分布的中心极限定理) 设随机
变量序列 X1, X 2,X n , ,相互独立且服从同一 分布,它们具有相同的数学期望和方差
E Xi Var( X i ) 2 0
n
其中 i = 1,2,3,…, 则前 n 个随机变量之和 Xi 的标 i 1
准化变量
lim P Yn np x Φ(x) n np(1 p)
其中 (x) 为标准正态分布的分布函数.
例3 一个加法器可同时收到 20 个噪声电压 Vk
k 1,2,,20,设它们是相互独立的随机变量,
且都在 0,10 上服从均匀分布,记
20
V Vk k 1
求 P{V 105} 的近似值。
练习 一食品店有三种蛋糕出售,由于售出哪
大数定律和中心极限定理

大数定律和中心极限定理1 大数定律这里强调的是总体与样本大数定律就是说:当随机事件发生的次数足够多时,发生的频率趋近于预期的概率大数定律说的是当随机事件重复多次时频率的稳定性,随着试验次数的增加,事件发生的频率趋近于预期的“概率”2 赌徒缪误:1,2,4,8-----在赌钱时——输了就翻倍,一直到赢为止有人说:如果已经连续4次出现正面,接下来的第5次还是正面的话,就接连有5次“正面”,根据概率论,连抛5次正面的几率是1/25=1/32。
所以,第5次正面的机会只有1/32,而不是1/2。
以上混淆了“在硬币第1次抛出之前,预测接连抛5次均为正的概率”和“抛了4次正之后,第5次为正的概率”,既(11111)---- 1/32,(1111)1 ---- 1/2。
3 中心极限定理3.1 大数定律和中心极限定理的关系:上面通过赌徒谬误介绍了概率论中的大数定律。
大数定律说的是当随机事件重复多次时频率的稳定性,随着试验次数的增加,事件发生的频率趋近于预期的“概率”。
但大数定律并未涉及概率之分布问题。
此外大数定律说明了在一定条件下,当系统的个体足够多时,系统的算数平均值会集中在期望位置。
从这个角度,中心极限定理包含了大数定律。
因为中心极限定理在于揭示系统在期望附近的统计性质,即“以何种方式”集中在期望。
总的来说就是——大数定律反映的是频率->概率(或者认为广义的期望);而中心极限定理反映的是——在整体结果下,结果内部发生各种情况下的一个概率分布情况。
3.2 那什么是中心极限定理?中心极限定理指的是分别适用于不同条件的一组定理,但基本可以用一句通俗的话来概括它们:大量相互独立的随机变量,其求和后的平均值以正态分布(即钟形曲线)为极限。
Eg:以二项分布为例进行解释(抛硬币)对于抛n次硬币,出现正面k次的一个分布情况,如下:但是对于二项分布不一定是对对称的,除了受抛的次数n影响,还受对应的概率p的影响3.3 晋级再后来,中心极限定理的条件逐渐从二项分布推广到独立同分布随机序列,以及不同分布的随机序列。
大数定律和中心极限定理课件

中心极限定理可以帮助我们在不确定 的情况下做出决策。例如,通过模拟 大量可能的结果并计算其分布,可以 评估不同决策的风险和收益。
04
大数定律与中心极限定理的 关联与区别
关联性分析
大数定律和中心极限定理都是概率论中 的重要定理,它们在某些方面存在关联。
大数定律描述了在大量独立重复试验中, 大数定律是中心极限定理的一种特例, 某一事件的相对频率趋于该事件的概率, 当随机变量数量趋于无穷时,中心极限
而中心极限定理则说明无论独立随机变 定理可以看作是大数定律的一种推广。 量的分布是什么,它们的和或积的分布
都趋于正态分布。
差异性分析
大数定律和中心极限定理在适用范围和表现形式 上存在差异。
大数定律的结论是相对频率趋于概率,而中心极 限定理的结论是随机变量和的分布趋于正态分布。
大数定律适用于大量独立重复试验中某一事件的 相对频率,而中心极限定理则适用于独立随机变 量的和或积的分布。
02
中心极限定理
定义
• 中心极限定理:在大量独立同分布的随机变量下,这些随机变 量的平均值的分布趋近于正态分布,即无论这些随机变量的分 布是什么,只要样本量足够大,其平均值的分布都将呈现出正 态分布的特征。
适用范 围
中心极限定理适用于大量独立同分布的随机变量,这些随 机变量的分布可以是离散的也可以是连续的。
在金融领域,中心极限定理也被广泛应用。例如,股票价格的波动可以看作是大 量投资者决策的独立同分布的随机变量,因此股票价格的平均值(即指数)的分 布也呈现出正态分布的特征。
03
大数定律与中心极限定理的 应用
在统计学中的应用
样本均值和总体均值的近似
大数定律表明,当样本量足够大时,样本均值趋近于总体均值,这为统计学中的参数估计提供了基础。
大数定律与中心极限定理

⼤数定律与中⼼极限定理⽬录随机变量序列的两种收敛性依概率收敛:设{X n}为⼀随机变量序列,X为⼀随机变量,若对于任意ϵ>0,有P(|X n−X|≥ϵ)→0(n→∞)则称序列{X n}依概率收敛于X,记作X n P →X依概率收敛的性质:若X n P →aY n P →b则:X n±Y n P→a±bX n Y n P→abX n÷Y n P→a÷b弱收敛(按分布收敛):随机变量X,X1,X2…的分布函数为F(x),F1(x),F2(x)…,若对于F(x)的任意⼀个连续点x,有lim n→∞F n(x)=F(x)则称分布函数序列{F n(x)}弱收敛于F(x),记作F n(x)W→F(x)也称{X n}按分布收敛于X,记作X n L →X特征函数特征函数:设X是⼀个随机变量,则φ(t)=E(e itX)为X的特征函数。
常⽤分布的特征函数0-1分布:φ(t)=pe it+q泊松分布:φ(t)=∑e itx λk e−λk!=e−λ∑(λe it)kk!=eλ(e it−1)均匀分布:φ(t)=∫b ae itxb−a dx=e itb−e itait(b−a)标准正态分布:φ(t)=e−1 2t2证明:φ(t)=∫∞−∞e itx1√2πe−12x2dx=1√2π∫∞−∞∞∑n=0(itx)nn!e−12x2dx=∞∑n=0(it)nn![∫∞−∞x n1√2πe−12x2]dx=∞∑n=0(it)nn!E(X n)当n为奇数时,E(X n)=∫∞−∞x n1√2πe−12x2dx=0当n为偶数时,E(X n)=E(X2m)=∫∞−∞x2m1√2πe−12x2dx=1√2π∫∞−∞−x2m−1d(e−12x2)=1√2π(2m−1)∫∞−∞x2m−2e−12x2dx=(2m−1)(2m−3)…1∫∞−∞1√2πe−12x2dx=(2m−1)!!=2m!2m(m−1)!故φ(t)=∞∑m=0(it)2m(2m)!E(X2m)=∞∑m=0(it)2m(2m)!2m!2m(m−1)!=∞∑m=0(−t22)mm!=e−1 2t2指数分布的特征函数:φ(t)=(1−it λ)−1证明:φ(t)=∫∞0e itxλe−λx dx=λ[∫∞0cos(tx)e−λx dx+i∫∞0sin(tx)e−λx dx]I=∫∞0cos(tx)e−λx dx=∫∞01t e−λx dsin(tx)=λt∫∞sin(tx)e−λx dx=−λt2[−1+λ∫∞cos(tx)e−λx dx]=−λ2t2I+λt2故I=λλ2+t2φ(t)=λ(λλ2+t2+itλ2+t2)=λλ2+t2(λ+it)=λλ−it=(1−it λ)−1特征函数的性质|φ(t)|≤φ(0)=1证明:|φ(t)|=|∫e itx f(x)dx|≤∫|e itx|f(x)dx=1若Y=aX+b,则φY(t)=e ibtφX(at)证明:φY(t)=∫e it(ax+b)f(x)dx=e itb∫e itax f(x)dx=e ibtφX(at)若X和Y相互独⽴,则有φX+Y(t)=φX(t)φY(t)证明:E(e it(X+Y))=E(e itx e ity)=E(e itx)E(e ity)=φX(t)φY(t)若E(X l)存在,则X的特征函数l次可导,且对1≤k≤l有φ(k)(0)=i k E(X k)证明:φ(k)(t)=∫i k x k e ixt f(x)dx将t=0代⼊得φ(k)(0)=i k∫x k f(x)dx=i k E(X k)⼤数定律 概率是频率的稳定值,其中稳定是什么意思?⼤数定律详细的描述了这个问题。
大数定律与中心极限定理总结

大数定律与中心极限定理总结大数定律与中心极限定理是概率论与数理统计中的两个重要定理,用于描述随机变量序列的性质。
下面我将分别对这两个定理进行总结,并给出相关的参考内容。
一、大数定律大数定律是概率论中的一个基本定理,描述了随机变量序列的极限性质。
大数定律可以分为弱大数定律和强大数定律两种。
1. 弱大数定律弱大数定律是指对于一个随机变量序列,如果序列的均值存在,并且均值收敛于某个常数,那么这个序列就满足弱大数定律。
弱大数定律的代表是辛钦大数定律。
具体来说,如果一个随机变量序列X1, X2, ..., Xn,其中Xi是相互独立、同样分布的随机变量序列,它们的均值为μ,方差为σ^2。
那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - μ| ≤ ε ) = 1这意味着当样本数量趋向于无穷大时,样本均值的概率逼近于1,即样本均值趋近于总体均值μ。
2. 强大数定律强大数定律是指对于一个随机变量序列,如果序列的均值存在,并且均值以概率1收敛于某个常数,那么这个序列就满足强大数定律。
强大数定律的代表是伯努利大数定律和切比雪夫大数定律。
伯努利大数定律是对于一个独立随机变量序列X1, X2, ..., Xn,其中每个随机变量取值为0或1,概率为p或1-p,那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - p| ≤ ε ) = 1切比雪夫大数定律是对于一个独立随机变量序列X1, X2, ..., Xn,其具有相同的均值μ和方差σ^2,那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - μ| ≤ ε ) = 1以上的大数定律说明了随机变量序列的均值具有稳定的性质,当样本数量足够大时,样本均值可以准确地反映总体均值。
二、中心极限定理中心极限定理是概率论与数理统计中的一个基本定理,描述了独立随机变量和的分布的极限性质。
第四章 大数定律和中心极限定理

设需N台车床工作, 现在的问题是:
求满足
P(X≤N)≥0.999
的最小的N.
(由于每台车床在开工时需电力1千瓦,N台 工作所需电力即N千瓦.)
由德莫佛-拉普拉斯极限定理
X np 近似N(0,1), np(1 p)
于是 P(X≤N)= P(0≤X≤N)
这里 np=120, np(1-p)=48
第四章
大数定律和中心极限定理
§1 大数定率
一. 切比雪夫不等式 若r.v.X的期望和方差存在,则对任意0,
有
D( X ) P{| X E( X ) | } ; 2
这就是著名的切比雪夫(Chebyshev)不等式。 它有以下等价的形式:
P{| X E( X ) | } 1 D( X ) . 2
P{Y 60000 0.9 }
P{Y>60000}=P{1000012-aX>60000}
=P{X60000/a}0.9; 由中心极限定理,上式等价于
60000 10000 0.006 ( a ) 0.9 10000 0.006 0.994
a 3017
例3 根据以往经验,某种电器元件的寿命服从均值为 100小时的指数分布. 现随机地取16只,设它们的寿 命是相互独立的. 求这16只元件的寿命的总和大于 1920小时的概率. 解: 设第i只元件的寿命为Xi , i=1,2, …,16
7 500 100 100 2 P{ X i 500} 1 35 1 (8.78) 0 i 1 10 12
2.德莫佛-拉普拉斯中心极限定理(De MoivreLaplace)
设随机变量n(n=1, 2, ...)服从参数为n, p(0<p<1) 的二项分布,则
大数定律与中心极限定理公式

大数定律与中心极限定理公式
大数定律和中心极限定理是概率论和统计学中的重要概念,它们描述了在大量重复实验或观察中随机变量的性质。
大数定律是指当试验次数趋于无穷时,随机变量的相对频率趋于其概率。
具体来说,如果一个随机变量序列{ξn, n ∈ N} 的期望存在且等于某个常数ξ,那么对于任意小的正数ε,当 n 趋于无穷时,P( ξn - ξ ≥ ε ) 趋于 0。
中心极限定理则是指无论随机变量 X1, X2,..., Xn 的分布是什么,只要 n 足
够大,那么它们的和 X1 + X2 + ... + Xn 除以 n 的标准化形式就会近似地
服从标准正态分布 N(0, 1)。
也就是说,对于任意x ∈ R,有limn→∞
P(∣∑i=1nxi−nμ∣≤xσn)=Φ(x)\lim_{n \to \infty}
P(\frac{\sum_{i=1}^{n}x_i-n\mu}{\sqrt{n\sigma^2}} \leq x) =
\Phi(x)limn→∞P(∣∣∑i=1nxi−nμ∣∣≤xnσ2)=Φ(x),其中μ 是 X1, X2,...,
Xn 的期望,σ^2 是它们的方差,Φ(x)是标准正态分布 N(0, 1) 的分布函数。
这两个定理在统计学中有着广泛的应用,例如在样本均值的分布、样本比例的分布、回归分析等方面都有重要的应用。
167;34大数定律和中心极限定理

1 n
nk1 Xk E(Xk)
(3)
1n nk1Xk
P
也就是当观察次数无限增多时,观察
结果的算术平均值几乎变成一个常数,不是随机的了。
定理2(贝努利大数定理)设n是n次独立试验 中事件A发生的次数,则对任意的正数有
lim P | np| 1 , 其P 中 A p
n n
引人随机变量
k=1,2,…则对任意实数 x有
n
Xk
n
lim Pk1`
x
x
1
t2
e 2dt
n
n
2
n
Xk n
(1)令Ynk1 n 的分布Fn函 x, 数那么
n l i F m ( nx ) n l i P m (Y nx) x 2 1e t2 2d t (x)
E n Xk n E(Xk)n, k1 k1
课内练习2. 某单位设置一电话总机,共有200架分机.设每个 电话分机是否使用外线通话是相互独立的. 设每时刻每个分 机有 5% 的概率要使用外线通话. 问总机需要多少外线才能 以不低于90%的概率保证每个分机要使用外线时可供使用?
设需要k条外线, X为某时刻通话的分, 机数 则 X ~ B (2,0 0 .0 0 )5 n , p 1,n 0 p 9 .5 q P(0Xk)kn npp q 0 nnpp q
|X n a | a X n a
Xn
a a a
或Xn落在(a - ε,a + ε )的概率无限接近于1。
二、两个大数定理
定理1 ( 切比雪夫大数定律 ) 设X1,X2,…,Xn…是一
个随机变量序列, 且E(Xk)= ,D(Xk)=2 (k=1,2,…)
则对任意正数 , 有
第五章--大数定律与中心极限定理

P{ X
μ
ε
}
1
σ2 ε2
.
第一节 大数定律
大数定律— 概率论中有关阐明大量随机现象平 均结果的稳定性的一系列定理。
迄今为止,人们已发现很多大数定律(laws of large numbers)所谓大数定律,简单地说,就是大 量数目的随机变量所呈现出的规律,这种规律一般 用随机变量序列的某种收敛性来刻画。
i 1
100
P{380 Xi 420}
i 1
100
P{380 400 i1 Xi 400 420 400}
225
225
225
(4) ( 4)
3
3
2(1.333) 1 0.8164.
例 某车间有同型号机床200台,它们独立地工作着.每台开工的 概率为0.7,开工时每台耗电15kw.问供电部门最少要供应该车间 多少电能,才能以95%的概率保证不致因供电不足而影响生产.
X n P a
1.伯努利大数定理
定理2 设试验E可重复进行,事件A在每次实验中出现的
概率为p,将试验进行n次,nA表示事件A发生的次数,则
对任意 0,有
lim P{| nA p | } 1
n
n
证明:
因为n A
~
b(n,
p),
故E(nA )
np,
D(nA )
np(1
p)
从而E(nA ) n
(2) " n很大"是一个较为模糊的概念, 经验告诉我们, 如果取 n 50(有时可放宽到n 30),则近似程度便可以满足一般 要求.当然,n越大精度越好.
德莫佛---拉普拉斯定理:
设随机变量Xn ~ B(n, p), (n 1, 2 ),则对 任意x R,有 lim P{ X n np x} (x)
第四章大数定律与中心极限定理

≥ lim (1 −
n→ ∞
D( X n )
ε2
C )=1 ) ≥ lim (1 − 2 n→ ∞ nε
契比雪夫大数定律的特殊情况 推论:设 是两两不相关的随机变量序列, 推论 设{Xk}是两两不相关的随机变量序列 是两两不相关的随机变量序列 具有相同的数学期望E(Xk)=µ和方差 具有相同的数学期望 和方差 D(Xk)=σ2(k=1,2,…),则对于任意给定的 则对于任意给定的ε>0,恒 则对于任意给定的 恒 有
1 n 1 n 2 ∑ Yi = n ∑ ( X i − µ ) n i =1 i =1 1 n 1 n 2 2 ∑ E (Yi ) = n ∑ E [( X i − µ ) ] = σ n i =1 i =1
D (Yn ) = D[( X n − µ ) ] = E [( X n − µ ) ] − σ
2 4 4 Q E ( X n ) 存在 ,∴ E [( X n − µ ) 4 ]存在 4
1 n 2 ∴ lim P ∑ ( X i − µ ) − σ < ε = 1 n→ ∞ n i =1
定理(伯努里大数定律):设进行n 定理(伯努里大数定律):设进行n次独 大数定律):设进行 立重复试验,每次试验中事件A 立重复试验,每次试验中事件A发生 的概率为p 次试验中事件A 的概率为p,记μn为n次试验中事件A 发生的次数,则对任意的ε>0,有 发生的次数,则对任意的ε>0,有
例如对某物的长度进行测量,在测量时有 例如对某物的长度进行测量 在测量时有 许多随机因素影响测量的结果.如温度和 许多随机因素影响测量的结果 如温度和 湿度等因素对测量仪器的影响,使测量产 湿度等因素对测量仪器的影响 使测量产 生误差X 测量者观察时视线所产生的误 生误差 1;测量者观察时视线所产生的误 差X1;测量者心理和生理上的变化产生的 测量者心理和生理上的变化产生的 测量误差X 显然这些误差是微小的、 测量误差 3;…显然这些误差是微小的、 显然这些误差是微小的 随机的,而且相互没有影响 而且相互没有影响.测量的总误差 随机的 而且相互没有影响 测量的总误差 是上述各个因素产生的误差之和,即∑Xi. 是上述各个因素产生的误差之和 即
大数定律与中心极限定理

解: EX i = 10, DX i = 100. 系统寿命X = ∑ X i
P{ X ≥ 350} = P{∑ X i ≥ 350}
i =1 30 i =1
30
= P{
∑X
i =1
30
350 − 300 ≥ } 30 × 100 30 × 100
i
− 300
∑X
k =1
n
近似 k~ N (nµຫໍສະໝຸດ , nσ )∞ n n =1
1 n 1 n lim P | ∑ X k − E ∑ X k |≥ ε = 0. n →∞ n k =1 n k =1
定理1( Markov):若随机变量序列{ X n }∞=1 ,对∀n ≥ 1, n 1 n n→∞ DX n 存在; 且 2 D ∑ X k 0,则称{ X n }服从大数定律. → n k =1 proof : 1 n 1 n 1 n 0 ≤ P | ∑ X k − E ∑ X k |≥ ε ≤ 2 2 D ∑ X k k =1 n k =1 n k =1 nε
第 k 个学生来参加会议的家 长数,
Xk 则 X k 的分布律为 pk
0 1 2 0.05 0.8 0.15
易知 E ( X k ) = 1.1, D( X k ) = 0.19, ( k = 1,2,⋯,400)
根据独立同分布的中心极限定理 独立同分布的中心极限定理, 而 X = ∑ X k , 根据独立同分布的中心极限定理,
1 则 lim Fn ( x) = lim P{Yn ≤ x} = n →∞ n →∞ 2π
近似 n
∫
x
−∞
e
1 − t2 2
§4.4大数定律与中心极限定理

中心极限定理是概率论中最著名的结果 之一,它不仅提供了计算独立随机变量之和 的近似概率的简单方法,而且有助于解释为 什么很多自然群体的经验频率呈现出钟形曲 线这一值得注意的事实.
第四章结束 !
ቤተ መጻሕፍቲ ባይዱ
解: 任一时刻使用外线的分机数为X, X~B(200,0.2)
由题意, 求最小r, 使得 P(0≤X≤r)≥0.95
令: Xk 10
第k台分机用外线 第k台分机不用外线
200
则:X Xk
由于 n 较大k,1故近似地, X~N(np,npq)=N(40,32) .
P(0≤X≤r)
Φ(r40)Φ(40)
设 X1, X2, …是独立同分布的随机
变量序列,且E(Xi)=,D(Xi)= 2 ,
i=1, 2, …,则
n
Xi n
x
lim P{i1
x}
n
n
-
1 e-t2 2dt
2
它表明, 当 n充分大时, n 个具有期望和方差 的独立同分布的 r.v 之和近似服从正态分布.
定理. (棣莫佛-拉普拉斯定理)
切比雪夫
则对任意的ε>0,
ln im P{n 1|i n1Xin 1i n1E(Xi)|}1
证明: 切比雪夫大数定律主要的数学工具是
切比雪夫不等式.
E(|1 n
ni1
Xi)1 ni n1E(Xi)
D(1 ni n1Xi)n12 i n1D(Xi)K n
二 . 中心极限定理
如果一个量是由大量相互独立的随机因素的 影响所造成,而每一个别因素在总影响中所起 的作用不大. 则这种量一般都服从或近似服从 正态分布.
在概率论中, 把无穷多随机变量和的分布收敛
4大数定律及中心极限定理

返回主目录
例.将一颗骰子连掷100次,则点数之和不少于 将一颗骰子连掷100次 100 500的概率是多少 的概率是多少? 500的概率是多少? 解:设Xk为第 次掷出的点数 设 为第k 次掷出的点数,k=1,2,…,100,则 则 X1,…,X100独立同分布. 独立同分布 7 1 6 2 49 35 E ( X 1 ) = , D( X 1 ) = ∑ k − = 2 6 i =1 4 12
n−>∞
则称 { X n } 服从大数定律。
返回主目录
第四章 大数定律及中心极限定理
§1 大数定律
定理 4.1(切比雪夫大数定理) 设随机变量 X 1 ,L, X n ,L 相互独立, 且具有相同的数学期
1 n 望及方差, EX k = µ,DX k = σ ,k = 1,2,L, 令 Yn = ∑ X k , n k =1
n
≤ x} =
1 2π
−∞
∫e
x
t2 − 2
dt
返回主目录
常见的中心极限定理
定理3(德莫佛-拉普拉斯定理)(De Moivre--Laplace) 设随机变量 η n (n = 1,2,L) 服从参数为n,p(0<p<1)的二 项分布 ,即 η n ~ B ( n, p ).
则对于任意 x ,恒有:
n =10, p = 0.2, np = 2, npq ≈1.265. (1) 直接计算: P(ξ ≤ 3) = C ×0.2 ×0.8 ≈ 0.2013
3 10 3 7
(2)用局部极限定理近似计算: P(ξ ≤ 3) =
例 产品为废品的概率为p=0.005, 求10000件产 品中废品数不大于70的概率.
实验四 大数定律与中心极限定理

【实验内容】 Vk 1.一个加法器同时收到 20个噪声电 k 1,2,,20 压 , V V .设他们是相互独立的随机 P(V 105) 变量,且都服从[0,10]上的均匀分布。 记 ,求 的近似值。
20 i 1
i
2.据说公共汽车车门的高度是按成年男 子与车门碰头的机会在0.01以下的标准 来设计的。根据统计资料,成年男子的 N (168,72 ) 身高X服从正态分布 (厘米), 那么车门的高度应该是多少厘米?
3000
2500
2000
1500
1000
500
0
2
4
6
8
10
12
14
16
18
20
图 2.23 a=10,p=0.7 时高尔顿试验结果的直方图
高尔顿钉板试验
(1) 分析并解释这种现象; (2) 如果圆珠下落到第二排后向左和向右滚落的概 率改变,则结果会如何改变? (3) 用 Matlab 模拟这个试验,并验证理论结果。
在命令窗口输入: >> n = [100 500 1000 3000 5000] ; >>k = 1000; >>Ey=[]; >>for jj = 1:size(n,2) X = [];Y = []; for ii = 1 : n(jj)
X(:,ii) = poissrnd(3,k,1); end Y(:,jj) = sum(X(:,1:n(jj)).^2,2); Ey(jj) = mean(Y(:,jj))/n(jj); end >>Ey
实验过程为,在Matlab命令窗口输入: >> Ex = 7300; >>Dx = 700; >>p = 1- Dx^2/(9400-Ex)^2 输出结果为: p= 0.8889
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章 大数定理和中心极限定理
从17世纪概率论产生开始,随着18、 19世纪科学的发展,人们注意到在某些 生物、物理和社会现象与赌博游戏之间 有某种相似性,从而由赌博起源的概率 论被应用到这些领域中,这同时也大大 推动了概率论本身的发展。
使概率论成为数学的一个分支的奠 基人是瑞士数学家j.伯努利,他建立了 概率论中第一个极限定理,即伯努利大 数定律,阐明了事件的频率稳定于它的 概率。随后棣莫弗和拉普拉斯又导出了 第二个基本极限定理(中心极限定理) 的原始形式。
是相互独立的,且:
P{i 1} p, E (i ) 2 p 1,
那么小珠最后的位置:
P{i 1} 1 p, D(i ) 4 p(1 p), i 1,2,...n
X a 1 2 ...n
高尔顿钉板试验
由中心极限定理可知, X 服从正态分布,且:
1 2 n
n 2 n i 1 i
2.已知每毫升正常成年男子的血液中, 白细胞数的平均值是7300个,均方差是 700,利用切比雪夫不等式估计成年男子 每毫升血液中,白细胞数在5200~9400 之间的概率。
【实验过程】 X , X ,, X , 1.由随机变量的独立性关系, 满足辛钦大数定律的条件 , 且各自的数学 E( X ) D( X ) [E( X )] 3 3 1 期望 1
算术平均值,即若干个数X1、 X2……Xn之和除以n,是最常用的一种 统计方法,人们经常使用并深信不疑。 但其理论根据何在,并不易讲清楚,这 是大数定律要回答的问题,在某种程度 上可以说,大数定律是整个概率论最基 本的规律之一,也是数理统计学的理论 基石。
n
大数定律从理论上回答了通过试验 来确定概率的方法:做n次独立的重复试 验,以 表示n 次试验中事件 p A发生的次 n 数,那么我们可以以很大的概率确 信 。
4.2 设计性实验
实验一 大数定律 【实验目的】 1.加深对大数定理的认识,对其背景和 应用有直观的理解 2.了解MATLAB软件在模拟仿真中的应 用 【实验要求】数学期望与方差的理论知 识,Matlab软件
【实验内容】 I f ( x)dx 用蒙特卡罗方法计算定积分 , I x dx 如 。 【实验方案】 通过概率论的想法实现数值计算的方法 叫做蒙特卡罗方法,其理论根据之一就 是大数定律。定积分的计算可以用如下 方法实现。
n
在客观实际中有许多随机变量,他 们是由大量相互独立的随机因素的综合 影响所形成的,其中每一个别因素在总 的影响中所起的作用都很微小。如测量 误差就可以看成是由很多微小的因素影 响的结果叠加而成的。
这些因素相互独立地对测量结果发 生影响,每个因素都只发生很微小的作 用,把它们的影响叠加起来就造成了误 差,类似这样的情况可以举出很多,而 在某种具体条件下,这种随机变量往往 近似的服从正态分布。
图 2.21 高尔顿钉板试验图
高尔顿钉板试验
(1) 分析并解释这种现象; (2) 如果圆珠下落到第二排后向左和向右滚落的概 率改变,则结果会如何改变? (3) 用 Matlab 模拟这个试验,并验证理论结果。
高尔顿钉板试验
以圆珠落下的水平线建立数轴, 并假设圆珠下落位置 A 的横坐标为 a。 如果定义:当第 次碰到钉子后滚向右边,则 向左边,令 ,则 ;当第 次碰到钉子后滚
高尔顿钉板试验
【实验过程】 在 Matlab 的 Medit 窗口建立文件 goldon. m: m=10; if y==0
n=10000; p=0.5; z=unidrnd(5,1,100); for j=1:n x=10; for i=1:m y=binornd(1,p);
end hist(z) end z(j)=x; end else x=x+1; x=x-1;
(
a 168 ) 0.99 7 a 168 2.33 7
在Matlab命令窗口输入: >>times = 1000; >>R = normrnd(168,7,times,1); >>pro = sum (R>184.31)/times 结果为: pro = 0.0090 说明一个人大于184.31cm的为0.0090,符 合小于0.01的要求。
拉普拉斯在系统总结前人工作的基 础上写出了《分析的概率理论》,明确 给出了概率的古典定义,并在概率论中 引入了更有力的分析工具,将概率论推 向一个新的发展阶段。
19世纪末,俄国数学家切比雪夫、 马尔可夫、李亚普诺夫等人用分析方法 建立了大数定律及中心极限定理的一般 形式,科学地解释了为什么实际中遇到 的许多随机变量近似服从正态分布。
这种现象就是中心极限定理的客观 背景。中心极限定理是概率论中论证随 机变量和的极限分布为正态分布的定理 的总称,也是大样本统计推断的理论基 础。
4.1 验证性实验
实验一 大数定律 【实验目的】 1.加深对大数定理的认识,对其背景和 应用有直观的理解 2.了解MATLAB软件在模拟仿真中的应 用
【实验要求】 大数定理的理论知识, Matlab软件 【实验内容】 X , X ,, X , 1.设随机变量 n相互独立且服 1 从参数为 Y X3的泊松分布。验证当 n 时,随机变量 依概率收敛到12。
2. 2 设计性实验
实验三 高尔顿钉板试验
【实验目的】 1.加强对正态分布的理解 2.了解独立同分布的中心极限定理 3.掌握 Matlab 软件在计算机模拟中的应用 【实验要求】 1. 了解建立 Matlab M 文件的方法,理解循环语句 for—end 和假 设语句 if—end 2.了解简单的 Matlab 程序设计,掌握用 Matlab 处理实际问题的能 力
E( X ) a (2 p 1)n,
D( X ) 4np(1 p)
由于圆珠落地坐标服从正态分布,故圆珠堆积成正态曲 线的形状。如果 p 的值发生改变,则曲线的形状和位置都将 会发生改变。由中心极限定理可知,独立同分布的若干随机 变量的和近似服从正态分布,故正态分布在实际问题处理中 占有很重要的地位。
可以通过Matlab验证,随机生成20个在[0, 10]上的均匀分布的噪声数据,计算它们的 和。重复多次,计算它们的和大于105的概 率。
在Matlab命令窗口输入: >>times = 1000; >>R = unifrnd(0,10,20,times); >>sigma = sum(R); >>pro = sum (sigma>105)/times 结果为: pro = 0.3510
依次给n赋值100 500 1000 3000 5000, 输出结果为: Ey = 12.0286 12.0125 12.0129 11.9974 12.0059 可以通过画出Ey的图形来观察它的变化 情况:
P{5200 X 9400 } P{5200 7300 X 7300 9400 7300 } P{ X 7300 2100 } 7002 1 0.8889 2 2100
高尔顿钉板试验
然后运行上述文件,运行结果如下:
2500 2000
1500
图 2.22 a=10,p=0.5 时 高尔顿试验结果的直方图
1000
500
0
1
3
5
7
9
11
13
15
17
19
从结果可以看到,当 a=10,p=0.5 时,圆珠堆积成的正态曲 线以 x=10 为对称轴。
高尔顿钉板试验
增大 p 的值,则正态曲线的对称轴向右移动, 如图 2.23。
在命令窗口输入: >> n = [100 500 1000 3000 5000] ; >>k = 1000; >>Ey=[]; >>for jj = 1:size(n,2) X = [];Y = []; for ii = 1 : n(jj)
X(:,ii) = poissrnd(3,k,1); end Y(:,jj) = sum(X(:,1:n(jj)).^2,2); Ey(jj) = mean(Y(:,jj))/n(jj); end >>Ey
实验过程为,在Matlab命令窗口输入: >> Ex = 7300; >>Dx = 700; >>p = 1- Dx^2/(9400-Ex)^2 输出结果为: p= 0.8889
实验二 中心极限定理 【实验目的】 1.加深对中心极限定理的认识,对其背 景和应用有直观的理解 2.了解MATLAB软件在模拟仿真中的应 用 【实验要求】 数学中心极限定理的理论 知识,Matlab软件
高尔顿钉板试验
图 2.21 中每一个黑点表示钉在板 上的一颗钉子,每排钉子等距排列,下 一排的每个钉子恰在上一排两相邻钉 子之间。假设有 排钉子,从入口处放 入小圆珠,由于钉板斜放,珠子在下落 过程中碰到钉子后以 0.5 的概率滚向左 边, 也以 0.5 的概率滚向右边。 如果 较 大, 可以看到许多珠子从 A 处滚到钉板 底端的格子中,堆成的曲线近似于正态 分布曲线。
【实验过程】 EVk 5 1.根据理论计算,易 V 20 5 V 100 k 1,2,,20 知 , 100 , 5 20 10 12 3 ,
N (0,1)
DVk
100 12
近似服从正态分布
所以
V 100 5 P(V 105) P 5 5 10 10 3 3 P ( 0.387) 1 P ( 0.387) 0.3483
3000
2500
2000
1500
1000
500
0
2
4
6
8
10
12