概率论文.doc

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

我眼中的概率论
一.有关概率:
1.概述
概率论是研究随机现象数量规律的数学分支。

随机现象是相对于决定性现象而言的。

在一定条件下必然发生某一结果的现象称为决定性现象。

例如在标准大气压下,纯水加热到100℃时水必然会沸腾等。

随机现象则是指在基本条件不变的情况下,一系列试验或观察会得到不同结果的现象。

每一次试验或观察前,不能肯定会出现哪种结果,呈现出偶然性。

例如,掷一硬币,可能出现正面或反面,在同一工艺条件下生产出的灯泡,其寿命长短参差不齐等等。

随机现象的实现和对它的观察称为随机试验。

随机试验的每一可能结果称为一个基本事件,一个或一组基本事件统称随机事件,或简称事件。

事件的概率则是衡量该事件发生的可能性的量度。

虽然在一次随机试验中某个事件的发生是带有偶然性的,但那些可在相同条件下大量重复的随机试验却往往呈现出明显的数量规律。

例如,连续多次掷一均匀的硬币,出现正面的频率随着投掷次数的增加逐渐趋向于1/2。

又如,多次测量一物体的长度,其测量结果的平均值随着测量次数的增加,逐渐稳定于一常数,并且诸测量值大都落在此常数的附近,其分布状况呈现中间多,两头少及某程度的对称性。

大数定律及中心极限定理就是描述和论证这些规律的。

在实际生活中,人们往往还需要研究某一特定随机现象的演变情况随机过程。

例如,微小粒子在液体中受周围分子的随机碰撞而形成不规则的运动(即布朗运动),这就是随机过程。

随机过程的统计特性、计算与随机过程有关的某些事件的概率,特别是研究与随机过程样本轨道(即过程的一次实现)有关的问题,是现代
概率论是一门研究事情发生的可能性的学问,但是最初概率论的起源与赌博问题有关。

16世纪,意大利的学者吉罗拉莫·卡尔达诺(Girolam o Cardano,1501——1576)开始研究掷骰子等赌博中的一些简单问题。

17世纪中叶,当时的法国宫廷贵族里盛行着掷骰子游戏,游戏规则是玩家连续掷 4 次骰子,如果其中没有 6 点出现,玩家赢,如果出现一次 6 点,则庄家(相当于现在的赌场)赢。

按照这一游戏规则,从长期来看,庄家扮演赢家的角色,而玩家大部分时间是输家,因为庄家总是要靠此为生的,因此当时人们也就接受了这种现象。

后来为了使游戏更刺激,游戏规则发生了些许变化,玩家这回用 2 个骰子连续掷 24 次,不同时出现2个6点,玩家赢,否则庄家赢。

当时人们普遍认为,2 次出现 6 点的概率是一次出现 6 点的概率的 1 / 6 ,因此 6 倍于前一种规则的次数,也既是 24 次赢或输的概率与以前是相等的。

然而事实却刚好相反,从长期来看,这回庄家处于输家的状态,于是他们去请教当时的数学家帕斯卡,求助其对这种现象作出解释,这个问题的解决直接推动了概率论的产生。

3.发展
随着18、19世纪科学的发展,人们注意到在某些生物、物理和社会现象与机会游戏之间有某种相似性,从而由机会游戏起源的概率论被应用到这些领域中;同时这也大大推动了概率论本身的发展。

使概率论成为数学的一个分支的奠基人是瑞士数学家j.伯努利,他建立了概率论中第一个极限定理,即伯努利大数定律,阐明了事件的频率稳定于它的概率。

随后棣莫弗和p.s.拉普拉斯又导出了第
二个基本极限定理(中心极限定理)的原始形式。

拉普拉斯在系统总结前人工作的基
础上写出了《分析的概率理论》,明确给出了概率的古典定义,并在概率论中引入了更有力的分析工具,将概率论推向一个新的发展阶段。

19世纪末,俄国数学家p.l.切比雪夫、a.a.马尔可夫、a.m.李亚普诺夫等人用分析方法建立了大数定律及中心极限定理的一般形式,科学地解释了为什么实际中遇到的许多随机变量近似服从正态分布。

20世纪初受物理学的刺激,人们开始研究随机过程。

这方面a ·n ·柯尔莫哥洛夫、n.维纳、a ·a ·马尔可夫、a ·r ·辛钦、p ·莱维及w ·费勒等人作了杰出的贡献。

二.有关概率的小故事——高斯导出误差正态分布
1809年,高斯(Carl Friedrich Gauss ,1777—1855)发表了其数学和天体力学的名著《绕日天体运动的理论》。

在此书末尾,他写了一节有关“数据结合”(data combination )的问题,实际涉及的就是这个误差分布的确定问题。

设真值为θ,n 个独立测量值为n X X ,,1Λ。

高斯把后者的概率取为
11()(;,,)()(),n n L L X X f X f X θθθθ==--L L (14)
其中f 为待定的误差密度函数。

到此为止他的做法与拉普拉斯相同。

但在往下进行时,他提出了两个创新的想法。

一是他不采取贝叶斯式的推理方式,而径直把使(9)式达到最大的1(,,)n X X θθ∧∧
=L 作为θ的估计,即使
()max ()L L θ
θθ∧= (15) 成立的θ∧。

现在我们把)(θL 称为样本n
X X ,,1Λ的似然函数,而把满足(15)式的θ∧
称为θ的极大似然估计。

这个称呼是追随费歇尔,因为他在1912年发表的一篇文章中,明确提到以上概念并非针对一般参数的情形。

如果拉普拉斯采用了高斯这个想法,那他会得出:在已定误差密度为 .,2)(||∞<<∞-=-x e m x f x m (16)
基础上,其中0>m 为未知参数。

θ的估计是样本n X X ,,1Λ中位数),,(1n X X med Λ,即
n X X ,,1Λ按大小排列居于正中的那一个(n 为奇数时),或居于正中的那两个的算术平均(n 为偶数时)。

这个解不仅计算容易,且在实际意义上,有时比算术平均X 更为合理。

不过,即使这样,拉普拉斯的误差分布(16)大概也不可能取得高斯正态误差那样的地位。

原因是X
是线性函数,在正态总体下有完善的小样本理论,而),,(1n X X med Λ要用于推断就难于处
理。

另外,这里所谈的是一个特定的问题——随机测量误差该有如何的分布?测量误差是由诸多因素形成,每种因素影响都不大。

按中心极限定理,其分布近似于正态分布是势所必然。

其实,早在1780年左右,拉普拉斯就推广了狄莫佛的结果,得到了中心极限定理的比较一般的形式。

可惜的是,他未能把这一成果用到确定误差分布的问题上来。

高斯的第二点创新的想法是:他把问题倒过来,先承认算术平均X 是应取的估计,然后去找误差密度函数f 以迎合这一点,即找这样的f ,使由(15)式决定的θ∧就是X 。

高斯证明了:这只有在 ⎪⎪⎭⎫ ⎝⎛-=22
2exp 21)(σσπx x f (17)
条件下才能成立,这里0>σ为常数,这就是正态分布
),0(2σN 。

高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。

高斯是一个伟大的数学家,
重要的贡献不胜枚举。

但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布),(2σμN 的密度曲线。

这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。

在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。

这要到20世纪正态小样本理论充分发展起来以后。

拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。

这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。

后来到1837年,海根(G.Hagen)在一篇论文中正式提出了这个学说。

其实,他提出的形式有相当大的局限性:海
根把误差设想成个数很多的、独立同分布的“元误差”n ξξ,,1
Λ之和,每个i ξ只取a ±两值,其概率都是1/2,由此出发,按狄莫佛的中心极限定理,立即就得出误差(近似地)服从正态分布。

拉普拉斯所指出的这一点有重大的意义,在于他给误差的正态理论一个更自然合理、更令人信服的解释。

因为,高斯的说法有一点循环论证的气味:由于算术平均是优良的,推出误差必须服从正态分布;反过来,由后一结论又推出算术平均及最小二乘估计的优良性,故必须认定这二者之一(算术平均的优良性,误差的正态性)为出发点。

但算术平均到底并没有自行成立的理由,以它作为理论中一个预设的出发点,终觉有其不足之处。

拉普拉斯的理把这断裂的一环连接起来,使之成为一个和谐的整体,实有着极重大的意义。

三.结束语
通过以上讨论我们知道要利用概率知识来指导我们作出科学判断,就必须考虑概率的统计性,在理性的基础上进行综合分析。

概率知识在其他很多领域都有广泛应用,实在是一门应该好好学习掌握的科学。

相关文档
最新文档