概率论公理化的历史进程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率论公理化的历史进程
英才学院
计算机科学与技术专业
班级:1240004班
姓名:马恒钊
学号:7120310417
引言:概率论是从赌博问题的研究中诞生的,经历了比较漫长的公理化进程,从这之后概率论才变成了一门真正的科学。因此公理化在概率论的发展史中有着重要的地位。
关键字:贝特朗悖论公理化柯尔莫戈洛夫
一、产生与挑战——贝特朗悖论
概率论在17 世纪中叶由研究赌博问题而诞生。到了19世纪, 由于获得新的研究动机以及分析方法的引入, 使得概率论获得了重要进展。可是在发展过程中, 概率论没能演绎成一门逻辑上完美的数学学科, 它的基础存在着缺陷。这是因为19世纪的分析本身就没有严格化, 以它为研究工具的概率论的严格化就可想而知了。虽然, 后来分析的基础严密了, 但概率论公理化所必须的测度论还未发明, 故不严密是难以避免的。在这种情况下, 出现了“贝特朗悖论”等问题,对概率论的基础提出了挑战。
贝特朗( Bertrand)悖论是概率论中的一个著名问题, 其问题是: 在圆内任作一弦, 求其长超过圆内接正三角形边长的概率(如图1)。此问题可以有三种不同的解答:
1) 作一条铅直的直径, 再作垂直于此直径的弦。弦长可以由它与直径的交点唯一确定。当弦交直径于1 /4点与3 /4点之间, 其长才大于内接正三角形边长(如图2)。设交点落在直径上哪一点是等可能的, 则所求概率为1 /2
2) 固定弦的一端到正三角形的一个顶点, 弦长可以由弦的另一端点的位置唯一确定。当弦的另一端点落在圆弧上AB之间时, 其长才合乎要求(如图3)。设弦的另一端落在圆周上哪一点是等可能的, 则所求概率为1/3。
3) 弦可以由中点唯一确定。当弦的中点落在半径为大圆半径一半的同心圆内时, 其长才合乎要求(如图4)。设中点位于圆内哪一点是等可能的, 则所求概
率为1/4。
此问题从三个不同的角度来考虑, 做出三种不同的答案。这严重违背了常理。这就是贝特朗悖论。
二、问题的源头——人们对概率的各种解释
为了解决上述问题,历史上出现了对概率的各种认识, 既有实体概率——概率局限于实在的物质世界, 也有主观概率——反映了人们对某些事物的一种信任程度, 是对事物的不确定性的一种主观判断[ 3] 。
前一种有以拉普拉斯(Pierre Simon Laplace,1749—1827)为代表提出的古典定义: 事件的概率等于有利于事件的结果数与所有可能的结果数之比。然而, 这种定义讨论的对象局限于随机试验所有可能结果为有限个等可能的情形。若随机试验中的基本事件有无穷多个, 且每个基本事件发生是等可能的, 这时就不能使用古典概率, 于是产生了几何概率。随着人们遇到问题的复杂程度的增加等可能性逐渐暴露出它的弱点, 特别是对于同一事件, 可以从不同的等可能性角度算出不同的概率, 从而产生了种种悖论。
另一方面, 随着经验的积累, 人们逐渐认识到,在做大量重复试验时, 随着试验次数的增加, 一个事件出现的频率会集中在该事件的概率, 这就是概率
的频率定义。当试验次数n充分大时, 频率fn (A ) 越来越接近于概率P (A )。“频率fn (A ) 越来越接近于P (A )”的含义是指“随着n 的增大, ( | fn (A ) -P (A ) | ) 发生的可能性越来越小。或者说, 随着n的增大, 事件{ | f n (A ) - P (A ) | } 发生的概率趋向于0。
我们可以看出: 一方面“频率接近于概率”表明概率是一个客观存在, 并且频率可以作为概率的近似值; 另一方面, 频率接近于概率的含义本身却又需要通过“概率趋于0”来描述。
上述这些问题使得一些人对当时的概率论中的一些概念和方法产生了怀疑。于是, 人们不得不探讨解决的办法, 而解决的办法就是完善概率论自身的理论基础。于是, 1900 年希尔伯特( David Hilbert,1862—1943)在巴黎国际数学家大会上所作的著名的报告中的第6问题, 就呼吁把概率论公理化。由此, 概率论公理化成为当时数学及整个自然科学的最迫切的问题之一。
三、解决的尝试——最初的公理化理论
20世纪初, 许多数学家尝试解决这个问题。最早对概率论严格化进行尝试的是俄国数学家伯恩斯坦。1927 年伯恩斯坦《概率论》第一版出版, 书中给出了一个详细的概率论公理体系。他假定了一个我们在自然科学中进行推理所依据的基本方案, 即根据以往的经验, 我们断言, 只要给定的条件集合实现, 属于已知类的事件A 就必然发生, 这和任何其他因素都无关。然而, 一般而言一个事件不可能绝对出现。人们不能完全确切地预言真实现象的行为。只有当条件集合α不太大, 而且易于观测时, 把α和A联系起来的规律才有实际意义。如果这个条件不成立, 事件A就叫做随机事件。然后, 他试着引进一个简单点的条件集合β来代替α, 它(至少在理论上) 可以重复实现无限多次, 当β存在时, 给定试验中事件 A 以一个明确的概率发生, 而且这个概率可以用数值表示。如果也定义了事件B 的概率, 那么下面3个关系必有一个成立:
P (A ) = P (B ); P (A ) > P (B ); P (A ) < P (B )。
然后, 伯恩斯坦引进了3个公理: ①概率的可比较性公理; ②不相容事件公理;③事件组合公理。前两个公理考虑了条件集合β固定的情况。第三个公理把条件α下A 的概率与不同的条件集合β下同一事件的概率联系起来。
伯恩斯坦就在这3个公理的基础之上构造了概率论的整个大厦。正像柯尔莫戈洛夫所指出的, 第一个系统的概率论公理化体系是伯恩斯坦给出的, 他建立的基础是, 根据随机事件的概率对事件做定性比较的思想。在定性比较这一思想中概率的数值似乎是推导而来的, 而不是一个基本概念。因此, 伯恩斯坦的工作并没有真正解决问题。上面已经提到, 概率概念是公理化概率论的基础, 人们对此有着不同的理解。当时出现了许多对这些认识的评论, 其中最著名的是米泽斯( R. V on Mises, 1883—1953)的工作。他的主要工作是概率论的频率定义和统计定义的公理化, 他在《概率、统计和真理》( 1928)一书中建立了频率的极限理论。他明确强调, 概率概念只有在大量现象存在时才有意义。米泽斯的频率理论中最根本的概念是“集体”概念。集体是由相似的事件或过程组成的无限序列K, 每个事件确定一个给定的有限维空间R 的某个点。他把一事件的概率定义为该事件在独立重复随机试验中出现的频率的极限, 并把此极限的存在性作为他的第一条公理。他的第二条公理是, 对随机选取的子试验序列, 事件出现的频率的极限也存在并且极限值相等。严格说来, 第二条公理没有明确的数学含义。因此, 这种所谓公理化在数学上是不可取的。虽然, 频率定义在直观上易于理解, 易为实际工作者和物理学家所接受, 便于在实际工作中应用。但是, 像某个事件在一独立重复试验序列中出现无穷多次这一事件的概率, 米泽斯理论是无法定义的。因此, 他们的公理理论都是不尽如人意的。
四、公理化的建立
从20世纪20年代开始, 概率论的研究类型在很大程度上是由集合论和函数论的思想所决定的。通过对概率论基本概念——事件与概率的仔细分析, 可以发现事件的运算与集合的运算完全类似, 概率与测度有相同的性质。这成为建立概率论逻辑基础的正确道路。在这方面的研究最卓著的是柯尔莫戈洛夫[ 7] 。
概率论中一个十分重要的定律就是大数定律。自第一个大数定律建立起, 数学家们对它进行了深入的研究, 这些研究实质上是对大数定律条件的推广, 即扩大了满足定律的随机变量序列的范围, 其科学价值在于发现了大数定律的一般条件, 而这揭示了平均值的统计稳定性, 即随机的规律性。其中, 马尔科夫(A. A. Mapkob, 1856—1922) 在这方面的工作值得称赞, 他削弱了中心极限定理与大数定律的条件限制, 把随机变量互相独立的情况推广到变量相关的情况, 把相关随机变量引入概率论研究[ 8 ] 。马尔科夫推广了大数定律的适用性, 但他没有得到这个问题的明确解答。只有通过函数论的方法和概念, 才能建立大数定律适用性的充分必要条件。1926年, 柯尔莫戈洛夫得到了这些条件,他解决了概率论的一个中心问题—(弱) 大数定律。
法国数学家博雷尔(E. Borel, 1871—1956) 于1909年得到强大数定律: 设m 是事件A 在n 次试验中出现的次数, 在每次试验中事件A 出现的概率均为p, 则有
他解决的是p =1/2时伯努利概型的情况。
在所有这些研究中, 与度量函数论的相似之处起了重要的作用, 特别是弱大数定律类似于测度中的收敛概念, 强大数定律类似于处处收敛。正是由于对大数