统计学的故事

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学的故事

纪宏袁卫文

2004年1月

第一回人类发现①了统计统计改变了世界若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。

——南丁格尔

列位,一般故事或小说的开头总是写的比较虚,没有什么干货,只是交代一些背景。平均说来,到了第三回主要人物才出现,到了第五回矛盾冲突才展开。本文也决不敢例外。

大千世界,芸芸众生,悠悠上下五千年,坐地日行八万里。这个世界所在的宇宙真奇妙,时间上没头没尾,空间上没边没沿。世界上的万物真复杂,自然界和人类社会好像都受到某种力量和规律的支配,可怜的是我们还无法确切地认识、把握这些力量和规律,偶然事件常常捉弄我们的命运。这个世界上的人们真倔,非要把这个很难描述的世界,包括客观世界和我们的主观世界整明白不可,大到宇宙空间,小到基因和纳米,探索者前仆后继,没完没了。

任何值得一提的文明都探索过真理,冥思苦想的人们尽管不能完全确切的,但总是试图解释复杂多变的自然现象和人类自身。

在很早很早以前,人们认为自然是神秘、无序,甚至是恐怖的。而人类自身也有很多谜题,例如,人类为何定居在这个地球上,人生的目的是什么,人类的终极归宿何在,等等。这些问题的答案一般是由宗教领袖给出的。

过了很多很多年,智者、思想家和勇敢的科学先驱们,或统称为人民,逐渐摒弃了上帝按其意愿创造了人和物质世界的信仰。他们发现人类有智慧,用思维,佐以观察或实验,就能够发现各种谜一样的自然活动和人们自己。他们用思维与似乎瞬息万变的现象抗争,并将理性之光洒于其上。先驱的态度是理性的、批判的和反宗教的。由于他们的态度较好,终于得出了这样一些结论:自然和人类社会是有序的,按完美的设计而恒定地运行着,从星体的运动到树叶的颤动,从人们的行为到人们的观念,所有感官能感知的东西都能用一种精确、和谐而理想的

①我们实在想不通,用“发现”和“发明”哪个词更符合实际。

形式来描述。用土话说,自然和社会都是有规律的,这种规律虽然不受人的主观意志的影响,却能被人的思维所理解。

又过了很多很多年,经过无数人大胆的观察、敏锐的猜想、天赋的直觉和一不怕苦二不怕死的精神,建立了现代科学的理论体系和思想体系。在天文学、物理学、生物学、人文社会科学以及数学和哲学等领域都取得了重大成果。虽然数百年来,科学和哲学的门派林立,各自有各自的掌门人,各自占据着各自的山头,都因自己发现真理而笑傲江湖。但有一个基本观点被大多数人承认,即这个世界是有规律的。我们是否可以用身边的事和通俗的语言解读一下科学巨匠们所研究的规律。请想一想,我们身边经常发生的重复出现的、有规律的现象:太阳每天从东方升起,冬天过去春天就要来临,物体失去支撑就会坠落,“神舟五号”飞航按设计的轨道运转,经济按市场规则运行,奔波的人们按自己的哲学度日。对不同领域中的规律进行探索和描述便形成了不同的学科。将不同学科的理论、方法、思想进行提炼,便形成了哲学、数学、统计学这样一些横断科学。

同时,我们在发现我们周围的事物没有任何一次重复是完全的“克隆”,没有任何东西会把一切细节完全重复出来。太阳每天从东方升起,但天安门广场上与太阳同时升起的国旗其升旗时间却每天不同;冬天过去春天就要来临,但今年的春色比去年更加明媚;物体失去支撑就会坠落,但受风速、风向、地心引力等很多细小因素的影响,两个同样重的物体坠落速度和落点会有差别;“神舟五号”飞船按设计的轨迹运转,但每次经过我国领空的时间都略有差距;经济按市场规则运行,但今年的GDP比去年增长8%;奔波的人们按自己的哲学度日,但一年又一年我们的生活逐渐发生了改变。因此,任何科学都只能预见大体上的重复现象。

行笔至此,我们是否感到统计学太重要了。统计学就是通过差异描述规律;透过现实走向理性,走出混沌,走向秩序的学科。“可以毫不夸大地说,现代科学的发展是在关注大数目现象的标志下进行的,很快就不会有不了解研究的随机性——统计方法的知识分支了”。的确,理、工、农、医、文,今天很难找到一个不使用统计的学科了,它在解决现代科学的那些最重要的和最多样化的课题中起着主导作用。统计学是科学的“母亲”和“仆人”。说她是“母亲”,因为统计学为其他学科起着孕育、生产新思想的作用;说她是“仆人”,因为统计学是其他学科的工具,用统计规律逼近客观规律的工具。

但是,故事总有插曲,关于统计学客观基础问题的争论,从来未停止过。从古

希腊思想家那里开始到现在,一直存在两种对立的意见。一种意见认为,世界的本质是确定的,随机性只是由于人们认识的局限性而产生的噪音,他们总是将所有现象都解释成无微不至的事物秩序所产生的结果,在事物的重复出现中会因很多细节而产生差异,但这种差异只是目前人们还不了解这些细节而已。统计学只是对随机性差异的度量,是主观内容的范畴,在客观世界中没有什么对应他们的东西。虽然,统计学在科学研究中起着重要作用,但这个作用只是在认识过程中由相对真理到绝对真理的迈进中的作用。因而,这种意见认为,只有数学才能牢固把握客观世界的所作所为,能瓦解玄秘并代之以规律和秩序。而统计学则是由于人力所不及不得已而为之的方法,其基础不是客观的,只是人们知识不足和信息不完备的代名词,虽然统计学是我们人类自己发明的探索客观规律最好用的方法,但数学才是上帝的宠儿,统计学只是人类的智慧。爱因斯坦给波尔的一封信中有这样一句名言:“你信仰掷骰子的上帝,我却信仰客观存在的世界中完备的定律和秩序”。←文中暗表,那个时期人们所说的上帝似乎有两种意思,一种意思是神学中的上帝,和中国的玉皇大帝、灶王爷之类的东西相似;另一种意思是好像是指不为人们的意志为转移的客观规律,斯密的“看不见的手”与其有点相近。在那个神学和科学混合的时代,这两种意思很难分清楚,只好麻烦读者自己判断。直到20世纪初,科学界一直是这种观点,即机械决定论占统治地位。牛顿力学被称为科学思想的典范,学者们总是力图使科学规律符合严格确定性的理想。

关于统计学客观基础问题的另一种意见认为,随机性本身也是客观的,统计学则反映的是知识体系中不依赖于人的关于客体的内容,上帝和人间的赌徒一样,也喜欢掷骰子。有一个著名的故事:拉普拉斯把他写的《天体力学》献给拿破仑。《天体力学》是一本极具影响力的书,描述了如何根据地球上的观测数据,来计算行星与彗星的位置。拿破仑看后说:“拉普拉斯先生,你写了这本关于宇宙系统的书,却根本没有提到他的创造者——上帝”。据传说,拉普拉斯回答道:“我不需要这个假设条件”。

拉普拉斯的《天体力学》虽不需要上帝,但它需要另一种东西,叫误差函数。从地球上观测行星与彗星的位置与预测值并不完全吻合,拉普拉斯将其原因归结为观测误差,包括随机误差和人为误差,并都放入误差函数中。当时的科学家都

←《爱因斯坦文集》商务印书馆1976年版,第415页。

相关文档
最新文档