第六回文学巨作_红楼梦_我给雪芹改文章_统计学的故事_五_
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2003-8・总第161期
俄国著名数学家马尔可夫(1865-1922),在对俄语字母序列的研究中,提出了马尔可夫随机过程,后来扩展成统计学的一个分支,对现代统计学的发展产生
纪 宏 袁 卫\文
漫 笔
开篇不谈《红楼梦》,读尽诗书也枉然,曹公若懂概率论,不让马尔可夫链。
——国际红学大会未入选论文
了深刻影响。语言结构中所蕴藏着的统计规律,成了马尔可夫创造性思想的源泉。作为人类语言和文学发展的新方向,马尔可夫的思想和工作在统计学与语言文学的结合上具有开创意义。
而后,到了20世纪中期,文献计量学、数理语言学、计算风格学相继诞生。统计学进入了一个全新的领域。我国学者也开始涉足这方面的研究。
本文作者之一,袁卫教授1989年在其专著《统计推断思想》一书中,给我们讲述和分析了曹雪芹一个鲜为人知的故事。
在《红楼梦》第六十三回“寿怡红群芳开夜宴死金丹独艳理亲丧”中宝玉过生日,晚上请来了林黛玉、史湘云、薛宝钗、李纨、探春、薛宝琴等在怡红院玩摇骰子抽签的游戏。大家围成一圈,按照摇出骰子的点数数到谁,谁就从签筒中抽出一签,按照签上要求或罚做诗、或罚喝酒。按照电视连续剧《红楼梦》编剧周雷的考证,
6 5李纨 宝钗
黛玉7湘云8宝玉9
袭 芳 碧 四 春 秋 麝 晴
人 官 痕 儿 燕 纹 月 雯10 11 12 13 14 15 16 1香菱2宝琴3探春4
图1怡红院群芳开夜宴座位顺序
其位顺序见图1:
开始时,由晴雯第一个摇装有四个骰子的罐儿。摇毕一看,是为5点,即3个1点和1个2点。然后,由摇骰子本人晴雯算起,按逆时针方向数至第5人是宝钗。由宝钗抽签、再摇、再数……依此类推。见表1:
我们感兴趣的是摇四颗骰子出现的点数分布,设这四颗骰子均为正常的骰子,则其分布律如表2所示:
我们看到,晴雯、宝钗等共摇了八次,竟然有六次结果是小于百分之五(0.05)的小概率事件。特别是晴雯和香菱分别摇出了概率为0.0031和0.0077的5点和6点。这种小概率事件对于单独的一次来说,是不可能发生的。对于总共只有八次的情况,出现的概率应该说是很小的。那么是否应怀疑所摇的骰子中有假呢?这个可能性也应该排除,因为曹雪芹书中并未做此交待,况且宝玉他们仅仅是摇骰子做游戏而并非赌博,并无做假的必要。那么出现这
表1大观园群芳掷骰子顺序、点数表 摇骰次数 传递顺序 点数1晴雯——宝钗52宝钗——探春163探春——李纨194黛玉——湘云185湘云——麝月96麝月——香菱197香菱——黛玉68
黛玉——袭人
20
北京统计・2003-8・总第161
期
57
∩
A B种小概率事件应作何解释?依笔
者推测,曹雪芹在写到这一回时,
事先确定了摇骰子的几位人物,
并为他们设计了签子及诗句,以
作为此人命运的写照和伏笔。例
如轮到探春摇之前,她抽到签子
上写到:《瑶池仙品》诗云:日边
红杏倚云栽。注云:得此签者必得
贵婿,大家恭贺一杯,再同饮一
杯。这些话暗示着她后来远嫁之
事。因而,我们可以推断曹雪芹写这回时是先确定了每一轮的人选后,再按照座次人物的顺序人为
地确定摇出的点数。如果曹雪芹有一些概率分布的知识,他就会合理安排人物的顺序而给出合理的点数,即不使这样的小概率事
件发生。由此我们的结论就是,曹
雪芹不了解概率分布,不太懂摇骰子中的概率理论。我们的这一结论一方面是根据统计逻辑推理,另一方面也考虑到概率论发展历史。
我们知道,曹雪芹是18世纪的人。他生于康熙年间,卒于乾隆盛世(1719?——1763)。当时,由赌博而兴起的概率论研究在西方也才起步不久。17世纪末至18世纪初,瑞士数学家J・贝努里写出
一本重要的概率论著作《推测法》,提出了或然性原理和贝努里大数定律。他的这本书是在他1705年死后,由他的侄子N・贝努里于1713年整理出版的。继贝努里之后,法国数学家德・莫依佛尔进一步研究了概率论的问题,由二项式(p+q)n推出了正态分布曲线,这是1733年的事情。曹雪芹在世的年代,还无记载说明中国当时已进行了概率研究。而我们所知道的是,在19世纪末至20世纪初,概率统计理论才从欧洲经日本传入我国。这样,我们又从史实上证明了曹雪芹在当时没有具备掌握概率分布的客观条件,故我们在前边的推测和结论应该说是有根据的。该例中由于实际摇骰子的次数(8次)太少,因而无法像孟德尔豌豆试验那样进行拟合优度x2检验。但统计推理逻辑告诉我们,小概率事件对大量试验观察来讲,出现的次数是极少的,对个别事件来说是不可能发生的。一旦发生了,我们就有理由对推理的前提质疑。我们这一推理的模式或者思想就是:
其中B代表实际摇了八次的样本,A表示四颗骰子点数的分布律,或者摇骰子的随机试验。B假表示小概率事件不可能出现,
那么由B假推出A极不可靠,即表明摇骰子的试验不是随机的。换句话说,上述事件是曹雪芹主观想像的。
这事儿不能怨曹雪芹,虽然曹雪芹如果一边写《红楼梦》,一
边研究概率论,其成果可能比马
尔可夫早问世一百多年,但中国的知识分子自命清高,认为赌博是有辱斯文的事儿,不可能像西方知识分子那样从中研究并创立什么概率论。 那么,只好借助于赌徒修改《红楼梦》了。《红楼梦》第六十三回可做如下修改:贾环素日原本恨宝玉,今日又见他与众姐妹吃酒作乐,心中越发嫉妒,无奈,请教吃、喝、嫖、赌都占全的薛蟠、
薛蟠让贾环买通了林之孝家的,
在骰子上做了些手脚,原本是为
喝醉他几个人,使夜宴败兴而
散……笔者的这些修改,文采远
不及曹雪芹,甚至不如高鹗,但基本符合概率统计原理,使其不出现逻辑的错误。
统计与文学的这种结合,已由个别上升到了一般。请看下一
回:人文的基因 艺术的巡礼。
参考文献
[1]《统计推断思想》袁卫著 1990年中国统计出版社
[2]《红楼梦》第六十三回曹雪芹著1982年人民文学出版社
[3]《世界统计名人传纪》龚监尧著2000年中国统计出版社
(wy)
表2掷四颗骰子点数的分布律点数(Ai) 理论次数 概率P(Ai) 实际次数410.0008540.003116100.00771
7200.01558350.02709560.043010800.0617111040.0803121250.0965131400.108014
146
0.1127
151400.1080161250.09651171040.080318800.0617119560.0430220350.0270121200.015522100.00772340.00312410.0008合计12960.99998 B假
A极不可靠