简述运筹学的起源与发展历程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简述运筹学的起源与发展历程——应用博弈论思想分析团队合作中个人理性和集体利益的关系
作者:张舒悦学号:14122690
日期:2015年1月19日
[摘要] 我们说理性表现为参与人为自己的目标进行推理或计算。因此·在博弈对峙的局面中,每个人的理性判断最终导致的行为选择,也许反而会使导致集体利益的最差,当然。也许两个参与者之间不能被看做集体,但是我们可以通过集体特点的分析,从而对每个人理性策略选择所构成的集体后果关联从而对个人理性与集体利益有一个更为全面的认识。
[关键词] 囚徒困境;集体;理性;利己主义
[正文]
一、运筹学科的起源发展与分支概括
运筹学的起源
运筹学(英国用operational research,美国用operations research,简称OR),从它的英文名称和中文翻译可以看出它与作战相关。中文“运筹”一词来源于《史记——留侯世家》,刘邦夸奖张良,“夫运筹帷幄之中,决胜千里之外,吾不如子房”。这一翻译不但传达了运筹学的渊源,而且反映了它的内涵,是翻译“信、达、雅”的最高境界。运筹学是一门内容广泛、应用广泛的交叉学科,它汇聚了数学、物理学、统计学、管理学、心理学、仿生学等众多的学科。有些分支的起源,如图论这一重要的分支的起源甚至可以追溯到16世纪;即使是在现代通信领域广泛应用的排队论,也可以追溯到20世纪初。但是,运筹学作为一门学科的出现确实要归功于第二次世界大战。
第二次世界大战是这样一个时期,科学发展从一门独立的学科发展向学科交
叉发展,从“形而上学”的研究方法向系统综合研究的方向发展,系统科学、信
息科学和计算机科学开始了它的早期发展。这个良好的发展时期被第二次世界大
战暂时中断,大量的科学家为了国家利益投入到了为战争服务之中。在德国一方,
科学家更多地投人各种杀伤武器的研究;而在英美一方,科学家被组织成为作战
研究小组,专门研究作战中的一些特殊问题,这些问题需要数学模型和方法来解
决。如雷达的部署问题、运输船队的护航问题、反潜深水炸弹投掷问题、飞行员
长机僚机配对问题、太平洋岛屿军事物资存储问题、项目管理问题等等。这些研究保障了英伦三岛免遭德军的蹂躏、美军在太平战争的胜利。
战后,这些科学家回到各自单位工作,但他们仍保持联系和活动,并将他们的研究成果推广到企业和政府应用之中。1948年,英国首先成立了运筹学学会;1952年,美国成立了运筹学学会;同年,Morse和Kimball出版《运筹学方法》,标志着运筹学作为一门新兴学科的正式诞生。从此,运筹学得到快速的发展。
1959年,国际运筹学联合会(IFORS)成立。我国于1980年4月成立中国运筹学学会,1982年加人IFORS,1992年,中国运筹学学会脱离数学学会成为独立的一级学会,于1999年8月组织了第15届IFORS大会。20世纪60年代以来,华罗庚、许国志等老一辈数学家致力于在中国推广运筹学,为运筹学的普及和深人开展做出了不可磨灭的贡献。
运筹学的发展
运筹学的快速发展还要归功于另外两个关键因素。一是第二次世界大战之后,运筹学的技术得到实质性的进展,最主要的贡献之一为:1947George Dantzig 给出了线性规划的单纯型解法。其后,一系列的运筹学的标准工具,如线性规划、动态规划、排队论、库存理论都得到了完善。第二个因素是计算机革命。由于计算机的出现,原来依靠手工计算而限制了运筹学发展的运算规模得到革命性的突破。计算机的超强计算能力大大激发了运筹学在建模和算法方面的研究;同时,大量标准的运筹学工具被制作成通用软件(如LINGO等),或编入企业管理软件,如MRPⅡ、ERP等。
计算机为非破坏性试验和系统仿真带来了强有力的手段,也促进了运筹学难解问题的算法研究,元启发式算法和人工智能算法应运而生。但在运筹学发展的历史上并不总是一帆风顺,也曾经出现过波折。特别是在20世纪70年代,运筹学曾深深陷入数学泥沼,出现大量让人费解的算法,严格限制条件下的收敛性证明,使建模和算法远远脱离实际问题和应用,压抑了很多以实际为背景的研究,运筹学界内部也分成为两派。我国运筹学界在20世纪90年代开始纠正这一现象,打出了
“应用——运筹学的生命”的旗帜。运筹学和企业实践相结合取得了丰硕的成果。
运筹学的分支
主要的分支有规划论(包括线性规划、非线性规划、整数规划、目标规划和动态规划)、图论与网络、决策论、对策论(博弈论)、排队论、存储论等。
二、应用博弈论思想分析团队合作中个人理性和集体利益的关系
从囚徒困境分析
囚徒困境最先是由普林斯顿大学的塔克(Albert Tucker)教授于20世纪50年代提出的。,两个共同作案偷窃的小偷被警察抓住,被带进警察局单独审讯。他们面临“坦白从宽,抗拒从严”的政策:如果一方向警方招认并揭发对方以前的犯罪行为,而对方不招认,招认者将当场释放,不招认的另一方则会被判重刑10年;如果双方都揭发对方,双方都有揭发他人的表现,但每人都被证明有罪,则各被判刑5年;而如果双方均不招认,因警察找不到他们以前犯罪的证据,只能对他们当下的偷窃行为进行惩罚,则各被拘留3个月。
若我们用甲、乙表示这两个小偷,不同情况下他们的收益或支付可表示成如下一个矩阵(这样的矩阵被称为支付矩阵):
乙
甲
如在甲招认、乙不招认的情况下,(当场释放,判刑10年)表示甲的“收益”为当场释放,乙被判刑10年。这两个小偷的理性选择是:招认。即无论对方是招认还是不招认,自己选择招认是最优的。这个博弈的双方的理性选择为:双方都招认。双方的收益为:双方均被判刑5年。
然而,若这两个囚徒双方“相互合作”,即都选择不招认,双方的结果是:双方均被拘留3个月。这个结果好于双方都招认。但这个博弈结果能够实现吗?当然不能,因为他们各自的
“理性计算”告诉他们,选择招认(即不合作)是合理选择。这两个囚徒陷入了困境。在博弈中,参与人被假定为理性的。现实中的我们也是有理性的。只要告诉我们推理规则,我们每个人能够从“已知的”前提得到“未知的”结论,即我们都能够推理;人被认为与其他动物的不同就在于,人有这样能力,这样的能力即“理性”。
无论是甲还是乙,“不合作”是“占优策略”,“合作”是被占优的:若对方采取合作策略,自己采取不合作策略优于合作策略;若对方采取不合作策略,自己采取不合作策略同样优于合作策略。这个博弈有唯一的纳什均衡—所谓纳什均衡是一个稳定的策略组合点,在该点上没有人愿意主动改变策略,因为所有参与人的收益在他人策略不变的情况下是最优的。在这个博奔中,只存在一个纳什均衡,该均衡为这个博弈的最后结果要差。但是,双方均合作的结果无法在博弈中实现。
若一个博弈只有一个纳什均衡,这个博弈将实现这个均衡,即这个均衡是可预测的。在囚徒困境博弈中,参与人能够预先预测双方“不合作”这个最后结果。
现实生活中的许多例子其结构就是囚徒困境。在这类博弈中,每个理性的参与人通过理性的分析,得出“不合作”行动是最优的选择。即每个人均不合作的均衡,是群体中每个人理性选择的结果。然而存在“更合理”的结果——每个人均“合作”。对于这个更合理的结果,每个囚徒的理性能够通过分析而得出,但是它是不可实现的。然而,社会在面临囚徒困境时会朝向形成“集体”的方向努力,逐渐形成一个“类参与人”的集体,以克服个体理性的局限。
我们往往说,人类的理性是有限的,这指的是我们每个人的理性能力是有限的,这种有限性往往指的是计算能力的有限。然而,上述囚徒困境博弈中,博弈论专家发现,群体陷入困境中,原因不在于个体理性的有限性,即不是理性不足造成,而是理性本身造成的。
有人可能认为,这似乎只是一个模型,因而所谓理性的困境只是理论家的纯粹杜撰。然而其实这个博弈模型有广泛的解释力,如可作为军备竞赛、公共地悲剧、环境污染等的模型,也可以用之来解释我国基础教育困境模型①。企业为了打垮其他同行企业,竞相降价、倾销,结果是自相残杀;每个国家都无节制地向空气中排放温室气体,以至于温室效应越来越严重;冷战时期美苏两霸的军备竞赛使人类走到