从博弈论的视角解读历史事件-2019年精选文档

合集下载

博弈论以及经典案例分析

博弈论以及经典案例分析
• 常和博弈。在这种博弈中,各种结果下的各博弈方得益之和总是 等于一个非零常数。与零和博弈一样,常和博弈各方的利益关系 也是对立的,一方多占有一点利益,另一方必然会少占有一点。
• 变和博弈。即意味着在不同策略组合下各博弈方的得益之和是不 同的。倘若博弈各方之间相互配合,则可能争取到总得益和个人 得益均较大的理想结局;反之则社会总得益和个人得益均较小。
1.碟子、猫和古董商 有位古董商发现有个人用珍贵的碟子做猫食碗,于是假装对这 只猫相当喜爱,要从主人手中买下。猫主人不卖,为此古董商出高 价。
成交之后,古董商装作漫不经心地说:“这个碟子它用惯了, 就一块给我吧。”猫主人不干了:“你知道我用这个碟子已经买出 多少只猫了?”下面分析该故事。在这里
知识是“碟子是古董”
• 在这种情况下,无论是对开发商A还是开发商B,都不 存在一种策略优于另一种策略,也不存在严格劣策略: 如果A选择开发,则B的最优策略是不开发;如果A选 择不开发,则B的最优策略是开发;类似地,如果B选 择开发,则A的最优策略是不开发;如果B选择不开发, 则A的最优策略是开发。
第二节 生活中的博弈论
完全信息指的是每一个参与人对所有其他参与人的特征, 如策略集合及得益函数都有准确完备的知识;否则就是 不完全信息。
☞将上述角度的划分结合起来,我们就得到四种不同类型 的博弈,这就是:完全信息静态博弈、完全信息动态博 弈、不完全信息静态博弈、不完全信息动态博弈
表5-1 博弈的分类和均衡表
行动次序 信息
三、博弈论的基本概念
(一)博弈论的定义
博弈论(gametheory),又译为对策论,就是研究决策主体的行为 发生直接相互作用时的决策以及这种决策的均衡问题。实际上, 博弈是一种日常现象。
在经济学中,博弈论是研究当某一经济主体的决策受到其他经济主 体决策的影响,同时,该经济主体的相应决策又反过来影响其他 经济主体选择时的决策问题和均衡问题。

博弈论历史

博弈论历史

博弈论历史博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

以下是我为你整理的博弈论发展历史。

欢迎欣赏阅读。

博弈论发展历程博弈的原始思想萌芽于两千多年前,《孙子兵法》、《孙膑兵法》、《三十六计》、《六韬》等书中就有许多博弈案例,“田忌与齐王赛马”就是博弈实例之一。

《摩诃婆罗多》、《梨俱吠陀》、《圣经》中记述了骰子游戏,我国在春秋战国时期就出现六博、围棋等博弈。

在西欧,德国哲学家和数学家莱布尼茨于1710年就预言了关于策略博弈理论出现的必要性和可能性。

其后两年,詹姆斯·华尔德格拉特James Waldradre首次提出了“极小极大”定理的概念。

虽然对具有策略依存特点的决策问题的零星研究则可上溯到18世纪初甚至更早,但是,博弈论的真正发展与成熟还是在20世纪。

在20世纪20年代,法国数学家波莱尔 Borel最早用数学语言刻画了博弈问题,提出了“策略”和“混和策略”概念,用最佳策略和概念研究了下棋和其它许多具体的决策问题,并试图把它们作为应用数学的分支加以系统研究。

冯·诺伊曼Von Neumann是博弈论又称对策论的创始人之一,1928年他发表“关于伙伴游戏理论”Zur Theorie der Gesellschaftsspiele提出两人零和博弈的极小极大定理。

他首次证明了博弈论基本定理,即“每个矩阵博弈都能通过引进混合策略而被严格决定”,现代博弈论正式诞生。

他讨论了合作对策问题,特别是三人零和博弈中有两方联合的情形,结果表明在附加条件下,N人博弈问题的解存在且唯一。

1944年冯·诺伊曼和摩根斯坦Morgenstern合作的《博弈论和经济行为》一书提出合作博弈的基本模型,标志着系统的博弈理论的初步形成。

他们创立了博弈论研究的基本概念。

到20世纪50年代,合作博弈发展到鼎盛时期,包括纳什Nash和夏普里shapley的“讨价还价模型”,吉尔斯Gillies和夏普里关于合作博弈中的“核”Core的概念以及其他一些人的贡献。

博弈论_中国古代著名事例与现代博弈论

博弈论_中国古代著名事例与现代博弈论
几个中国古代人文故事 与现代博弈论
2021/6/16
1
引言
作为一门学科,博弈论虽然只有几十年 的历史,但博弈的思想可以追溯上千年
具有灿烂文明的中国古代文化,其中的 优秀成果在今天看起来,对我们仍有很 多启迪。
这里从博弈论角度,选择几个著名事件, 进行一些分析、阐述
引言
所见到的文献,多数从古代军事家行为 进行分析,如田忌赛马等。
❖1,如果谁都不做这件事情 ❖3,如果自己做这件事情 ❖4,自己不做但其他人去做这件事情
事例2:三个和尚没水吃
该博弈有n个纯策略纳什均衡:恰好有 一个人去做这件事情
当n增大时,纯策略数目将相应增多 在实际中,哪一个纯策略均衡将会发生?
事例2:三个和尚没水吃
当人群中成员彼此存在差异时,这n个 纳什均衡的实际发生可能也存在“聚 点”(focus point)。比如,社会规范可 能要求人群中最年轻的或社会地位最低 的去做诸如“打水”的事情。
❖显然“鱼之乐”并不是庄子与惠子的共同 知识,按照庄子的逻辑,“鱼之乐”是私 人信息,因此庄子说“子非我,安知我不 知鱼之乐”,以此反击惠子的诘难。
事例1:子非鱼
议题2:不完全信息
❖由于存在着只有一方知道的信息(鱼是否 快乐),因此庄子与惠子间进行的是不完 全信息博弈。
事例1:子非鱼
议题2:不完全信息
事例2:三个和尚没水吃
上面分析可以推广到其他事情,如人员 合理组合、见义勇为事件减少的解释、 公共产品的建设等。
请大家作为课后练习选择其一。
结束语
若有不当之处,请指正,谢谢!
事例2:三个和尚没水吃
于是最佳p的确定应该是“打水”与 “不打水”的期望收益相同,即
3 = (1-p)n-1 +4[1-(1-p)n-1] 即p=1-(1/3)1/(n-1) (n≥2) 从上式不难看到,随着n增大,p值在减

博弈论案例分析报告

博弈论案例分析报告

博弈论案例分析报告博弈论是一门研究决策主体的行为在直接相互作用时,人们如何进行决策以及这种决策如何达到均衡的问题的学科。

它在经济学、管理学、政治学、社会学等多个领域都有着广泛的应用。

下面通过几个具体的案例来深入分析博弈论的实际应用和原理。

案例一:囚徒困境假设有两个嫌疑犯 A 和 B 因涉嫌一起犯罪被警方抓获。

警方将他们分别关押在不同的房间进行审讯,并分别向他们提出以下条件:如果 A 坦白而 B 抵赖,A 将获释,B 将被判刑 10 年;如果 A 抵赖而 B 坦白,A 将被判刑 10 年,B 将获释;如果 A 和 B 都坦白,每人将被判刑 8 年;如果 A 和 B 都抵赖,每人将被判刑 1 年。

从个体角度来看,对于A 来说,如果B 坦白,A 坦白会判刑8 年,抵赖会判刑10 年,所以A 会选择坦白;如果B 抵赖,A 坦白会获释,抵赖会判刑1 年,A 还是会选择坦白。

同理,B 也会做出同样的选择。

因此,最终的结果往往是两人都坦白,各判刑 8 年。

然而,从整体最优的角度来看,如果两人都抵赖,每人只需判刑 1 年,这显然是更好的结果。

但由于双方无法信任对方会选择抵赖,最终陷入了都坦白的次优选择。

这个案例揭示了个体理性与集体理性之间的冲突。

在现实生活中,类似的情况屡见不鲜。

比如企业之间的价格战,每个企业都希望通过降低价格来吸引更多的客户,获取更大的市场份额。

但如果所有企业都这样做,最终可能导致整个行业的利润下降,大家都受损。

案例二:智猪博弈在一个猪圈里有一头大猪和一头小猪。

猪圈的一头有一个食槽,另一头安装着控制猪食供应的按钮。

按一下按钮会有 10 个单位的猪食进槽,但谁按按钮就需要付出 2 个单位的成本。

如果大猪先到食槽,大猪能吃到 9 个单位,小猪能吃到 1 个单位;如果小猪先到,大猪能吃到 6 个单位,小猪能吃到 4 个单位;如果同时到,大猪能吃到 7 个单位,小猪能吃到 3 个单位。

对于小猪来说,如果大猪去按按钮,小猪等待能吃到 4 个单位,去按按钮只能吃到 1 个单位;如果大猪等待,小猪去按按钮只能吃到-1 个单位,等待能吃到 3 个单位。

博弈论案例加分析

博弈论案例加分析

博弈论案例加分析博弈论是一门多领域的理论,它将个人主义的行为与社会化视结合起来,以改进决策分析过程。

它可以帮助人们更好地理解他们的行为的影响,从而做出更好的决策。

它也可以用于政府决策和公司经营决策,以改善整体社会福利。

本文将开始从博弈论的定义和基本概念开始,然后探讨一个实际案例,再从博弈论的角度分析此案例,探究两个人之间的最优决策。

最后,给出一个总结和展望,以及博弈论在实践中的应用。

首先,什么是博弈论?博弈论是一门研究人类决策的学科,它涉及多个学科,如政治学,经济学,社会学,心理学等,以及非常复杂的数学公式和技术。

它侧重于在某种情况下,多个参与者之间之间采取行动的有效方式。

每个参与者都试图达到最大利益,但最终结果未必能够满足所有参与者的想法。

其次,本文将介绍一个实际案例来说明博弈论的概念。

两个人A、B正在一起玩一场游戏。

他们可以采取两种行动:“合作”或“欺骗”。

如果他们都选择合作,他们将分别获得4分和4分;如果A选择合作而B选择欺骗,则A将失去2分,而B将获得6分;反之亦然。

最后,我们从博弈论的角度来分析这个案例。

从一般的角度来看,A和B的最佳选择应该是“合作”,因两人都能得到4分的收益。

但是,如果一方只顾自己的利益,没有关心对方,他可能会选择“欺骗”,因两人获得的收益就有了不同。

博弈论指出,给出A和B之间的最优解决方案有多种可能性。

一种可能性是奖励性平衡,即A和B最好都合作。

另一种可能性是惩罚性平衡,即A和B最好都欺骗。

综上所述,博弈论把个人主义行为和社会化歧视结合起来,以改善决策分析过程。

案例分析表明,政府决策和公司经营决策也可以从博弈论的角度分析,从而改善整体社会福利。

总之,博弈论可以帮助人们更好地理解自己的行为,从而做出更好的决策。

未来,博弈论还可以用于改善更多的政府决策、公司经营决策以及个人决策。

它也可以用于市场模型的设计和分析,以提高社会福利水平。

另外,博弈论还可以用于道德和责任感的基础研究,以及人际关系的研究。

用博弈论分析大国间的政治博弈

用博弈论分析大国间的政治博弈

大国间的政治博弈二十年前,世界由美苏主导,对于其他国家而言,只有唯唯诺诺的份儿,因为美苏无论在军事还是经济,对别国都有绝对优势。

苏联解体后,超级大国美国也难独霸天下。

事实也已证明,不会再有哪一个国家有能力让全世界都对其言听计从(至少今天没有,明天不会)。

分析二十年前,世界几乎是处在一种零和状态中,尤其是大国对小国。

小国不听话了,大国可以随便经济制裁你,武力威胁你,甚至揍你,小国基本上只能处于被动状态。

虽然,苏联解体后,美国凭其遥遥领先的经济实力,绝对强大的军事实力,仍然可以成为超级大国,但还可以号令天下吗?那只是美国人的一厢情愿罢了!从1991年,美国人的确打了几次漂亮的仗,但打出了美国人一统天下的局面吗?没有。

美国人想再次以武力恫吓世界,已经不大可能。

眼下的世界,需要的是共赢。

没有国家能代表全世界,却又各自想着如何让自己的利益最大化,自然而然的,世界将进入一种非零和博弈状态。

(博弈论简介:The theory of relative balance about the mobile addicts and soul of animals in the nature and in the expectation of decision makers is called the game theory. (quoted from the article “The Blue Files Unknown to Humankind”in Bible of Game Theory。

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的;或者指动物利用大自然移动的瘾魂,在决策人期待的空间里,形成相对均衡的语文学理论。

其应用有著名的纳什均衡、囚徒困境、以牙还牙、人质困境、枪手博弈、猎鹿博弈、智猪博弈、警察与小偷、斗鸡博弈、协和谬误、蜈蚣博弈、脏脸博弈、零和博弈、非零和博弈等。

)下面将着重介绍非零和博弈是如何体现在当前国与国之间的政治博弈中的。

博弈论在战争中的应用

博弈论在战争中的应用

博弈论在兵法中的应用每个中国人对博弈都不会感到陌生,从经典到民谚,从战场到麻将桌,每个中国人都会使用博弈论,只是运用的恰当与否的区别罢了。

全世界都承认中国人是善良的,也是老练的。

博弈论在中国很早就流行了,并不是舶来品。

要知道什么事博弈论,首先要清楚什么事博弈。

《现代汉语词典》中对博弈一词的解释是:(1)古代指下围棋,也指赌博。

(2)比喻为谋取利益而竞争。

博弈无处不在,无时不在,无人不在博弈,无人不会博弈,但博弈有胜负,策略有高低。

因此,我们可以通过学习,通过探讨,作出更佳的抉择,让我们的生活、我们的社会变得更加美好。

既然我们如此离不开博弈,就必须学习博弈,一定要懂得博弈论。

博弈论是一种“游戏理论”。

其准确的定义是:一些个人、团体或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,对各自允许选择的行为或策略进行选择并加以实施,并从其中各自取得相应结果或收益的过程。

在战争中,如果我们在足够多的战场中集中足够多的兵力的话,我们将有很大可能赢得战争的胜利。

如果我们的兵力等可利用的资源有限时,我们要想在战争中取胜,就必须学会“集中优势兵力”这一战术原则,将我们的时间、精力、才能等投入最有希望获胜的战场,确保在这一领域的优势地位。

历史上有个发生过的真实例子,“田忌赛马”。

在这个故事中,齐王的上、中、下三种赛马都要比田忌的同等赛马要好,但却输掉比赛,这是因为孙膑采取了“下驷对上驷、上驷对中驷、中驷对下驷”的巧妙策略,取得了胜利。

这就是在足够多的战场中集中足够多的兵力最终取得胜利。

主动放弃在另一战场上的投入,有时并不会失败,相反,它才是赢得战争的正确思路。

由英国工程师蓝彻斯特提出的“蓝彻斯特定律”,给我们提供了一个优势兵力转化为优势战果的量化指标。

他设想了一个战斗模式,敌对双方彼此相互射击,而且双方在准确性、人员、武器等各方面都势均力敌。

因此,军队数量决定了敌对双方的攻击力:一方面增加自己的命中率,另一方面则分散对方的攻击火力。

博弈论案例分析报告(2篇)

博弈论案例分析报告(2篇)

第1篇一、案例背景博弈论是一种研究具有冲突和合作行为的决策制定过程的数学理论。

它广泛应用于经济学、政治学、军事学、生物学等多个领域。

本报告将以一场经典的博弈论案例——“囚徒困境”为基础,分析其背后的决策逻辑和结果。

二、案例描述“囚徒困境”是一个经典的博弈论模型,描述了两个犯罪嫌疑人被分别关押在两个不同的房间里,他们无法沟通。

警方告诉他们,如果两人都保持沉默,他们将各被判刑1年;如果两人都认罪,则各被判刑2年;如果一人认罪而另一人保持沉默,则认罪者将被释放,而保持沉默者将被判刑3年。

三、博弈论分析1. 收益矩阵| 行动 | A(沉默) | B(认罪) || ---------- | -------- | -------- || A(沉默) | (1, 1) | (3, 0) || B(认罪) | (0, 3) | (2, 2) |在这个收益矩阵中,行代表A的选择,列代表B的选择。

括号中的第一个数字代表A的收益,第二个数字代表B的收益。

2. 纳什均衡纳什均衡是指在博弈中,每个参与者都选择了最优策略,且任何参与者单独改变策略都不会得到更好的结果。

在这个案例中,(认罪,认罪)是唯一的纳什均衡。

3. 个人理性与集体理性从个人理性的角度来看,每个囚徒都倾向于选择认罪,因为这样可以确保自己被判刑2年,而不是3年。

然而,从集体理性的角度来看,如果两个囚徒都选择沉默,他们将各被判刑1年,这是一个更好的结果。

四、案例分析1. 信任与背叛在“囚徒困境”中,信任是关键因素。

如果两个囚徒之间有信任,他们可能会选择沉默,从而实现集体理性。

然而,由于他们无法沟通,信任难以建立,导致双方都选择认罪,实现了个人理性。

2. 合作与竞争在博弈中,合作和竞争是两种基本策略。

在“囚徒困境”中,竞争策略(即选择认罪)在短期内可能带来更好的结果,但在长期内可能导致双方都受损。

合作策略(即选择沉默)虽然短期内可能受损,但长期来看更有利于双方。

博弈论案例分析

博弈论案例分析

博弈论案例分析文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)(1)失火了,你往哪个门跑失火了,你往哪个门跑——这就是博弈论一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。

这时候,屋里突然失火,火势很大,无法扑灭。

此时你想逃生。

你的面前有两个门,左门和右门,你必须在它们之间选择。

但问题是,其他人也要争抢这两个门出逃。

如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。

这里我们不考虑道德因素,你将如何选择这就是博弈论!你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。

你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。

你和这群人构成一个博弈(game)。

上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。

当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。

现在很多学者在研究这个问题。

生活中博弈的案例很多,你会见到很多例子。

只要涉及到人群的互动,就有博弈。

什么叫博弈博弈的英文为game,我们一般将它翻译成“游戏”。

而在西方,game的意义不同于汉语中的游戏。

在英语中,game即是人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。

奥林匹克运动会叫Olympic Games。

在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。

在汉语中,游戏有儿戏的味道。

因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。

本书下面统称game theory 为博弈论。

博弈论的出现只有50多年的历史。

博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。

历史的制度分析:博弈论分析方法

历史的制度分析:博弈论分析方法

历史的制度分析:博弈论分析方法把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。

一种是“进化博弈论方法”(evolutionary game approach)。

经济学中的进化博弈论是在生物学的进化博弈论的基础上产生、发展起来的。

它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。

采用这一方法的研究者认为,社会制度并不是由什么人有意设计出来的,而是在那些适应环境和社会变化的新的制度结构不断被发现、更为理想的制度结构不断被保存的过程中产生的。

这就是所谓的“适应性进化”过程。

进化博弈论的引入,就是为了分析和说明社会制度的这一适应性进化过程。

进化博弈论之所以在制度变迁理论中受到重视,主要是因为它是在不严重依赖决策者计算能力的前提下来说明均衡选择过程,从而在纳什均衡的理性主义解释遇到理论困难时,显示出了通过进化机制实现纳什均衡的可能性。

应用博弈论研究制度变迁的另一种新方法是“重复博弈论方法”(repeated game approach),它运用更精细的均衡概念,如“子博弈精炼均衡”(subgame perfect equilibrium)来分析历史与现实中的制度选择与变迁过程。

其中最具代表性的,就是格瑞夫进行的“历史的比较制度分析”。

所谓的重复博弈,实际上是指同样结构的博弈重复地进行多次。

与一次性博弈不同,它是由若干个阶段博弈(stage game)构成的一个完整的和相对长期的博弈过程。

因此,在重复博弈中,各博弈方的着眼点就不是其在某一阶段上的局部利益或短期利益,而是他们在整个博弈过程中的总体利益和长期利益。

当各博弈方面对不同的策略选择时,他必须考察到其在当前阶段的博弈中所采取的策略,不致在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。

也就是说,他不能像在一次性博弈中那样,毫不顾及其他博弈方的利益。

博弈论的实例分析

博弈论的实例分析

博弈论的实例分析一.“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。

讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。

可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。

A和B均坦白是这个博弈的纳什均衡。

这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。

即是说,不管A坦白或抵赖,B的最佳选择都是坦白。

反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。

结果,两个人都选择了坦白,各判刑8年。

在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

二.电信价格竞争根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。

假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。

A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。

正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠,其中就有B的价格可以比P0低10%。

这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。

在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。

这时候,A该怎么做?不妨假定:A降价而B维持,则A获利15,B损失5,整体获利10;A维持且B也维持,则A获利5,B获利10,整体获利15;A维持而B降价,则A损失10,B获利15,整体获利5;A降价且B也降价,则A损失5,B损失5,整体损失10。

【读书】管窥博弈论——读《世界历史中的博弈生存》

【读书】管窥博弈论——读《世界历史中的博弈生存》

【读书】管窥博弈论——读《世界历史中的博弈生存》最初接触博弈论是从电影《美丽心灵》开始的,影片反映的是博弈论的重要贡献者纳什的事迹,当时对于影片中纳什写在窗户上的各种符号颇感好奇。

后来买了一本王柯则的《新编博弈论评话》,了解到了博弈的一些基本的知识。

感觉最富有头脑的博弈者应该是战国时期佩六国相印的苏秦。

后来虽然尝试过使用博弈论来解说历史上的事件,例如《烛之武退秦师》但终因所学不精而作罢了。

最近看完了《世界历史中的博弈生存》一书,虽然对书中的编选的内容与分析并不完全认同。

但读过之后,对博弈论又有了些许的认识。

博弈论的关键在于理性地选择。

这里面选择是一个最终的行为,而它的前提是理性。

但理性的是意味着平稳也意味着枯燥的,如果一个人过于理性地进行选择,那么他总会选择对自己的有利的一个方面,固然其中可能会有让步,但最终还是要自己获利才行。

也就是说,博弈论的最终还是要看结果如何,归根结底,博弈论可能还是杜威的实用主义思想的体现。

博弈论是脆弱的,说它脆弱是因为它的前提,必须要限定参与者都是理性的人。

这一点的“提纯工作”,其实际上是排除了大多数的人。

试问生活中有多少人才能具备纯粹的理性?人因为有理性才能显出智慧,而显出智慧是靠比较别人的行为而言,如果大家都理性,在生活中,对任何事都会做出合理的选择,那么这是否会导致走向另一个趋利的弊端呢?这个问题恐怕不好回答,但我知道“水至清则无鱼,人至察则无徒”,在博弈论里面不缺乏理智与分析带来的快乐,但永远无法达到“无理成趣”的快乐。

博弈论大多需要有一个条件。

这个条件就是博弈要在双方机会均等的情况下展开。

但在真正的生活真正的平衡并不完全存在。

没有人会在自己处在强势状态下采取均衡的策略,否则也是不理智的!这样看来,博弈论的均衡是一种受限状况下的均衡,而不是自然状态下的均衡,而在自然状态下,人的主宰力(毕竟并不是所有人都是“囚徒”),选择的多样性都影响着博弈的结果,更何况当我们面临选择时,未必有时间进行全面分析,即便进行了分析,可以“预料”的结果并不等于“真实”的结果。

中日之间的博弈与九一八事件

中日之间的博弈与九一八事件

中日之间的博弈与九一八事件博弈与九一八事件博弈论是研究决策的科学,而日本在九一八事变中做出的决策,其实也可以视为一种博弈行为。

本文将通过博弈论的角度去解析九一八事件中两国的决策与博弈,探究其中的因果关系与历史背景。

一、博弈论的基本概念首先,我们来了解一下博弈论的基本概念:1.参与者:指在博弈过程中,能够控制和影响结果的所有人或团体。

2.策略:指参与者在博弈过程中可采取的各种行动方案。

3.收益:指参与者在博弈结束后从中获得的收益或利益。

根据博弈论的概念,我们可以将九一八事变中的中国与日本视为两个不同的参与者,各自拥有不同的策略和收益。

二、九一八事件的历史背景考虑到九一八事件发生的时代背景下,日本正处于快速发展的阶段,而中国则在西方列强的压力下陷入动荡不安之中。

对于日本来说,它需要拓展自己的势力范围,寻求更多资源来支撑自己的经济发展和国家实力的提升。

而对于中国来说,它需要抵御日本的侵略行为,维护国家的主权和领土完整。

三、日本的策略与收益在这样的历史背景下,日本在九一八事变中采取了强硬的策略,通过武力占领了中国的东北地区,并在其上建立了伪满洲国,旨在扩张自己的领土并获得更多的资源和利益。

对于日本来说,这种策略是可以带来收益的,因为在占领东北地区后,它可以自由地开发那里的资源,获得更多的财富和实力。

另外,对于日本政府来说,通过扩张领土和建立统治,可以加强其在国内的统治地位和国际上的影响力,因此这种策略对于日本来说是非常有利的。

四、中国的策略与收益而对于中国来说,固然也拥有自己的策略与收益。

在九一八事变中,中国政府采取了抗日的态度,并通过军事手段与日本进行斗争。

中国的目标是维护国家的主权和领土完整,并保障国家的独立和发展。

但是,由于当时中国处于外部压力和内部矛盾的双重困境下,所以它的策略与收益十分有限。

对于中国来说,抵御日本的侵略是必须的,但是它并没有足够的实力来制止日本的进攻,所以它只能采取一种妥协的姿态来保持和日本的和平关系,并暂时放弃东北的主权。

博弈论以及经典案例分析 精品-博弈论经典案例共42页文档

博弈论以及经典案例分析 精品-博弈论经典案例共42页文档
弈论经 典案例
56、极端的法规,就是极端的不公。 ——西 塞罗 57、法律一旦成为人们的需要,人们 就不再 配享受 自由了 。—— 毕达哥 拉斯 58、法律规定的惩罚不是为了私人的 利益, 而是为 了公共 的利益 ;一部 分靠有 害的强 制,一 部分靠 榜样的 效力。 ——格 老秀斯 59、假如没有法律他们会更快乐的话 ,那么 法律作 为一件 无用之 物自己 就会消 灭。— —洛克
60、人民的幸福是至高无个的法。— —西塞 罗
46、我们若已接受最坏的,就再没有什么损失。——卡耐基 47、书到用时方恨少、事非经过不知难。——陆游 48、书籍把我们引入最美好的社会,使我们认识各个时代的伟大智者。——史美尔斯 49、熟读唐诗三百首,不会作诗也会吟。——孙洙 50、谁和我一样用功,谁就会和我一样成功。——莫扎特

辛亥革命之博弈分析

辛亥革命之博弈分析

背景和史实:
五大臣出洋 考察宪政 中央设立资 政院 光绪与慈禧死。 溥仪即位,载沣 摄政 革命党起义,全 部失败,看不到 希望
1905年
1906年9 月
1907年9 月
1908年9 月
1908年 11月
1909年 11月
清廷颁发 了《宣示 预备立宪 谕》
颁布《钦定宪 法大纲》,9年 开国会计划
省联合请愿
案例三:武昌起义、袁世凯出山和南北议和
基本要素:三方博弈 清政府 袁世凯 革命军
亚洲第一共和国是怎样炼成的?
袁世凯其人
袁世凯生平:
1859年9月16日-1916年6月6日), 字慰亭(又作慰庭),号容庵,汉族,河南项城人, 是中国近代史上最具争议的人物之一。
特点:
家世好,有靠山 爱国,勇敢,有领导力,有军权 善管理,善选择,善权谋,敢花钱 名声好,思维活,敢创新 受挫折,被同情,舆论支持
历史与未来的思考
- 辛亥革命博弈论案例分析
华挺,刘海鹏,陈文龙,陆彬,张鹏
课题选择
• 纪念辛亥革命100周年。 • 历史是最好的教材,在重大的时代转折点,充满了各种选择和对抗, 适合用博弈论分析 • 熟悉辛亥革命的历史和人物,能够在基本按照史实的基础上重述历史 • 林老师来自台湾,辛亥革命是连接两岸的重要纽带。本课题的研究也 献给教书育人的林老师。
背景和史实:
随后溥仪继位,改元“宣统”,其父 载沣为摄政王,代为执政。 载沣因为反对袁世凯的很多新政措施, 更因为戊戌政变一事对袁世凯非常痛恨 , 起杀袁之心,废其官爵及军权。 1909年1月袁世凯举家迁回河南安阳。 载沣
背景和史实:
1911年10月10日武昌起义, 辛亥革命爆发。 北洋新军成为清室唯一可以 抵抗革命的力量,于是再用袁 世凯,先任其为湖广总督,旋 任其为内阁总理大臣。 袁世凯一面以武力压迫南方 革命,另一方面暗中与革命党 人谈判。

历史中的博弈

历史中的博弈

历史中的博弈日常生活中的一切,均可以从博弈得到解释。

古语有云,世事如棋。

生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。

《三国演义》是一部以历史为题材的文学作品,传统的解读者大多从历史和文学的角度切入,然而从博弈论的角度来看,《三国演义》其实是一部经典的关于博弈论实践的著作。

用博弈论的观点分析各国纷争的策略选择,无疑对市场竞争的企业策略的选择有所借鉴。

从赤壁之战中来看,孙刘联军获胜,曹操大败,刘备顺势取了荆州。

去江东前,诸葛亮曾笑对刘备说:“亮借一帆东风,直至江东,凭三寸不烂之舌,说男北两军互相吞并。

若南军胜,共诛曹操以取荆州之地;若北军胜,则我乘势以取江南可也。

”刘备认为“此论甚高”。

其实诸葛亮这里说的不全是实话。

诸葛亮早已看出如果曹操胜,则对刘备一方是最为不利的,覆巢之下焉有完卵。

因此,诸葛亮所设想的两种结果其实只有一种是可能的,即南军胜刘备趁机取荆州。

荆州是赤壁之战最重要的战果之一,这个战果却被出力很少的刘备摘去了。

我们可以从博弈论的角度进行分析。

赤壁之战中,合力抗曹的孙刘之间存在着一种博弈,这个博弈就是博弈论中有名的“智猪博弈”。

曹操虽百万大军压境,然而“曹操之众,远来疲惫;近追豫州,轻骑一日夜行三百里,此所谓强弩之末,势不能穿橹缟者也。

且北方之人,不习水战。

荆州士民附操者,迫于势耳,非本心也。

今将军诚能与豫州协力同心,破曹军必矣。

”在孙刘联盟之中,刘备一方有两个策略可以选择,可以选择出兵或者不出兵只出计;孙权一方也有两个策略,可以选择出兵,或者不出兵。

可是对于刘备一方,如果孙权出兵,自己将会选择不出兵,等破曹之际可趁机取荆州;如果孙权不出兵,自己出兵,必然战败,所以也会选择不出兵。

可见无论孙权是否出兵,刘备的最优策略是不出兵。

而对于孙权一方,知道刘备新败,不会出兵,那么自己的最优策略是出兵以保江东。

博弈论及经典案例简介

博弈论及经典案例简介

博弈论及经典案例简介在我们的日常生活和社会经济活动中,许多情况都可以用博弈论来解释和分析。

博弈论,简单来说,就是研究决策主体在相互作用时如何做出决策以及这种决策如何达到均衡的理论。

它就像是一个智慧的工具,帮助我们理解人与人、组织与组织之间的竞争与合作关系。

博弈论的基本概念包括参与者、策略、收益等。

参与者就是在博弈中做出决策的个体或团体;策略则是参与者可选择的行动方案;而收益就是参与者根据所选择的策略而获得的结果。

让我们通过一些经典的案例来更好地理解博弈论。

“囚徒困境”是博弈论中最为著名的案例之一。

假设警察抓住了两个犯罪嫌疑人 A 和 B,但是缺乏足够的证据来定罪。

于是,警察将他们分别关押审讯,并告诉他们:如果两人都坦白,各判刑 8 年;如果一人坦白一人抵赖,坦白的从宽判刑 1 年,抵赖的从重判刑 10 年;如果两人都抵赖,各判刑 2 年。

对于 A 来说,如果 B 坦白,自己坦白判刑8 年,抵赖判刑 10 年,所以坦白更好;如果 B 抵赖,自己坦白判刑 1 年,抵赖判刑 2 年,还是坦白更好。

因此,无论 B 如何选择,A 的最优策略都是坦白。

同样的道理,B 也会做出坦白的选择。

最终,两人都选择坦白,各判刑 8 年。

但从整体来看,如果两人都抵赖,结果会更好,各判刑2 年。

这个案例反映了个体理性与集体理性之间的冲突。

再来看“智猪博弈”。

猪圈里有一头大猪和一头小猪,猪圈的一侧有一个踏板,另一侧有一个食槽。

踩下踏板,会有 10 份食物进入食槽,但踩踏板的猪会消耗 2 份体力。

如果大猪去踩踏板,小猪等待,大猪吃到 6 份食物,小猪吃到 4 份;如果小猪去踩踏板,大猪等待,大猪吃到 9 份食物,小猪只能吃到 1 份;如果大猪和小猪同时去踩踏板,大猪吃到 7 份食物,小猪吃到 3 份;如果大猪和小猪都等待,都吃不到食物。

在这种情况下,小猪的最优策略是等待,因为无论大猪是否去踩踏板,等待对于小猪来说都是更好的选择。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

从博弈论的视角解读历史事件近年来,博弈论在西方世界发展迅速,应用广泛。

而在中国,博弈论并没有得到长足的发展,现有的博弈论教材也多是翻译国外学者的著作或引用西方学者的理论。

实际上,中国并不是没有博弈论,中国历史上发生的一幕幕历史事件,其精彩程度远远高于西方学者构造的博弈论模型。

中国的博弈论只是没有被作为一门系统化的学科单独提炼出来而已,它隐含在史学家的笔下,埋藏在中国古典文化里,流传至今。

一、历史背景在司马迁的《史记》中,关于汉高祖刘邦和丞相萧何,有这样一段记载:汉十一年,陈?反,高祖自将,至邯郸。

未罢,淮阴侯谋反关中,吕后用萧何计,诛淮阴侯,语在淮阴事中。

上已闻淮阴侯诛,使使拜丞相何为相国,益封五千户,令卒五百人一都尉为相国卫。

诸君皆贺,召平独吊。

……召平谓相国曰:"祸自此始矣。

上暴露於外而君守於中,非被矢石之事而益君封置卫者,以今者淮阴侯新反於中,疑君心矣。

夫置卫卫君,非以宠君也。

愿君让封勿受,悉以家私财佐军,则上心说。

"相国从其计,高帝乃大喜。

汉十二年秋,黥布反,上自将击之,数使使问相国何为。

相国为上在军,乃拊循勉力百姓,悉以所有佐军,如陈?时。

客有说相国曰:"君灭族不久矣。

夫君位为相国,功第一,可复加哉?然君初入关中,得百姓心,十馀年矣,皆附君,常复孳孳得民和。

上所为数问君者,畏君倾动关中。

今君胡不多买田地,贱贳贷以自污?上心乃安。

"於是相国从其计,上乃大说。

上罢布军归,民道遮行上书,言相国贱强买民田宅数千万。

上至,相国谒。

上笑曰:"夫相国乃利民!"民所上书皆以与相国,曰:"君自谢民。

"相国因为民请曰:"长安地狭,上林中多空地,弃,愿令民得入田,毋收稿为禽兽食。

"上大怒曰:"相国多受贾人财物,乃为请吾苑!"乃下相国廷尉,械系之。

数日,王卫尉侍,前问曰:"相国何大罪,陛下系之暴也?"上曰:"吾闻李斯相秦皇帝,有善归主,有恶自与。

今相国多受贾竖金而为民请吾苑,以自媚於民,故系治之。

"……是日,使使持节赦出相国。

相国年老,素恭谨,入,徒跣谢。

高帝曰:"相国休矣!相国为民请苑,吾不许,我不过为桀纣主,而相国为贤相。

吾故系相国,欲令百姓闻吾过也。

"(《史记o萧相国世家》)上述文字记载的是汉高祖刘邦和丞相萧何的一系列的博弈过程,下文将从博弈论的角度加以分析。

二、基于不完全信息静态博弈的分析1.不完全信息静态博弈假设博弈参与人的支付函数是所有参与人的共同知识,这样的博弈被称为"完全信息博弈"(game of complete information),而在刘邦与萧何的博弈中,信息是不完全的,这一博弈是"不完全信息博弈"。

规定一个参与人所拥有的所有私人信息(privateinformation,即所有不是共同知识的信息)是他的类型(type)。

"不完全信息"表示至少有一个参与人有多种类型,也就是说其他参与人可能不知道这个参与人的类型,反过来,这一参与人也不知道其他参与人是否知道自己的类型。

在"不完全信息博弈"的基础上,经济学家海萨尼提出了"贝叶斯纳什均衡",即在静态不完全信息博弈中,所有参与人同时行动,没有机会观察别人的选择。

给定别人的战略选择,每个参与人的最优战略依赖于自己的类型,他不可能准确地知道其他参与人实际上会选择什么战略;但是,他能准确地预测到其他参与人的选择是如何依赖于其各自的类型的。

这样,他决策的目标就变成了,在给定自己的类型、别人的类型以及别人类型依从战略的情况下,最大化自己的期望效用。

2.刘邦与萧何博弈的贝叶斯纳什均衡《史书》记载,萧何是位忠臣,对刘邦忠心耿耿,用古代的道德观念来评价,萧何是一个有道德的人。

但刘邦身居高位,高处不胜寒,不能确定萧何是否忠心耿耿。

从博弈论的角度讲,刘邦不知道萧何的类型。

古人是很看重后人对自己的评价的,例如曹操为了不留下"乱臣贼子"的骂名就没有杀汉献帝。

对于萧何而言,造反是有成本的,这些成本不但包括一旦失败会被诛杀灭族,还包括自己的名誉,所以如果萧何是一个有道德的人,他的造反成本就高,相反,如果萧何不是一个有道德的人,那么他的造反成本就低。

双方的支付矩阵如表1所示。

现对这个博弈做出假定:第一,博弈参与人有两个,分别是皇帝刘邦、丞相萧何;第二,刘邦的决策变量是"杀萧何/不杀萧何",而萧何的决策变量是"造反/不造反";第三,双方都以实现自身效用最大化为最终目的;第四,双方同时行动,但信息并不完全,即萧何了解刘邦的类型,但刘邦不了解萧何的类型。

表 1 刘邦与萧何的君臣博弈如果萧何是一个有道德的人,那么他的造反成本会比较高,即使刘邦选择杀他,他为了留下"忠臣"的美名也不会造反;如果萧何不是一个有道德的人,那么即使刘邦不杀他,他也会选择造反。

另一方面,在刘邦看来,萧何属于"造反成本高"的类型的概率是p,属于"造反成本低的概率是1-p。

那么刘邦究竟该做出什么样的选择呢?由于刘邦并不确切的知道萧何的成本是高是低,所以刘邦的选择依赖于他在多大程度上信任萧何造反是高成本的。

如果刘邦选择不杀萧何,那么刘邦的期望效用是:100p-100(1-p)=200p-100。

如果刘邦选择杀萧何,那么刘邦的期望效用是:50p+50(1-p)=50。

令200p-100=50,得到p=3/4。

这一结果说明,刘邦的最优选择是:如果p≥3/4,不杀萧何;如果p 上文引述的史料中提到,刘邦曾两次试探萧何,第一次是召平提出的"祸自此始矣。

上暴露於外而君守於中,非被矢石之事而益君封置卫者,以今者淮阴侯新反於中,疑君心矣",其大意为"您的祸患从此开始了。

皇上在外作战风餐露宿,而您留守京城,并不需要冒着矢石去冲锋陷阵,但皇上却要给您加封食邑、设置卫队,这是因为淮阴侯刚刚在关中谋反,皇上对您也起了疑心。

"第二次是萧何的门客提到的:"君灭族不久矣。

夫君位为相国,功第一,可复加哉?然君初入关中,得百姓心,十馀年矣,皆附君,常复孳孳得民和。

上所为数问君者,畏君倾动关中。

今君胡不多买田地,贱贳贷以自污?上心乃安";其大意是:"您要不了多久就会遭受灭族的惨祸了。

您位为相国,功居第一,难道功名还能再增加吗?但您从刚进关中的时候起,就深得民心,到现在已有十多年了,百姓们都拥戴您,您总是勤勉办事,深得民心。

皇上之所以屡次派人来问您的情况,是怕您利用自己的威望动摇关中。

现在您不如多买些田地,并低价赊购、借贷,以此来玷污自己,这样皇上对您就放心了。

"刘邦之所以一再地试探萧何,就是为了确定萧何作为博弈参与者的类型--萧何到底是属于造反成本高的类型还是造反成本低的类型。

三、基于不完全信息动态博弈的分析1.不完全信息动态博弈在动态博弈中,行动次序有先有后,后行动者可以通过观察先行动者的行动获得有关后者偏好、战略空间等方面的信息,修正自己的判断。

先行动者知道自己的行为有传递信息的作用,就会有意识地选择某种行动来揭示或掩盖自己的真实面目。

不完全信息动态博弈的均衡概念是"精炼贝叶斯均衡"(perfectBayesian equilibrium)。

精炼贝叶斯均衡的关键在于后行动者要根据所观察到的他人的行为来修正自己对他人类型的"信念"(主观概率),并据此选择自己的行动。

修正过程使用的是"贝叶斯规则",即每个参与人都假定其他参与人选择的是均衡战略。

具体而言,精炼贝叶斯均衡是所有参与人战略和信念的一种结合,他满足如下条件:(1)给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得的。

2.刘邦与萧何博弈的精炼贝叶斯均衡一种行动要起到传递特定信息的功能,行动者必须为此付出足够的成本,否则行动者的行动就不可信。

对于萧何,简单的向刘邦诉说"我是忠臣","我不会谋反","我是个品德高尚的人"是起不到传递信息作用的,因为这种行动不花费任何成本。

所以萧何每次向刘邦表明自己的忠诚时都花费了很大的成本:刘邦第一次试探萧何,萧何"悉以家私财佐军",就是把自己家里全部的私有财产拿出来资助军队,表明自己没有私心,结果"高帝乃大喜";刘邦第二次试探萧何,萧何"多买田地,贱贳贷以自污",通过低价赊购、借贷来玷污自己的名声,以表明自己贪图小利,没有争夺天下的野心,结果"上乃大说",刘邦很开心。

以上这两种行为虽然在一定程度上减少了刘邦对萧何的猜忌,但要让刘邦彻底对萧何放心,还是不够的。

要想达到最佳的信息传递效果,萧何就必须付出更大的代价--"乃下相国廷尉,械系之",意思是"于是就下令把相国交给廷尉拘禁起来,还给他上了刑具"。

萧何通过这样三次传递信息终于使刘邦对他彻底地放心,使自己避免了杀身灭族之祸。

刘邦要试探萧何,也并不是不耗费成本的。

第一次试探,刘邦"使使拜丞相何为相国,益封五千户,令卒五百人一都尉为相国卫",派遣使者拜丞相萧何为相国,加封食邑五千户,命令安排五百名士兵由一名都尉率领充任相国的卫队;第二次试探,刘邦"数使使问相国何为",多次派遣使者探问相国在做什么;第三次把萧何打入监狱,要背负"暴君"的恶名。

这些都是搜索信息所必须付出的成本。

按照贝叶斯规则,刘邦与萧何博弈并得出均衡解的过程如下:在博弈的第一回合,萧何知道自己的类型,但刘邦并不知道。

假设在刘邦看来,萧何属于第一种类型(即造反成本高的类型)的概率和属于第二种类型的概率都是1/2,。

此时刘邦向萧何发出了第一次试探,萧何作为理性的参与者,向刘邦传递信号--舍弃自己的家财,证明自己的衷心。

刘邦收到信号后,依据自己的判断,将自己对萧何的信念修正,假设修正为3/5,这一概率大于刘邦试探之前对萧何的信任程度,双方进入第二回合的博弈。

刘邦再次做出试探,萧何通过"自污"的方式向刘邦传递信号,刘邦收到信号后再次修正自己的信念,假设修正为7/10,双方进入第三轮博弈。

在第三轮博弈中,刘邦虽然将萧何打入监狱,但实际上是刘邦主动发出信号,考验萧何的忠诚度,萧何出狱后,谦恭谨慎,进宫拜见刘邦时,光着脚步行表示谢罪,表现出绝对的服从,这时,刘邦终于将自己对萧何的信念修正为3/4或更高的水平,相信萧何属于造反成本高的类型,选择不杀萧何,最终得到的均衡解是(不杀,不造反)。

相关文档
最新文档